是无法分出高下的文字转WAV音频