本来就是靠提示才能确认到位置的文字转WAV音频