也完全符合他们的猜测文字转WAV音频