也许是他不好意思说出文字转WAV音频