他却还要通过自己的口中文字转WAV音频