当然我倾向于认为他肯定专门学习过文字转WAV音频