因为他已经听懂了文字转WAV音频