第二则是因为他知道文字转WAV音频