所以只听了一句就已经认出来了文字转WAV音频