似乎就是他们两个谈论的声音文字转WAV音频