他们就一直在跟踪文字转WAV音频