所以他们并不想去受累文字转WAV音频