也就是说他们要回到f1文字转WAV音频