我们只不过提出了减少一些要求文字转WAV音频