并没有什么硬性的要求文字转WAV音频