修士这边提出了几点要求文字转WAV音频