也就是说自愿的交文字转WAV音频