还是按照先前的方略文字转WAV音频