当第四个阶段通过的时候文字转WAV音频