第三场为再覆文字转WAV音频