并搜集文字转WAV音频