所以她直接忽略过程文字转WAV音频