他只需要记住刚才那一刻文字转WAV音频