既然所有该收集的信息都听到了文字转WAV音频