而第三人则没有说话文字转WAV音频