但是说话肯定都是真话文字转WAV音频