所以言语也没有太收敛文字转WAV音频