因为涉及到的信息太多文字转WAV音频