因此才能分辨得出来文字转WAV音频