因为在绝大多数中国人文字转WAV音频