他用的是中文文字转WAV音频