最大限度保持了声音本质文字转WAV音频