是一个技术难度很高的手术文字转WAV音频