准确的说应该是一个口器文字转WAV音频