比较有语言天赋的他说能进行一些基本对话文字转WAV音频