两个人刚开始都是用走的文字转WAV音频