基本上按照猴子当时的体验文字转WAV音频