也就只能是跟在后面看着文字转WAV音频