而且他还要观察一下文字转WAV音频