他同样未作考虑文字转WAV音频