不过他说这个情况相对几十年前已经是很好了文字转WAV音频