也就是你所说的核心文字转WAV音频