那么唯一的可能性就是文字转WAV音频