最终也会有个具体座次文字转WAV音频