应声分离成了两半文字转WAV音频