那里我们分成了四个区域文字转WAV音频