每一个区域里又细分为若干小区域文字转WAV音频