形成对应的区域文字转WAV音频