他们应该就是创建中心区域的人文字转WAV音频