大部分是集中在这个区域文字转WAV音频