则是产自一些特殊的区域文字转WAV音频