我们要顺着那些区域文字转WAV音频