确保每个位置段都必须有人掌控文字转WAV音频