应该是相互排斥的文字转WAV音频