还会根据凝聚者的不同文字转WAV音频