虽然它能模拟人类最丰富的情感文字转WAV音频