我们最多也就是损失两个微不足道的小角色文字转WAV音频