看得出来她对于这种非常落后的模型挺感兴趣文字转WAV音频