它与第一种的区别在于后者能醒觉而无认知文字转WAV音频