两者根本无法剥离文字转WAV音频