两者除了密度不同之外文字转WAV音频