最后从这些比较中得出了一个并不太出乎大家意料的结果――两个人打平文字转WAV音频