因为按照他的观察来看文字转WAV音频