因为他们能够感觉得出来文字转WAV音频