所以他刚才根本听不清楚声音是从哪里冒出来的文字转WAV音频