而他就是要找出它们的相同处文字转WAV音频