大眼睛捕捉到出现频率最高的两个发音文字转WAV音频