而他想要用自己的双眼来判断文字转WAV音频