可以自如判断时间文字转WAV音频