也许他就是根据这样子来判断出来的吧文字转WAV音频