因此我猜测他是属于第二种文字转WAV音频