那他就相当于是在给自己一个解释文字转WAV音频