似乎是要让他为自己的表现作出解释文字转WAV音频