而是对着镜头像众人介绍着文字转WAV音频