将众人的表情收入眼中文字转WAV音频