Meta AI发布开源基准数据集OpenEQA 促进AI代理的“体验智能”

科技 2024-04-12 16:59 阅读:27

Meta AI的研究人员今天发布了一个重要的消息:他们推出了一个名为OpenEQA的开源基准数据集,旨在评估人工智能系统对“体验式问答”的能力。这种能力使人工智能系统能够理解现实世界,并以自然语言回答有关环境的问题。

OpenEQA被定位为“体验智能”领域的关键基准,其中包含超过1,600个关于180多个真实环境的问题。这些问题涵盖了七个问题类别,全面测试人工智能在各种技能方面的能力,包括对象和属性识别、空间和功能推理以及常识知识等。

在今天发布的论文中,研究人员解释了“体验式问答”任务的定义:“简单来说,EQA是指在足够了解环境的情况下,以自然语言回答关于环境的问题。”这一任务涉及计算机视觉、自然语言处理、知识表示和机器人技术等热门领域,旨在开发能够感知和与世界互动的人工智能代理。

研究人员看到了“体验智能”在增强现实眼镜和移动机器人等应用方面的潜力。通过将人工智能助手嵌入到眼镜中,用户可以利用视频和传感器数据获取信息,例如找回丢失的钥匙。而移动机器人则可以自主探索环境,回答用户的问题,例如是否还有咖啡。

为了创建OpenEQA数据集,研究人员收集了真实环境的视频和3D扫描数据,并向人类展示这些数据,要求他们提出可能会问一个人工智能助手的问题。最终产生的1,636个问题全面测试了各种感知和推理能力,通过大型语言模型自动评分,衡量人工智能生成的答案与人类答案的相似程度。

通过发布OpenEQA数据集,Meta AI为推动AI代理的“体验智能”发展迈出了重要一步,为人工智能系统更好地理解和回答关于现实世界的问题铺平了道路。愿未来的人工智能代理能够更好地与我们互动,帮助我们更好地生活。