Meta AI发布开源基准数据集OpenEQA 促进AI代理的“体验智能”

Meta AI的研究人员今天发布了一个重要的消息：他们推出了一个名为OpenEQA的开源基准数据集，旨在评估人工智能系统对“体验式问答”的能力。这种能力使人工智能系统能够理解现实世界，并以自然语言回答有关环境的问题。

OpenEQA被定位为“体验智能”领域的关键基准，其中包含超过1,600个关于180多个真实环境的问题。这些问题涵盖了七个问题类别，全面测试人工智能在各种技能方面的能力，包括对象和属性识别、空间和功能推理以及常识知识等。

在今天发布的论文中，研究人员解释了“体验式问答”任务的定义：“简单来说，EQA是指在足够了解环境的情况下，以自然语言回答关于环境的问题。”这一任务涉及计算机视觉、自然语言处理、知识表示和机器人技术等热门领域，旨在开发能够感知和与世界互动的人工智能代理。

研究人员看到了“体验智能”在增强现实眼镜和移动机器人等应用方面的潜力。通过将人工智能助手嵌入到眼镜中，用户可以利用视频和传感器数据获取信息，例如找回丢失的钥匙。而移动机器人则可以自主探索环境，回答用户的问题，例如是否还有咖啡。

为了创建OpenEQA数据集，研究人员收集了真实环境的视频和3D扫描数据，并向人类展示这些数据，要求他们提出可能会问一个人工智能助手的问题。最终产生的1,636个问题全面测试了各种感知和推理能力，通过大型语言模型自动评分，衡量人工智能生成的答案与人类答案的相似程度。

通过发布OpenEQA数据集，Meta AI为推动AI代理的“体验智能”发展迈出了重要一步，为人工智能系统更好地理解和回答关于现实世界的问题铺平了道路。愿未来的人工智能代理能够更好地与我们互动，帮助我们更好地生活。