Meta发布最强大模型Llama 3,GPT4级别震撼登场!

科技 2024-04-19 09:31 阅读:19

Meta公司与谷歌建立了合作伙伴关系,将实时搜索结果整合到 AI 助手的答复中,进一步提升了用户体验。与前代 Llama2相比,Llama3在多个行业基准测试中展现了突破性的性能,特别是在推理、代码生成和指令跟踪等方面取得了显著进步。为了训练这一模型,Meta 构建了两个包含2.4万个GPU的集群,其中1.6万个GPU同时用于Llama3的训练。

Llama3的开发预示着 Meta 在 AI 领域的雄心壮志。目前,公司正在开发的最大型模型拥有超过400B(400亿)的参数规模。Meta Llama3的主要性能特点包括提供8B和70B两种规模的预训练和指令调优生成文本模型,专为对话和其他语言处理任务优化。采用自回归方法和基于优化的变换器架构,引入了分组查询注意力机制,提升了大规模参数下的推理可扩展性。使用超过15万亿的tokens进行预训练,训练集是Llama2的七倍,支持高达30种语言。在多个自动化基准测试中表现出色,包括对话、问答、推理等多种任务,并特别针对现实世界场景进行了优化。

Meta 还发布了基于 Llama3的 AI 助手,目前已在美国之外的十多个国家推出。用户可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI 助手,它能够推荐餐厅、规划周末活动、协助学习等。此外,Meta AI 还整合了搜索功能,可以直接访问网络上的实时信息,无需切换应用。想要体验最强大的Llama 3模型,可以访问官方网站https://www.meta.ai/进行体验和模型下载https://llama.meta.com/llama3/。