国产大模型崭露头角!伯克利最新基准发布,智谱AI击败GPT-4和Llama 3
最近,Meta开源了Llama3系列模型,引发了开源社区的热议。同时,有人唱衰国产大模型,认为Llama3的开源将给国产大模型带来新的突破。但是,真的是这样吗?根据智东西的报道...
最近,Meta开源了Llama3系列模型,引发了开源社区的热议。同时,有人唱衰国产大模型,认为Llama3的开源将给国产大模型带来新的突破。但是,真的是这样吗?根据智东西的报道...
过去几年来,视频理解技术一直是计算机视觉研究的热点之一。从循环神经网络到Transformer模型,每一次技术的进步都为我们对视频数据的理解和应用带来了新的可能性。然而,随着视频数...
前几天,世超在冲浪的时候,偶然发现了一些令人惊叹的AI视频片段。这些片段中,大船驶来的压迫感、被风吹起的发丝和丝巾,以及太空人直接走进现实菜园的场景,让他目瞪口呆。这些画面的真实度...
数学应用题求解一直是小型语言模型(SLM)面临的挑战之一。以往的研究表明,要在GSM8K基准测试中实现80%以上的准确度,需要一个庞大的模型,拥有340亿个参数。为了在较小的模型...
近日,MicrosoftResearch的研究人员提出了一种名为LongRoPE的新方法,成功将LLM的上下文窗口扩展至200万个token,仅需简单微调即可实现与短上下文窗口相...
大模型在许多任务上表现出色,但更新知识成本高。为了解决这一问题,科学家们提出了RA-ISF方法,通过迭代自反馈检索增强,让大模型能够更好地学习和理解新知识。这一方法包括自我知识、文...
在视频生成领域,OpenAISora模型被誉为视频生成的GPT时刻,具有代际碾压的能力。Sora的核心负责人由三位才华横溢的年轻研究者组成,他们分别是TimBrooks、Wil...
最新发布的大模型排行榜引起了广泛关注,Llama3意外跻身第五的位置,与GPT-4并列英文单项第一,成为了众人瞩目的焦点。这份排行榜的独特之处在于采用了模型一对一battle的方...
在过去几年中,扩散模型在图像合成领域展现出强大的能力,但挑战更大的视频生成任务却成为了研究社区的新焦点。视频合成不仅需要保持时间一致性,还需要处理更高维度的数据,这使得收集高质量视...
拖动式图像编辑是一种新型的、用户交互式的图像编辑方法,通过设置起始点与目标点,用户可以将图像的内容拖动至指定位置,得到合理的图像结果。然而,现有的拖动编辑方法存在一些问题,如受限于...