小模型崛起,巨头竞逐AI新风口

科技 2024-05-07 18:01 阅读:14

近日,微软推出了SLMPhi-3系列,在多项基准测试中比肩大模型能力,强调高性价比,号称能力对标GPT3.5。苹果也紧随其后公布了“小模型”家族OpenELM,体量极小,离“让人工智能在苹果设备上本地运行”的目标更近一步。巨头们的新动作体现了AI竞赛的另一个分支,以小模型降耗增能,在性能、安全性等维度追平大模型。

未来,大小模型混搭成为用户实现AI诉求的可取路径。百度创始人李彦宏表示,未来大型的AI原生应用将主要采用大小模型混合使用的方式。IBM中国数据与人工智能首席架构师徐孝天指出,小模型在专有领域是非常好的选择。

现行大模型Transformer框架被认为走到了瓶颈期,小模型提供了实用化捷径。2024年将是大模型走向落地应用的关键之年,小模型的优势在于适合具体应用场景。巨头们开始青睐低参数的小模型,错位竞争成为主旋律。

小模型对移动端AI发展具有重要意义,能适应个性化、精准化的使用需求。商汤科技推出“日日新·端侧大模型”,展示在手机端的应用场景。大小模型共存共荣,未来将持续发展。