大模型抢落地:老牌大厂新锐势力对阵,小模型灵活突围

科技 2024-07-08 12:14 阅读:3

“今年AI真的非常火,这个WAIC是我参加以来最火的一次。”刚刚过去的WAIC,百川智能技术联合创始人谢剑在一场论坛中感叹。

7月4日至7月6日,上海持续了连续三天的38度高温,但比天气更热的是AI。2024世界人工智能大会暨人工智能全球治理高级别会议在这期间举行,有来自500余家公司参与和超过1500项人工智能产品参展,世博展览馆里大模型数量也从去年的30余个来到近百个,从大厂、中厂到新锐势力,真实的“百模大战”就在这里上演。

大模型抢落地:老牌大厂新锐势力对阵,小模型灵活突围 第1张

来的有投资人,在展览馆入口,记者偶遇了VC投资人梁思聪,他表示自己熟悉的人都来了,堪称投资圈聚会,大家都想“All in 时代最大的β”。

云启资本合伙人陈昱对第一财经记者表示,“每年都有很多投资人过来,这是一个很好的机会,能看到无论AI创业公司还是大厂成果的集中展现。”中金资本董事总经理张清也认为,特别多标的、行业的风向和趋势在这里,从完成一站式采风的目标来说,WAIC无疑是一个好的选择。

这一届有了更多带着需求来的专业观众。蜜度首席技术官刘益东在展台讲解了一天,快闭馆时记者来到展位采访时,他已经是嗓子沙哑的状态。刘益东表示,去年展台还是面向大众的互动区人较多,但今年明显专业解决方案区更多人。

“各种各样的客户,聊一些具体需求,聊解决方案、落地步骤、收费,后期怎么迭代维护,这意味着来咨询的人对要做的场景应用已经过深刻思考。”刘益东提到,蜜度是做政务大模型的,今年已经合作了40多个项目。此次大会像蜜度这样的垂类模型厂商来了不少,很多都已经在场景里跑得很快。

据官方信息,截至7月6日下午2点,此次WAIC 大会线下参观人数突破30万人次,全网流量突破10亿,比上届增长了90%,创历史新高。

人多,模型更多

展览馆开馆那个下午,不少人是“挤”进去的。高温没能阻挡观众的热情,排队的人群在展览馆门口转了好几个弯。

大模型抢落地:老牌大厂新锐势力对阵,小模型灵活突围 第2张

这一届WAIC,人多了,模型也更多了。去年的WAIC还只有30余款大模型,今年直接翻了一倍多来到近百款。去年大模型的主力是阿里、华为、百度、商汤等老牌大厂,今年有了更多新锐势力,大模型领域的 “六小龙”来了四家,包括智谱AI、阶跃星辰、百川智能、Minimax。

百川智能展台负责人表示,去年这个时候,百川的大模型还未成熟,也没有参加WAIC,在今年,无论是模型能力还是应用落地,百川都已经有足够对外展示的内容。

更多大模型初创企业在这一年里冒出、生长,这次也带着产品来首秀了。做多模态大模型的智子引擎今年第一次参展,已经有了不小的展台,智子引擎CEO高一钊对记者表示,自己去年参加了,但当时没设展台,而今年已经能有一些案例,希望能借此机会对外讲讲进展。

论展台面积,老牌大厂华为、阿里、商汤是整个展览馆占地最大的三家,展示了较多的生态场景,华为展示了其昇腾AI全流程使能平台、盘古大模型以及相关的应用,阿里展示了基于通义千问与各厂商合作的相关生态应用,还通过钉钉、支付宝展示了大模型在办公、金融场景的应用。

商汤在此次大会动作不少,发布的新品包括日日新基座大模型5.5版本,以及对标GPT-4o发布了日日新5o,在会前商汤发布了首个面向C端用户的可控人物视频生成大模型Vimi,入选了本次展览的“镇馆之宝”。商汤的展台占了两个不小的位置,兼顾了B端与C端,一部分是面向未来无人驾驶和智慧城市场景的绝影智能展示舱,另一部分是大模型在视觉生成和办公方面的应用。

大模型抢落地:老牌大厂新锐势力对阵,小模型灵活突围 第3张

在大厂队列里,腾讯和百度的展台相对较为低调,并没有发布太多的新产品,也没有观众互动场景,展台有基于混元大模型以及文心大模型的应用,包括会议、文档、对话、广告、绘画等产品,如腾讯基于混元大模型的AI广告创意平台妙思。

为了秀工业大模型的落地,网易直接搬来了挖掘机器人和装载机器人。展台工作人员介绍,网易的工业机器人已在矿山、港口、搅拌站等多种场景落地。此外,网易旗下还有教育大模型“子曰”以及多模态大模型“易生诸相”在游戏、教育、音乐、文旅领域落地,包括AI生图助手“丹青约”,以及AI大模型学习硬件有道词典笔X7。

大模型抢落地:老牌大厂新锐势力对阵,小模型灵活突围 第4张

作为全场最粉的展台,B站带来了贴近二次元的大模型落地玩法,包括AI动态漫技术,通过图文引导和动态控制,让漫画“动” 起来,此外B站自研的大语言模型系列也在此次WAIC上首次展出。

老牌中大厂之外,新锐势力里,阶跃星辰与上影的联动比较有趣,双方推出了一款《大闹天宫》AI互动体验——“测测你是哪路神仙”,调用了大模型的图像理解、风格迁移、图像生成、剧情创作等多种能力。此外,阶跃星辰带来其面向C端用户的智能助手 “跃问”和AI开放世界平台“冒泡鸭”。

大模型抢落地:老牌大厂新锐势力对阵,小模型灵活突围 第5张

大模型新星智谱在展览区设置了“智谱小镇”, 集合赋能公共事务、消费、文旅、医疗、保险、教育、汽车、金融、工业等多个行业场景的典型案例。在展台接受采访时智谱AI CEO张鹏提到,目前智谱主要的收入来源在ToB端,智谱开放平台现在有超过40万的企业用户,还有一部分小的开发者团队,每天的服务量接近600亿tokens。

百川智能此次携Baichuan系列通用大模型、AI助手百小应以及内测版医疗应用AI健康顾问以及百川智能ToB解决方案在展台亮相,从落地上看,百川选择的大模型落地方向主要是医疗。

作为大模型垂直应用厂商,容联云在金融营销场景落地,与很多不同的大厂有过接触合作,在容联云产业数字云VP兼诸葛智能创始人孔淼的视角里,各家大厂的大模型实际上都有一些不同的能力特点,如阿里相对别的厂商做得更好的是开源的环节,而华为的特点是对产业解决方案的业务理解能力很强。

实际上这些特定场景的能力并不像想象的那么简单,“不是简单的像现在主流的大模型公司,做一个对话机器人就能解决一切问题,其实里面是一堆生产关系的管理,谁来管知识库,中间的合规、维护怎么做等等,这都是应用厂商要去考虑的,所以华为是强在对于整个业务的理解上。”孔淼认为,在生产制造、能源等领域,这都是华为非常强的部分,他们很清楚能提供的解决方案是什么。

至于腾讯的“舒适区”则是文娱类,腾讯大模型的文档能力很强,而字节的多模态能力、语音能力很强,零一万物的全球化的能力很强,“所以每一个大模型厂商其实最终都会有自己的一些能力特点,最后这个能力特点会适用在不同的行业里面。”孔淼说。

小模型突围

2024年被认为是生成式AI落地元年,一年过半,厂商们落地的情况怎么样了?展台走访下来,一个感受是,相比大厂,初创公司、尤其是垂直领域做小模型的公司反而目前已经有更多的故事可讲。

在谈及今年的落地时,刘益东的感受是“超出预期”,“原先我们以为今年可能落地十几个项目就差不多了,现在才半年我在跟进的项目就有40多个了,到年底有可能到100个,所以远远超出我的预期。”他介绍,蜜度做的是政务大模型,涉及市民服务热线、结案报告、司法文书的校对等,一共20余个场景,现在对接40多个项目中,有些已经完成了落地,有些正在推进。

“这从一个侧面反映出,各行各业对于大模型的接受度,对于大模型改造原有生产工作流程的期待已经起来了,在人工智能+的背景下,大家有一定的驱动力去做这件事,对于大模型企业来说是一个机会。”刘益东认为,目前的挑战在于需求很多,是所有的需求都去做,还是聚焦在某些领域,是需要做决策的,他目前的观点是,更聚焦一点才能快速形成规模化。

容联云做的是金融领域的大模型落地应用,主要聚焦智能营销服务,孔淼介绍,目前容联云在头部的股份制银行和保险公司里已经渗透服务了,之所以更快跑通这一领域,也是源于此前容联云积累了大量的金融客户以及数据,也能更快反应做出解决方案。

智子引擎自研的Awaker多模态大模型,目前已落地在部分城市的城市治理、电力、交通等场景中,相比上一代方案,大模型的通用能力更能适应真实复杂的环境。

大模型抢落地:老牌大厂新锐势力对阵,小模型灵活突围 第6张

在落地上,这些企业都避开了大厂的聚焦范围,找到了更灵活的应用场景。

谈及与大厂的竞争,孔淼认为,在大模型时代,做应用的厂商和大厂不存在必然的竞争,“他们很清楚自己的边界在哪,我们也很清楚自己的边界,我们各有各的路。”

孔淼提到,过去的互联网时代大家可能会有冲突,大厂可以用互联网能力覆盖一切,但在大模型领域更多是一种生产力思维,“企业的业务流程怎么用先进的生产力转化成新的应用,去降本提效,在这背后,单纯模型解决不了落地的复杂工程问题和业务运营管理问题。”他表示,大的模型厂商无法将业务细节了解很清楚,因为千行百业的每一个细化都很深,而这个就是灵活的应用厂商能去做的。

刘益东认为,虽然大的行业就是那些,但不同的行业里面有很多点,“有一些体量较小的点大厂不一定有精力去做,有一些点刚好是我们擅长的,那我们尽量就打出自己的优势,”他补充道,“从项目成本来说,垂直应用厂商可能更多在小几十万的一个体量,大厂可能在百万级,这就是差异化。”

另一个与大厂的差异是,“蜜度有地推以及各地的销售解决方案团队,能够保持一定频率地与客户就需求场景进行交流沟通,大厂不一定有那么多零散的队伍去做。”刘益东提到,蜜度在全国各省都有团队,且规模不小,少的十几人,多的一百多人,这是蜜度这类厂商的渠道优势。

高一钊的观点是,中国目前所有的大模型厂商都更像是友军,而非一个激烈的竞争关系。“确实有很多在大模型方向或者多模态方向的布局,但是一旦深入到某个领域去,我们发现所有人还是一个较迷茫的状态,大家都不知道大模型的能力边界到底在哪,不知道它到底能产生什么价值,都在探索。”

“目前中国所有的大模型创业者,更多地都是一起在努力,谁能跑出一个非常好的应用场景来,大家都一定会鼓掌的,目前还不是那种你死我活的状态。”高一钊说。

在制造领域,也已经有一些厂商开始就具体场景落地大模型应用,TCL格创东智市场总监杨丽在一场论坛上表示,在半导体等高端制造业,聚焦设计、生产、改善、检测等环节,借助AI、大数据等进行数据分析,能实现更高的良率和更少的投入。

杨丽介绍,TCL格创东智的大模型助手解决方案赋能了某个半导体显示客户,在产品生产过程提供路径回追、根因分析、虚拟量测等AI服务,单个案例可以节省分析人员工时6h/次,每年能将人力成本降低40万元,避免loss损失80万,以及能减少产品批量异常损失800万元。

在落地上,孔淼认为,ToB、ToC都会有机会,但当前ToB会比ToC更容易看到商业化产出,且场景更丰富。但在落地上,目前行业也仍然有不少挑战,包括行业和场景的选择,有的可能是叫好不叫座,以及算力成本、如何控制模型的幻觉、具体落地时衡量用大模型还是小模型、背后Prompt工程该怎么做等等,这些都是具体落地时会遇到的一些挑战。

“有些时候大家会觉得应用怎么发展这么慢,其实都只是一个侧面,整体来看大家还是很相信AI会是未来一个大的技术方向,也愿意投入进来。”谈到刚刚过去的WAIC,高一钊表示,给他最大的感受是,“大家还是很热情的”。