智见|专访周鸿祎:头部公司才做大模型 大部分人得专心场景,到底是怎么回事?

科技 2023-03-20 18:14 阅读:19

出品|网易科技《智见访谈》

作者|赵芙瑶

修改|丁广胜

大脑是如何工作的?咱们能否规划一个机器来模拟大脑?

这是1956年,信息论创始人克劳德·香农与发明Lisp言语的约翰·麦卡锡在《自动机研讨》开篇提出的问题。现在,Chat GPT使人工智能技能在拟真度和功用维度方面到达新高度,人工智能好像与真实的大脑之间的间隔开端无限挨近。

生成式人工智能带来的全面智能化是一场深入的革新,企业的管理运转逻辑也或将随之产生深入革新。

在此布景下,互联网巨子们加码AIGC,纷纷表明想要打造“中国版ChatGPT”。放眼望去,清华系智谱AI宣告开源ChatGLM-6B大模型,百度也总算发布“文心一言”大模型。根据这个论题,360公司创始人、董事长兼CEO周鸿祎高度关注,在两会期间,他将“国内AI大模型的技能立异和立异形式”写进提案。

在周鸿祎看来,人工智能会带来一场工业革新,可以重塑乃至推翻许多企业的现有形式。“GPT现已给大家相当于指明晰方向,大力出奇迹。”周鸿祎在承受网易科技专访时指出ChatGPT具有无限或许,并对于ChatGPT的未来开展打开斗胆幻想。

谈赋能传统职业:ChatGPT可重塑企业生态链

本年政府工作报告提出,要加速传统工业和中小企业数字化转型,着力提高高端化、智能化、绿色化水平。

以“专精特新”为代表的中小企业是数字经济开展的主力军,可是在数字化转型的浪潮中,许多中小企业面对着本钱受限、转型才干缺少等应战。

作为一名从前的创业者,周鸿祎十分能了解中小企业以及小微企业的艰苦,他以为在中小微企业转型数字化过程中真实做到一个也不能少,才干完成数字化战略的共同富裕。“数字化浪潮来的时候,我曾说一切的职业值得重做一遍。实践上重做的难度仍是很高的,要收集大数据,树立自己的大数据中台,做大数据分析模型,用数据来进行决议计划,将一切传感器都物联网化,这样本钱很高。”周鸿祎道出了传统企业的转型难题。

一起周鸿祎指出,ChatGPT无疑为企业供给了一条新的思路。“现在许多企业如果用ChatGPT进行生态链重塑就比较容易,只需购买SaaS服务,并把SaaS服务跟现在已有的业务流程进行结合。写稿时如果觉得黔驴技穷,可以和ChatGPT聊谈天,或许会脑洞大开。”

周鸿祎深信,人工智能重塑各个职业、各个企业。现在周鸿祎要求其公司每个团队都得做APP的布置,无论是To B、To C都应该包含。假定具有了强壮的大脑后台,将云服务引到APP中,软件必定会面目一新,而ChatGPT无疑是工业革新的加速器。

谈打造中国版ChatGPT:产学研需“相得益彰”

ChatGPT背面最为中心的技能,是深度学习的多层变换器Transformer、即GPT中的“T”。其模型也并非彻底原创,可是终究产生了1+1>2的效果。现在,对于前沿科技范畴,国内许多研讨机构还处于跟随仿照阶段。

周鸿祎指出国内企业终究仍是要靠自主立异,在学术上有所突破。“前沿的人工智能模型和算法,许多都不是咱们原创的,这需要科研机构的尽力。一起,单单靠研讨机构也不可,有必要仿效OpenAI与微软的形式,让研讨机构与工业化公司深度协作。”

周鸿祎以为,人工智能大模型的成功一部分是技能,一部分是产品体会,还有一部分是工程化,其间存在许多环节,包含内容的调度、数据的选择、工程师的标示、人工的练习。而研讨者往往容易忽视工程化,这是过错的做法。

在他看来,而这需要进行结合与互补。“搞工程化的公司有时往往又觉得搞研讨的人想得太理想主义,所以我以为这次人工智能大模型的成功应该说是微柔和OpenAI之间相得益彰的协作起到了决定性效果。微软供给算力、工程师,帮其处理工程化的问题,而工业化公司比较拿手的是用户体会。此外由于大模型练习的本钱很高,如果找不到商业形式,是难以为继的,而这也是工业化公司拿手的。”周鸿祎指出了二者各自的优势,一起也发掘出了其协作形式。

在周鸿祎看来,微软承接了许多归于工业化公司拿手的工作,使OpenAI可以专心于技能研讨,两边在本钱上又进行了很好的结合,这给予了咱们启示,中国可以将大学、国家实验室、科研机构、科研系统和互联网公司、工业公司结合起来,经过协作的方法来推动。

“他人现已领先了,咱们不能再把他人踩过的坑再踩一遍。”周鸿祎感叹道。他以为首要可以树立大型科技企业+要点科研机构的产研协同立异形式,打造中国的“微软+Open AI”组合引领大模型技能攻关;其次可以支撑树立多个国家级人工智能大模型的长时刻开源项目,打造开源众包的敞开立异生态。树立大型科技企业+要点科研机构为龙头,经过开源、协作、众包和生态的立异形式,引导高校、科研机构和立异型企业构成多个技能道路的立异生态群。这样一来,可以下降过错风险和防止技能独占风险,防止其变成新时代的数字距离。

谈与国外距离:原创性有距离,两年有望赶上国外

“我觉得中国和国外的距离没有那么大,比光刻机芯片距离都要小许多,首要原因是这方面的论文都是敞开的,许多模型算法本来都是开源的,相当于咱们有根底。GPT现已给大家相当于指明晰方向,大力出奇迹。可是,我觉得这里有许多细节的技能问题,比方灌输知识是容易的,但才干和推理才干,包含各种实践技能的练习较为杂乱。所以我以为大约需要两年左右的时刻,国内的水平就可以赶上来。”谈及我国的AI企业在资金、人才、底层技能等关键环节与国外存在的距离,周鸿祎这样回答道。

周鸿祎还提出,中国和微软、Google的距离,从仿照视点来看距离不大,从原创视点距离依然存在。“咱们面对几个晦气的条件,便是我国缺少开源的传统,它里边用了许多模型都是前面的公司开源的,没有前面的开源就没有在前人膀子上的堆集,每个公司都要从黑暗中摸索,这对国家整个工业开展速度是晦气的。这么牛的技能,也的确不该该被独占在一两家公司手里。”

他还指出我国现在存在的一些难点。他指出,为了完成对GPT的逾越,需要运用更多的数据,而不仅仅是开源数据集。这包含许多的杂志、期刊和图书。公共数据是十分重要的,由于GPT对时效性的要求并不高,它可以运用很早以前的书本或文章。但周鸿祎也指出数字化的问题是一个难点:“如果许多的中文图书没有数字化,或许没有必定版权的颁发,这个版权颁发如何进行、国家如果没有政策支撑,那么数字化的难度会更大。”

除了版权之外,周鸿祎以为互联网的信息也十分重要,互联网有上万亿个网页,其间有许多都是电子废物,这就需要搜索引擎进行调度、处理、过滤和清洗。“可是中国呈现一个怪现象,乔布斯发明了APP,大家用习惯了就不怎样用网站了,可是美国还有一个传统,一切的APP背面还有一个Web版别,仍是坚持了Web化的阅读体会,这样的话这些不触及用户隐私的数据可以被抓取可以用来做练习,但在中国一切的信息都被APP切割了,APP人为的将互联网切割成了各种信息孤岛。如果你的数据我拿不到,我的数据也不给你,最终大家练习出来的能够真实逾越吗?我觉得会比较难。”

一起周鸿祎也规划了一条企业可以选择的途径,他以为打造生态至关重要,ChatGPT现在表面上来看,是打造了一个谈天机器人、个人助理来帮助大家更好的运用东西。而实践上它做了一项工作:隐秘选择了一百家专业公司并拔擢其做专业的笔直使用,这一百家公司大部分均为创业公司。

“头部企业才需要搞大模型,大部分企业只需要在大模型的根底上,结合自己的职业场景、专业需求,使用大模型供给AI的才干来赋能自己就可以了。所以,对于许多创业企业应该是一个蓬勃开展的时机。”周鸿祎向网易科技表明。

一起周鸿祎也着重,ChatGPT被称为通用人工智能是由于它构建了一个通用的知识根底,可以为不同的职业和使用场景供给支撑,而不是只限于某一个笔直范畴。这也是它的工业革新的价值地点。虽然在中文语料方面,ChatGPT的中文体现不如英文体现好,但这是由于中文语料的份额十分低,大约只要百分之几。这意味着要练习更好的中文模型,需要更多的中文语料。

展望未来,周鸿祎以为在追逐美国的过程中,咱们要先把自己的“疑难杂症”处理,如果想在一片土壤上长出几棵苍天大树,要长出生态,就先要把土壤环境机制发明好。