清华系17人,撑起中国大模型创业半壁河山,原因究竟是什么?

科技 2023-08-24 08:19 阅读:13

本文系网易新闻•网易号特征内容鼓励计划签约账号【智东西】原创内容,未经账号授权,制止随意转载。

作者 | 程茜修改 | 心缘

智东西8月23日报导,曩昔三个月,生成式AI浪潮变数丛生,国内AI大模型工业也连爆大事:

6月29日美团宣告完结对AI大模型独角兽企业光年之外的收买,搜狗开创人王小川创立的AI大模型创企百川智能连发3款开源大模型;此前被光年之外收买的AI大模型创企OneFlow(一流科技)的开创人袁进辉也于本周证明,一流科技团队将瞄准大模型推理本钱问题从头创业。

风趣的是,这些处于国内AI大模型比赛焦点的主人公们——美团开创人王兴、光年之外开创人王慧文、搜狗&百川智能开创人王小川、一流科技开创人袁进辉——都是清华学子。

在如火如荼展开的AI大模型比赛中,清华学子可谓“抢尽”了风头,除了王慧文、王小川等互联网“老炮”高调进场外,还有多位清华学院派教授、清华结业生躬身入局。据智东西不彻底统计,近期活泼的AI大模型创企中,具有清华布景的开创人至少有17位,触及11家企业。清华系创业团队俨然正撑起国内AI大模型创业浪潮的半壁河山。

▲近期活泼在国内大模型浪潮中的清华系创企(收拾自揭露信息)

一、大佬创业:90年代清华师兄弟、互联网“老炮”高调入局

许多年后,人们回忆起国内这场盛况空前的AI大模型创业潮时刻:有两个人的姓名必定会首先浮现在眼前,那便是王慧文和王小川。就在本年2月和4月,这两位互联网老炮连续官宣创业,剑指大模型。

除了这些一起点外,王小川和王慧文这对师兄弟曾于1996、1997年先后结业于清华大学。

1、王慧文:2个月成独角兽,没产品成最大危险

最早官宣创业的是王慧文。2月中旬,王慧文6天连发5条朋友圈,从表明态度到“500万美元带资进组求组队”、发“AI英雄榜”,终究AI大模型创企光年之外成型。

王慧文的创业之路总能看到美团开创人王兴的身影。1997年,王慧文考进清华大学电子工程系,因缘际会与王兴成为上下铺兄弟。戏谑的是,他们二人寸步不离的原因是,效果优异的王慧文进入清华大学后发现在很多佼佼者中自己只能算个“学渣”,因而与效果附近的王兴志同道合。

▲王慧文(右一)和王兴(中心)

结业后两人几经曲折,终究在美团“成功会师”。读研期间,王慧文和王兴双双退学瞄准了彼时在美国鼓起的交际网络,打造出风行大学生集体的校内网后堕入商业化窘境,随后挑选出售校内网财富自在,两人分隔创业。2010年,王慧文参加美团,再次与王兴联手。2020年,42岁、身价120亿人民币的王慧文挑选从美团退休。

这次,王慧文又出山,入局AI大模型。官宣创业后,顶尖人才、高额融资接连不断。前有北京智源人工智能研讨院副院长刘江、被称为“搜狗输入法之父”的马占凯等参加,后有王兴、快手开创人宿华掏钱出资。树立两个月后,光年之后敏捷跃升独角兽,估值达10亿美元。

这背面,不是技能身世的王慧文开端紧锣密鼓地招集人才,4月,光年之外完结收买同为清华系创企一流科技。这家创企的开创人是师从我国人工智能奠基者张钹院士的袁进辉。

在此之后,手持丰盛本钱、技能的光年之外事务布局行将走上正轨,成为AI大模型创业焦点的王慧文,6月底之际却被曝呈现已因病离岗,随后,王兴入局,光年之外被美团全权收买。

现在来看,王慧文的AI大模型创业之路现已画上了结局,尔后他是否会重返“战场”仍是个未知数,但树立半年之久的光年之后在产品端尚无开展官宣的当下,就几经曲折,这或许现已成为这家头顶数道光环的大模型创企的最大危险。

2、王小川:百余天官宣3个大模型,出资阵型奢华

反观与王慧文受重视度简直相等的王小川,4个月时刻就拿出三款大模型,并敞开了大模型商业化的探究。

鼎鼎有名的清华大学核算机系的96级结业生,是国内互联网工业榜首波弄潮儿,他们参加并见证了我国互联网开展的每一个时刻,可谓“互联网梦之队”。王小川便是其间之一。

▲百川智能开创人兼CEO王小川

1996年,效果优异、对核算机感爱好的王小川被特招入清华大学核算机系,这一待便是七年。从核算机专业到生物方向,从国内青年社区渠道ChinaRen到搜狐,王小川的技能才调发挥的规划逐步扩展,但他的物理空间却简直没有离开过五道口,王小川也被称为“清华东门守门员”。

王小川也把百川智能落户到了五道口。本年4月,王小川联手前搜狗COO茹立云树立百川智能,官宣进场大模型创业,更有多位搜狗团队老职工自动请求带资参加,据王小川在第三个大模型发布时泄漏,现在百川智能中前搜狗职工的份额占到30-40%。

树立一个月后,百川智能就拿到了来自腾讯、小米、金山、清华大学财物办理有限公司、好未来等十余家组织的联合出资,这样的奢华出资阵型鲜有先例。

四个月时刻,百川智能现已发布参数量130亿的通用大言语模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版别、530亿参数规划的Baichuan-53B,掩盖开源到闭源。下一步,王小川要在大模型开源的根底上,以搜狗从前的超级使用阅历为根底,找到大模型的超级使用以及比肩GPT才能的大模型。

▲百川大模型演示事例

王慧文、王小川都是从前缔造我国互联网的清华学子,隐退多年后,又在大模型浪潮下躬身入局。除了这两位互联网老炮外,还有很多清华系教授、学生在这场硝烟弥漫的大模型赛道中分外刺眼。

二、学院派:五位教授领衔,孵化多个大模型创企

清华大学名副其实是国内AI大模型赛道的人才宝地,现有的学术力气风头正盛,五位教授领衔的AI大模型创业浪潮正在缓缓拉开帷幕。

在人工智能范畴,不得不提的便是智源研讨院这一响当当的名头。2018年,智源研讨院正式树立,将北京大学、清华大学、我国科学院、百度、字节跳动等人工智能工业的头部院校、企业的顶尖人才集合到一同。

当OpenAI的GPT-3发布后,智源研讨院首先建议大模型项目,唐杰、刘知远、黄民烈、杨植麟……等清华大学闻名AI学者纷繁投身其间,他们一起构成了后来悟道大模型的研制团队。

这些AI大牛也成为了这波大模型创业浪潮中的中心力气。

1、唐杰:中心成员曾参加闻名大模型研制,融资拿到手软

智谱AI、智源研讨院、月之暗面、循环智能,这些身处大模型热潮中心的公司,都与清华大学核算机系教授唐杰联系匪浅。

唐杰教授光环加身,他既是清华大学核算机系常识工程实验室(KEG)带头人,一起是智源研讨院学术副院长、悟道项目负责人。

▲唐杰(图源:清华大学)

事实上,最开端唐杰并不信任机器智能会逾越人,他的首要研讨方向是数据发掘和常识工程,而大规划预练习模型的呈现,让他看到了机器智能逾越人的可能性。

2020年OpenAI甩出GPT-3,搅动了整个人工智能工业。随后,2020年10月,智源研讨院首先确认了大模型研讨战略方向,时任智源副院长的唐杰带领团队在2021年发布了悟道1.0和2.0模型。一起,悟道2.0凭仗万亿级参数规划创下我国首个、全球最大的国际纪录。

与此一起,KEG实验室孵化的智谱AI,其间心团队也多为悟道大模型的研制人员,本年7月,刚刚收买光年之外的美团独家出资了智谱AI,融资金额达数亿人民币。现在,智谱AI中英双语开源模型ChatGLM、代码生成模型CodeGeeX等大模型及使用产品矩阵。

除唐杰自己外,他鼎鼎大名的得意门生杨植麟也入局大模型,从清华结业的杨植麟在美国卡内基梅隆大学师从苹果和谷歌的AI大牛。6月12日,杨植麟剑指大模型的新创企月之暗面露脸,刚树立就敏捷拿到红杉、真格组织出资,商场估值达3亿美元。不过,杨植麟头顶的光环远不止于此,早在2016年,杨植麟就创立了专心于自然言语了解的循环智能,还曾参加华为盘古大模型研制。

月之暗面其他三位联合开创人中张宇韬周昕宇也结业于清华,张宇韬与杨植麟同为唐杰的学生。

2、孙茂松:从信息处理到法令大模型,创企数量、进入品种都处前列

清华大学人工智能研讨院教授孙茂松是自然言语处理与社会人文核算实验室(THUNLP)的负责人,刘知远师承孙茂松。比较于唐杰教授,孙茂松和刘知远团队的创业公司更多,而且进入的使用范畴也更丰厚。

▲孙茂松(左)刘知远(右)

深言科技依据预练习模型打造中文信息处理引擎、面壁智能聚集于根底大模型的中心技能、幂律智能则要将自然言语处理使用于法令。此前,王慧文还曾传出要收买深言科技和面壁智能,但这些收买风闻最终都不了了之。

2021年,一款名叫WantWords的反向词典忽然在交际渠道上爆火,两三周时刻招引了约30万用户。这一使用的研制人员便是后来深言科技的开创团队。WantWords依据深度学习能协助人们依据语义描绘查找词语,这一产品也协助岂凡超打响名号。

▲WantWords反向词典主页

早有创业主意的岂凡超,2022年结业树立了深言科技,孙茂松担任首席科学家,而且深言科技的中心团队均为清华硕博士布景。树立至今,深言科技已完结三轮融资,最新一轮融资中腾讯、好未来在列。虽然详细的融资金额没有宣布,但据传其估值在第二轮融资完结后已达1亿美元。

另一家被传收买的面壁智能,开创人曾国洋是刘知远的学生,一起刘知远担任联合开创人,面壁智能现已完结近千万元的种子轮融资,此前推出了CPM-Live百亿中文大模型直播练习项目。

本年4月,知乎宣告与面壁智能一起开发了“知海图AI”,并为其注资数千万人民币,这也一举打破了面壁智能曾被收买的传言。技能、人才、本钱、使用、数据等多重要素的加持,使得面壁智能的大模型现已在知乎的使用完结大规划使用。

除了这两家创企,还有清华大学核算机系人工智能所博士涂存超树立的幂律智能,这家公司重视的是自然言语处理技能与法令范畴的结合。本年6月,幂律智能联合智谱AI发布了依据中文千亿大模型的法令笔直大模型PowerLawGLM。

3、黄民烈:瞄准心思咨询详细场景,要做我国版Character AI

相同参加悟道大模型研制的清华大学核算机科学与技能系长聘教授黄民烈,在创业初期就瞄准了详细的使用落地场景。

2021年,黄民烈教授创立了聆心智能,其开创团队多来自于清华大学、北京大学、北京师范大学等高校科研院所,到现在,聆心智能现已完结三轮融资,出资组织包含清华系的智谱篇章等,其间宣布详细融资金融的为上一年12月完结的数千万元天使+轮融资。

▲清华大学核算机科学与技能系长聘教授黄民烈(图源:清华大学人工智能研讨院)

创立初期,黄民烈教授就专心于让人工智能能为心思亚健康患者供给病况确诊、个性化干涉的计划。这一创业方针的主意来源于黄民烈教授与其身患抑郁症学生的故事。

本年7月,聆心智能发布了超拟人大模型CharacterGLM,供给千人千面的AI形象来陪同用户、与用户聊天等,依据这一大模型,聆心智能还正在内测用户爱好互动社区新产品AiU。

与这波大模型浪潮中瞄准OpenAI的创企不同,聆心智能此前曾泄漏,他们要做的是“我国的Character AI”,Character AI的最大特色便是让用户创立个性化的AI人物来进行交互。

4、朱军:主攻多模态大模型,拿到蚂蚁、百度风投出资

清华大学核算机系教授、清华大学人工智能研讨院根底理论研讨中心主任朱军也是最新入局的一位清华系教授。生数科技树立于本年3月,其间心团队大多来自清华大学人工智能研讨院,首要打造多模态通用大模型。

▲清华大学核算机系教授、清华大学人工智能研讨院根底理论研讨中心主任朱军(图源:北京智源大会官网)

朱军教授榜首次创业能够追溯至2018年,彼时专心于提高人工智能安全性的瑞莱才智RealAI树立,专心于提高人工智能的安全性。

生数科技正是由瑞莱才智孵化而来,树立至今拿到两轮出资,本年6月拿到蚂蚁集团、BV百度风投等的近亿元人民币融资,本年8月拿到锦秋基金独家出资的数千万人民币。

生数科技联合开创人兼CEO唐家渝仍是孙茂松教授的学生,他此前在承受采访时谈道,生数科技当前所练习的大模型图画生成作用现已超越Stable Diffusion,估计将于年内赶超Midjourmy。

5、周伯文:面向顾客事务,自研百亿级笔直大模型

最终一位与上述几位教授的状况略有不同,清华大学惠妍讲席教授、清华大学电子工程系长聘教授、清华大学电子系协同交互智能研讨中心主任周伯文,是AI大牛重返学界的典型代表。

从IBM到京东,周伯文从事人工智能根底理论和中心技能研讨已达20年。自从2003参加IBM,他连任多个大型项目重要技能、办理职位,还作为IBM Watson集团首席科学家领队开发了IBM Watson集团人工智能渠道。2017年参加京东后,又成为推进京东人工智能、京东云开展的重要人物。

▲清华大学惠妍讲席教授、清华大学电子工程系长聘教授、清华大学电子系协同交互智能研讨中心主任周伯文(图源:启明创投)

2021年,他从京东离职后,2022年中旬,清华大学官宣聘任周伯文。

除了重返学界外,周伯文也瞄准了AI创业这条路。2021年,衔远科技树立,这家公司的中心产品瞄准的是消费职业,供给依据产品供应链大模型的企业级多轮对话渠道ProductGPT。而且,该公司的信息显现,这一AI大模型是其自研,参数规划为数百亿级,能让大模型在具有通用才能的根底上更拿手了解人与产品。

清华大学的学术力气现已站上大模型创业的擂台,既有清华教授下场创业,又有师生伙伴入局。事实上,在国内的创业大潮中,清华帮现已不止一次撑起工业的半壁河山,而这都离不开上个世纪清华大学在人工智能范畴的前瞻布局。

三、从0开端迎头赶上,清华大学撑起大模型创业半壁河山

清华大学,这一所汇聚了国内很多顶尖人才的高校,也是我国人工智能技能萌发诞生的当地。

比较当下的炽热程度,40多年前“人工智能”这个词汇在国内的专业人士眼里也很生疏。1978年,人工智能榜首次呈现在了清华大学内部,自动操控系更名为核算机技能与使用系,内部人工智能与智能操控教研组树立,拉开了人工智能范畴的教育前奏。

清华大学也创下了全国人工智能范畴的多个榜首,1978年接收榜首批硕士生;1983年树立首个智能机器人实验室;1983年在国际人工智能大会(IJCAI)上宣布我国榜首篇学术论文;1984年取得人工智能范畴的榜首个国际重要奖项;1987年榜首位人工智能范畴的博士生结业;1990年树立全国榜首个有关人工智能的国家重点实验室“智能技能与体系”;2005年“清华大学核算机科学实验室”树立,也便是当今人工智能范畴无人不知的“姚班”;2018年树立跨系穿插研讨组织“清华大学人工智能研讨院”……

我国逐步在人工智能范畴里赶超国际领先水平,并占有一席之地。

但是,寥寥数语一直无法彻底归纳清华大学从一片空白到现在硕果累累的不易。上个世纪七十年代,我国人工智能范畴生物操控和模式识别等方向的研讨已开端起步,但受政治环境等影响,人工智能的研讨必定程度上来说处于阻滞状况。

国内肄业无门的研讨人员为了更全面体系地知道人工智能范畴,改革开放后赴美肄业,40多岁的张钹便是这批留学生中的一位,他作为拜访学者前往美国伊利诺伊大学香槟分校进修学习,国内NLP研讨奠基人黄昌宁在耶鲁大学进行了为期一年的拜访。而他们都成为了我国人工智能工业的重要奠基人和推进者。

▲张钹院士在核算机系树立六十周年致辞(图源:清华大学)

总的来看,我国人工智能研讨起步比国外晚了20多年,阅历了从无到有、从弱到强的开展进程。现在,国内人工智能工业的开展现已与其他国家简直处于同一同跑线,清华系的创业者作为这一波大模型浪潮中的中坚力气,凭仗前人在人工智能范畴的奠基、本身过硬的技能堆集以及对前沿技能的探究、求真精力,正在从象牙塔走向练兵场并敏捷生长。

结语:清华创业帮蓄势待发

清华大学能够称得上国内人工智能研讨的起源地之一,在这一波人工智能新浪潮下,清华系无疑被寄予厚望。

除创业气势迅猛外,本钱商场也挑选重金押注清华创业团队,4月,深言科技新一轮融资完结后最新估值达1亿美元,6月生数科技完结近亿元天使轮融资,腾讯被曝本年6月向光年之外出资5000万美元……

现在,大模型创业浪潮现已渐趋镇定,很多清华系创企现已竞相官宣大模型效果,并投身到大模型使用落地中。我国大模型创业者们的新一轮比赛现已开端,而且益发剧烈。

现在,清华大学的优势逐步凸显,不只成为大模型范畴的人才军备库,一起占有了国内大模型创业浪潮的半壁河山。

参考资料:核算机系树立六十周年致辞《与核算机系一起生长》