字节版ChatGPT悄然敞开,免费无排队,抖音号手机号直接登

科技 2023-08-19 15:58 阅读:25

克雷西 鱼羊 发自 凹非寺量子位 | 大众号 QbitAI

字节跳动版ChatGPT,现在人人可玩了!

网页版、安卓版和iOS版同步上线,用抖音账号、手机号和苹果账号都能登录。

而且无需排队,翻开就能和这个名叫“豆包”的AI帮手直接开聊。

是doubao.com不是douban.com噢~

音讯一出,现已有不少胖友第一时间前往围(tiao)观(xi)。

咱们也抓住实测了一波~

与ChatGLM难分伯仲

先来看看豆包是怎样介绍自己的:

既然如此,咱们就来试试这些“官方功用”靠不靠谱。

比方,咱们挑选了几个有意思的过错机翻让豆包纠正,成果豆包给出的反应还挺不错的:

尤其是“鸳鸯锅”的翻译,能够说是完胜Google和DeepL。

常识方面的话,当然要问一下“刁钻”的问题了:雷公电母放出的电是直流电仍是交流电。

豆包的这个答复,能够归纳成“不是直流电,而是直流电”,但前面说的还算能够吧。

抛开整活的话,豆包的开胃小菜确实给了咱们一个不错的第一印象。

那么下面咱们就上正餐——来拿它和备受好评的国产开源大模型ChatGLM进行一场大横评。

详细的内容包含案牍创造、逻辑推理、数学和代码四个方面。

案牍创造方面,豆包说自己会编撰知乎、小红书等各种风格的案牍。

咱们无妨整个奇葩点的东西,看看它能不能创造得出来,比方……豆浆美式的小红书笔记。

案牍搭配着emoji,连Tag都有了,看来豆包真的是懂小红书的。

不过你确认“醇香甜美”这个词是用来描述豆浆的吗……

ChatGLM尽管写了许多,可是没审清题,把豆浆直接当成了豆浆……

(这么一看,豆包或许也了解成豆浆了,可是人家没直接说成豆浆啊)

看来豆包是有必定创造才能的,所以无妨再加大难度。

直接让它给“豆浆美式”的宣传片写个短视频脚本。

ChatGLM的版别细节则要丰厚些,不过豆包的版别也算是五脏俱全了。

两者的案牍创造水平平起平坐,那么逻辑推理才能又怎样样呢?

咱们找来了一道推理标题,这道题两位选手都没能做对(正确答案是甲3乙1丙2):

尽管都没做对,可是豆包的思路好像在往正确的方向上走了。

而ChatGLM的答复,横竖我是没看懂。

这一环节对两者的体现也是很难点评,那么,立刻进入一众大模型的噩梦环节——数学。

简略如鸡兔同笼这样的问题就意外了,咱们直接上难度,拿一道高考题给他们试试。

△2023北京卷第16题

(图片咱们没有输入,但没有图片也能解题;第一问是证明,咱们也去掉了)

豆包运用的是纯几许方法,最终的答案是正确的,但很惋惜进程不对。

△从红框开端呈现过错

ChatGLM则运用了向量解法:

首要成果是错的,不过120却是和60度互补,是出了些小问题吗?

但咱们很快发现了华点:

这儿不应该约等于就先不提了……两个正数相除你是怎样给约成个负数的……

标准答案是酱婶儿的,因为第二问要用到第一问的证明定论,所以把第一问的进程也放上来了:

如此看来,在数学修炼上,两位大模型选手都还有很大的前进空间。

那么面临咱们脍炙人口的代码问题,豆包又该怎么应对呢?

先看比较根底的冒泡排序算法。

咱们试着跑了一下(换掉了预设的数字),成果成功输出了答案:

接下来上LeetCode,咱们先选了一个比较简略的把阿拉伯数字转换成罗马数字的标题。

豆包很快就生成了一段代码,还顺便了解说:

而ChatGLM给出的代码是这样的(也附有解说):

运转的成果是豆包正确,ChatGLM过错:

不过略微杂乱一些的标题,他们就都做不对了。

除了规划算法,咱们还想看看他们能不能用代码“画图”。

咱们随机生成了两列数据,看看能不能搞个折线图出来:

成果用豆包的代码画出了这么个东西……

ChatGLM这边的状况嘛……好家伙,直接报错运转不了。

代码环节就先展现到这儿了,用一句话说便是:都还得练。

看了这么多,想必读者朋友们现已有些累了,所以咱们还预备了“餐后甜点”,来点轻松的内容。

弱智吧,开整!

Q1:萝卜究竟能不能“开胃”呢?

“必要时寻求专业医师协助”,这难道是在自己给自己做手术吗……

Q2:导盲犬制止入内,是给瞎子看得,仍是给导盲犬看的?

豆包在A和B两个选项傍边挑选了C。

而问及“陨石为什么总砸中陨石坑”,豆包却是说对了,只不过答复得有点杂乱。

弱智吧的测评成果总结下来便是:AI仍是太单纯,还没方法了解人类杂乱的小心思。

字节跳动大模型开端发力

字节跳动选在这时分敞开“豆包”测验,好像有些令人意外。

但实际上,这个时间线倒推起来也不是无迹可寻:

在ChatGPT掀起狂澜的本年二三月,字节跳动就已有组成大模型团队的音讯传出。

据36kr音讯,其探究方向主要是语言和图画两类大模型,期望能将大模型与字节自身的查找、广告等下流事务相结合。

但在其时,字节方面相关技能负责人的回应是:

技能中台在这些范畴有探究,还很初期,不成熟。

尔后的“百模大战”之中,字节跳动好像并没有正式参战的意思,旗下云渠道火山引擎,打出的也是“为大模型打造技能底座”、接入第三方大模型做大模型旗舰店商城的旗帜。

直到6月份,字节跳动被曝开端内部测验一款AI对话类产品,代号“Grace”。

而Grace的网址“gracebot.cn”,现在会直接跳转到豆包官网。

尽管豆包本包并不供认自己便是Grace,但现在看来,豆包便是Grace的敞开测验版别。

别的,“豆包”项目组的盆友向咱们泄漏,豆包尚处于前期开发验证阶段。测验期还存在较多限制,生成的内容也或许不精确,欢迎测验用户们多提意见多反应。

值得重视的是,最近,一个名叫BuboGPT的多模态大模型,在huggingface上上线了Demo。这一大模型背面相同有来自字节跳动的技能参加。

论文介绍,BuboGPT支撑文本、图画、音频三种模态,能做到细粒度的多模态联合了解。

比方给它这样一张图片:

BuboGPT不仅能识别出青蛙和青蛙手里的班卓琴,还能总结出青蛙的详细动作、所在环境。

One More Thing

字节跳动总算出手,那么豆包这体现你给打几分?

话说回来,就在大模型逐渐走出每周都有新模发布的疯狂期,国产大模型的先行者们,答复质量现已悄然前进了不少。

比方最初难倒众多大模型英雄汉的“爸妈婚礼不带我”问题,现在许多国产大模型都能答复得有理有据。

△上百度下讯飞

国产大模型的评判标尺,或许也已到了再上一个台阶的时分。

所以,国产大模型百家争鸣,是否也给到你新的惊喜了呢?欢迎在谈论区与咱们分享~