字节版ChatGPT悄然敞开，免费无排队，抖音号手机号直接登

克雷西鱼羊发自凹非寺量子位 | 大众号 QbitAI

字节跳动版ChatGPT，现在人人可玩了！

网页版、安卓版和iOS版同步上线，用抖音账号、手机号和苹果账号都能登录。

而且无需排队，翻开就能和这个名叫“豆包”的AI帮手直接开聊。

是doubao.com不是douban.com噢~

音讯一出，现已有不少胖友第一时间前往围（tiao）观（xi）。

咱们也抓住实测了一波~

与ChatGLM难分伯仲

先来看看豆包是怎样介绍自己的：

既然如此，咱们就来试试这些“官方功用”靠不靠谱。

比方，咱们挑选了几个有意思的过错机翻让豆包纠正，成果豆包给出的反应还挺不错的：

尤其是“鸳鸯锅”的翻译，能够说是完胜Google和DeepL。

常识方面的话，当然要问一下“刁钻”的问题了：雷公电母放出的电是直流电仍是交流电。

豆包的这个答复，能够归纳成“不是直流电，而是直流电”，但前面说的还算能够吧。

抛开整活的话，豆包的开胃小菜确实给了咱们一个不错的第一印象。

那么下面咱们就上正餐——来拿它和备受好评的国产开源大模型ChatGLM进行一场大横评。

详细的内容包含案牍创造、逻辑推理、数学和代码四个方面。

案牍创造方面，豆包说自己会编撰知乎、小红书等各种风格的案牍。

咱们无妨整个奇葩点的东西，看看它能不能创造得出来，比方……豆浆美式的小红书笔记。

案牍搭配着emoji，连Tag都有了，看来豆包真的是懂小红书的。

不过你确认“醇香甜美”这个词是用来描述豆浆的吗……

ChatGLM尽管写了许多，可是没审清题，把豆浆直接当成了豆浆……

（这么一看，豆包或许也了解成豆浆了，可是人家没直接说成豆浆啊）

看来豆包是有必定创造才能的，所以无妨再加大难度。

直接让它给“豆浆美式”的宣传片写个短视频脚本。

ChatGLM的版别细节则要丰厚些，不过豆包的版别也算是五脏俱全了。

两者的案牍创造水平平起平坐，那么逻辑推理才能又怎样样呢？

咱们找来了一道推理标题，这道题两位选手都没能做对（正确答案是甲3乙1丙2）：

尽管都没做对，可是豆包的思路好像在往正确的方向上走了。

而ChatGLM的答复，横竖我是没看懂。

这一环节对两者的体现也是很难点评，那么，立刻进入一众大模型的噩梦环节——数学。

简略如鸡兔同笼这样的问题就意外了，咱们直接上难度，拿一道高考题给他们试试。

△2023北京卷第16题

（图片咱们没有输入，但没有图片也能解题；第一问是证明，咱们也去掉了）

豆包运用的是纯几许方法，最终的答案是正确的，但很惋惜进程不对。

△从红框开端呈现过错

ChatGLM则运用了向量解法：

首要成果是错的，不过120却是和60度互补，是出了些小问题吗？

但咱们很快发现了华点：

这儿不应该约等于就先不提了……两个正数相除你是怎样给约成个负数的……

标准答案是酱婶儿的，因为第二问要用到第一问的证明定论，所以把第一问的进程也放上来了：

如此看来，在数学修炼上，两位大模型选手都还有很大的前进空间。

那么面临咱们脍炙人口的代码问题，豆包又该怎么应对呢？

先看比较根底的冒泡排序算法。

咱们试着跑了一下（换掉了预设的数字），成果成功输出了答案：

接下来上LeetCode，咱们先选了一个比较简略的把阿拉伯数字转换成罗马数字的标题。

豆包很快就生成了一段代码，还顺便了解说：

而ChatGLM给出的代码是这样的（也附有解说）：

运转的成果是豆包正确，ChatGLM过错：

不过略微杂乱一些的标题，他们就都做不对了。

除了规划算法，咱们还想看看他们能不能用代码“画图”。

咱们随机生成了两列数据，看看能不能搞个折线图出来：

成果用豆包的代码画出了这么个东西……

ChatGLM这边的状况嘛……好家伙，直接报错运转不了。

代码环节就先展现到这儿了，用一句话说便是：都还得练。

看了这么多，想必读者朋友们现已有些累了，所以咱们还预备了“餐后甜点”，来点轻松的内容。

弱智吧，开整！

Q1：萝卜究竟能不能“开胃”呢？

“必要时寻求专业医师协助”，这难道是在自己给自己做手术吗……

Q2：导盲犬制止入内，是给瞎子看得，仍是给导盲犬看的？

豆包在A和B两个选项傍边挑选了C。

而问及“陨石为什么总砸中陨石坑”，豆包却是说对了，只不过答复得有点杂乱。

弱智吧的测评成果总结下来便是：AI仍是太单纯，还没方法了解人类杂乱的小心思。

字节跳动大模型开端发力

字节跳动选在这时分敞开“豆包”测验，好像有些令人意外。

但实际上，这个时间线倒推起来也不是无迹可寻：

在ChatGPT掀起狂澜的本年二三月，字节跳动就已有组成大模型团队的音讯传出。

据36kr音讯，其探究方向主要是语言和图画两类大模型，期望能将大模型与字节自身的查找、广告等下流事务相结合。

但在其时，字节方面相关技能负责人的回应是：

技能中台在这些范畴有探究，还很初期，不成熟。

尔后的“百模大战”之中，字节跳动好像并没有正式参战的意思，旗下云渠道火山引擎，打出的也是“为大模型打造技能底座”、接入第三方大模型做大模型旗舰店商城的旗帜。

直到6月份，字节跳动被曝开端内部测验一款AI对话类产品，代号“Grace”。

而Grace的网址“gracebot.cn”，现在会直接跳转到豆包官网。

尽管豆包本包并不供认自己便是Grace，但现在看来，豆包便是Grace的敞开测验版别。

别的，“豆包”项目组的盆友向咱们泄漏，豆包尚处于前期开发验证阶段。测验期还存在较多限制，生成的内容也或许不精确，欢迎测验用户们多提意见多反应。

值得重视的是，最近，一个名叫BuboGPT的多模态大模型，在huggingface上上线了Demo。这一大模型背面相同有来自字节跳动的技能参加。

论文介绍，BuboGPT支撑文本、图画、音频三种模态，能做到细粒度的多模态联合了解。

比方给它这样一张图片：

BuboGPT不仅能识别出青蛙和青蛙手里的班卓琴，还能总结出青蛙的详细动作、所在环境。

One More Thing

字节跳动总算出手，那么豆包这体现你给打几分？

话说回来，就在大模型逐渐走出每周都有新模发布的疯狂期，国产大模型的先行者们，答复质量现已悄然前进了不少。

比方最初难倒众多大模型英雄汉的“爸妈婚礼不带我”问题，现在许多国产大模型都能答复得有理有据。

△上百度下讯飞

国产大模型的评判标尺，或许也已到了再上一个台阶的时分。

所以，国产大模型百家争鸣，是否也给到你新的惊喜了呢？欢迎在谈论区与咱们分享~

字节版ChatGPT悄然敞开，免费无排队，抖音号手机号直接登

相关推荐：

最近发表

previous