算法第2页_有趣头条

中国超算另辟捷径——专访中国科学院院士钱德沛

中国科学院院士钱德沛强调应用实效并不意味机器性能不重要，只是不以机器性能为唯一指标，而是把更多的力量放在软硬结合、应用优化上，以取得应用实效为硬道理算力的巨大需求刺激超算发展...

算法算力钱德沛中国超算超级计算机中国科学院院士凝聚态物理领域

科技2024-05-06 18:52

ToB产业观察

图片来源@pixabay“预训练大模型的发展为实现通用人工智能提供了可能。其中算力一定要有比较大的进步，才可能有下一代。但短期内不太可能是GPU架构本身的明显跨越，而是需要千...

算法算力通信卡集群服务器 gpu 分布式数据库

科技2024-05-06 15:22

12年前上手深度学习，Karpathy掀起一波AlexNet时代回忆杀

机器之心报道机器之心编辑部没想到，自2012年AlexNet开启的深度学习革命已经过去了12年。而如今，我们也进入了大模型的时代。近日，知名AI研究科学家...

算法深度学习 matlab theano alexnet karpathy

科技2024-05-06 10:31

李飞飞创办Spatial Intelligence，获种子轮融资，AI创业再添新动力

据知情人士透露，李飞飞因开发了ImageNet图像数据集而声名鹊起，被誉为“AI教母”，最近为SpatialIntelligence筹集了种子轮融资，投资方包括硅谷风投公司And...

ai 算法李飞飞大模型空间智能计算机视觉

科技2024-05-04 19:18

耶鲁团队揭秘多头自注意力结构的上下文学习机制，揭示梯度流算法的收敛性

大家都知道，目前的大型模型主要基于Transformer架构。Transformer的核心结构是多头自注意力模型。大型模型具有重要的能力，即上下文学习。当大型模型的参数训练完成后，...

算法耶鲁奇异值梯度流上下文学习

科技2024-05-04 18:57

2024全球机器学习技术大会上海站盛况空前，共奏AGI变革新时代

ML-Summit2024全球机器学习技术大会在上海站圆满闭幕，各界专家学者齐聚一堂，共同探讨大模型技术的未来发展。CSDN高级副总裁、Boolan首席技术专家李建忠在主旨演讲中...

算法 agi 大模型上海市机器学习技术大会人工智能技术

科技2024-04-30 18:28

智谱AI王绍兰专访：技术与市场相辅相成，不可偏废

在AI领域，技术派和市场派各持己见。技术派认为长期投入大模型研发是未来趋势，而市场派则更看重商业化变现。王绍兰指出，技术与市场并非对立，而是相辅相成的。智谱AI是一家由清华大学技术...

算法王绍兰大模型人工智能智谱ai

科技2024-04-30 16:16

小模型也能数学推理！微调Mistral-7B实现86.81%准确率

数学应用题求解一直是小型语言模型（SLM）面临的挑战之一。以往的研究表明，要在GSM8K基准测试中实现80%以上的准确度，需要一个庞大的模型，拥有340亿个参数。为了在较小的模型...

算法调用实验数学推理视频生成模型专业智能体指导

科技2024-04-29 13:01

LLM上下文窗口轻松扩展至200万！LongRoPE方法助力8倍性能提升

近日，MicrosoftResearch的研究人员提出了一种名为LongRoPE的新方法，成功将LLM的上下文窗口扩展至200万个token，仅需简单微调即可实现与短上下文窗口相...

算法微调序列插值上下文视频生成模型

科技2024-04-29 12:59

AI新时代！Awaker 1.0超级智能体觉醒，数据瓶颈难题迎来解救

全球AI研究者们为了训练大模型而苦恼数据不足的问题，然而来自人大系的智子引擎团队却率先打破了这一难题。他们推出了具备自我更新能力的Awaker1.0，这款多模态大模型不仅能够自主...

算法模态 ai 引擎大模型超级智能体

科技2024-04-29 12:53