DeepSeek-V2发布:性能超越GPT-4,价格白菜!

科技 2024-05-07 14:28 阅读:15

5月7日消息,DeepSeek发布了第二代MoE模型DeepSeek-V2,继续引领开源模型领域。新模型在各项性能评测中表现卓越,尤其在中文综合能力和英文综合能力上与顶尖闭源模型并驾齐驱。此外,在知识、数学、推理、编程等专业榜单上,DeepSeek-V2也取得了领先位置。

DeepSeek-V2采用了创新的MLA架构,结合自研的Sparse结构DeepSeekMoE,在保持性能的同时将计算量降至最低。这使得模型在较低的显存消耗下实现了高性能,每token成本大幅降低,实际部署在8卡H800机器上的输入吞吐量超过每秒10万tokens,输出超过每秒5万tokens。而API定价也十分亲民,每百万tokens输入1元、输出2元,价格极具竞争力。

DeepSeek秉持开源精神,将DeepSeek-V2模型和相关论文完全开源,免费商用,无需申请。模型权重可在Hugging Face平台获取,技术报告则发布在GitHub上。同时,DeepSeek提供了对话官网和开放平台,用户可以在chat.deepseek.com免费开启对话,而DeepSeek API开放平台则提供注册即赠送大量tokens的优惠,以支持优质项目的发展。DeepSeek-V2的发布,性能超越GPT-4,价格白菜,助力开源模型领域的发展!