DeepSeek-V2发布：性能超越GPT-4，价格白菜！

5月7日消息，DeepSeek发布了第二代MoE模型DeepSeek-V2，继续引领开源模型领域。新模型在各项性能评测中表现卓越，尤其在中文综合能力和英文综合能力上与顶尖闭源模型并驾齐驱。此外，在知识、数学、推理、编程等专业榜单上，DeepSeek-V2也取得了领先位置。

DeepSeek-V2采用了创新的MLA架构，结合自研的Sparse结构DeepSeekMoE，在保持性能的同时将计算量降至最低。这使得模型在较低的显存消耗下实现了高性能，每token成本大幅降低，实际部署在8卡H800机器上的输入吞吐量超过每秒10万tokens，输出超过每秒5万tokens。而API定价也十分亲民，每百万tokens输入1元、输出2元，价格极具竞争力。

DeepSeek秉持开源精神，将DeepSeek-V2模型和相关论文完全开源，免费商用，无需申请。模型权重可在Hugging Face平台获取，技术报告则发布在GitHub上。同时，DeepSeek提供了对话官网和开放平台，用户可以在chat.deepseek.com免费开启对话，而DeepSeek API开放平台则提供注册即赠送大量tokens的优惠，以支持优质项目的发展。DeepSeek-V2的发布，性能超越GPT-4，价格白菜，助力开源模型领域的发展！

DeepSeek发布V2模型 GPT-4的性能白菜的价格

DeepSeek-V2发布：性能超越GPT-4，价格白菜！

相关推荐：

最近发表

previous