DeepSeek Coder V2开源发布，首超GPT4-Turbo代码能力

添加书签

AIGC开放社区
2024-06-18

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

去年11月，最强开源代码模型 DeepSeek-Coder 亮相，大力推动开源代码模型发展。

今年5月，最强开源 MoE 模型 DeepSeek-V2 发布，悄然引领模型结构创新潮流。

今天，全球首个在代码、数学能力上与GPT-4-Turbo争锋的模型，DeepSeek-Coder-V2，正式上线和开源。

全球顶尖的代码、数学能力

DeepSeek-Coder-V2 沿用 DeepSeek-V2 的模型结构，总参数 236B，激活 21B，在代码、数学的多个榜单上位居全球第二，介于最强闭源模型 GPT-4o 和 GPT-4-Turbo 之间。

国内第一梯队的通用能力

在拥有世界前列的代码、数学能力的同时，DeepSeek-Coder-V2 还具有良好的通用性能，在中英通用能力上位列国内第一梯队。

DeepSeek-Coder-V2 和

DeepSeek-V2 的差异

虽然 DeepSeek-Coder-V2 在评测中综合得分更高，但在实际应用中，两个模型各有所长。DeepSeek-V2 是文科生，DeepSeek-Coder-V2 是理科生，精通的技能点不同：

全面开源，两种规模

一如既往，DeepSeek-Coder-V2 模型、代码、论文均开源，免费商用，无需申请。

模型下载：

https://huggingface.co/deepseek-ai

代码仓库：

https://github.com/deepseek-ai/DeepSeek-Coder-V2

技术报告：

https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf

开源模型包含236B和16B两种参数规模

DeepSeek-Coder-V2：总参 236B（即官网和 API 版模型），单机 8*80G 可部署，单机 8*80G 可微调（需要技巧）
DeepSeek-Coder-V2-Lite：总参 16B，激活 2.4B，支持 FIM，代码能力接近 DeepSeek-Coder-33B（V1），单卡 40G 可部署，单机 8*80G 可训练。

API服务

DeepSeek-Coder-V2 API 支持 32K 上下文，价格和 DeepSeek-V2 一致，还是大家熟悉的低价：

本地私有化部署

DeepSeek 提供本地私有化部署服务，标准化成品交付，开箱即用，轻松升级。

价格 45 万/套/年，支持灵活的商务方案（登录官网，联系客服）。

价格包含：

一台推理训练一体化的高性能服务器（Nvidia H20、Huawei 910B 或其它同级别显卡，8 显卡互联）。
模型：DeepSeek-V2-236B、Coder-V2-236B、后续其它模型。
一站式软件套件：推理、微调、运维等。
对每个客户，DeepSeek 均会针对应用场景，使用公开数据、脱敏数据进行训练和调优。客户可以使用私有数据进一步微调。
不低于 5 人日/年的技术支持。

预期性能：

输入：20000 tokens/s
输出：5000~10000 tokens/s

官网已上线 DeepSeek-Coder-V2

访问对话官网：coder.deepseek.com，与 DeepSeek-Coder-V2 永久免费畅聊。

访问开放平台：platform.deepseek.com，使用最新 DeepSeek-Coder-V2 API。

DeepSeek 当下与未来

上月 DeepSeek-V2 发布后，深度求索以其卓越的性价比赢得赞誉。但我们的终极目标，始终是打造性能最强大的模型，Coder-V2 的推出，正是向这一愿景迈进的关键一步。我们相信，只有强大的模型能力、普惠的技术应用，才能开启人工智能发展的新篇章。

我们共同的星辰大海是 AGI。

敬请期待，下次发布，未来已来！

本文素材来源DeepSeek，如有侵权请联系删除

END

本篇文章来源于微信公众号: AIGC开放社区

即将举行的活动

联系我们

最新网络研讨会

推荐

AIGC开放社区

加入 AIGC开放社区

AIGCOPEN开放社区是专注于AIGC（生成式人工智能）领域的社区，关注包括微软、OpenAI ChatGPT、百度文心一言、科大讯飞星火、华为盘古等大语言模型（LLM）的发展应用和落地，以及国内LLM的发展和市场&学术研究。社区秉承共享、开放的理念，期待与大家一起共建！