超Llama 3、精通80种编程语言,开源代码模型Codestral

添加书签

5月30日,著名大模型开源平台Mistral.ai宣布推出,第一个专业代码模型Codestral-22B-v0.1。

据悉,Codestral有220亿参数,支持32K上下文窗口,使用了80多种编程语言数据集进行了预训练,例如,Python、Java、C、C++、JavaScript等。

Codestral可提供代码生成、解释代码、编写注释文档、BUG调试、代码优化等,几乎所有与代码开发相关的任务。

开源地址:https://huggingface.co/mistralai/Codestral-22B-v0.1

性能方面,Codestral凭借超大的32K上下文窗口,在HumanEval、MBPP、CruxEval-O、RepoBench等知名测试平台的结果,超过了CodeLlama 70B、DeepSeek Coder 33B和Llama 3 70B目前比较知名的纯代码模型。

此外,在特定代码测试领域,Codestral的Python、C++、bash、Java和PHP的能力同样非常强,所以,这也算是当前最好的纯代码模型之一。

需要注意的是,目前Codestral只能用于学术研究和测试,无法实现商业化。

本文素材来源Mistral.ai官网,如有侵权请联系删除