巴比特讯,11 月 2 日,幻方量化宣布“深度求索(DeepSeek)”在成立半年后发布第一代大模型 DeepSeek Coder,1B,7B,33B 全系列模型开源且免费商用。公告显示,DeepSeek Coder 模型有指令 Python 快速写出程序、修改 UI(用户界面)、测试 bug(程序错误)以及数据分析,学写 SQL(数据库语言)等技能。 据介绍,与之前最好的开源大模型 CodeLlama 相比,DeepSeek Coder 在代码生成任务上(使用标准数据集 HumanEval、MBPP 和 DS-1000 进行评测)分别领先 9.3%、10.8% 和 5.9%。其中 DeepSeek Coder 的 70 亿参数版本在代码能力上达到了 CodeLlama 的 340 亿参数水平。经过指令调优后的 DeepSeek Coder 模型更是全面超越了 GPT3.5-Turbo。
(责编: admin)
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:goldenhorseconnect@gmail.com