达永编程网

程序员技术分享与交流平台

突发!DeepSeek_开源新版_V3,性价比世界第一

突发!DeepSeek开源V3新版,性价比全球居首!

突发!DeepSeek新版V3开源,性价比堪称世界顶尖!

惊爆!DeepSeek开源新V3版,性价比世界领先!

突发!DeepSeek V3新版开源,性价比世界无人能及!

惊闻!DeepSeek开源V3新版,性价比世界独占鳌头!


昨夜,国内大名鼎鼎的大模型平台DeepSeek悄然把V3模型的0324最新版本进行了开源。和以往的情况有所区别,这一回DeepSeek非常低调,不管是国内的公众号,还是国外的社交平台,都没有做任何宣传,只是一声不响地把模型上传到了huggingface。

DeepSeek的全新V3在aider多语言基准测试中的得分达到了55%,相较于之前的版本,其提升幅度相当大。实事求是地讲,此次发布可谓是扭转了局势,再次登上巅峰。从跑分的情况来看,DeepSeek新V3在非思考/推理模型中位居世界第二,仅仅排在Claude Sonnet 3.7之后。从性价比的角度而言,其无疑处于世界首位。

虽然发布时十分低调,不过这一举动很快就引发了国外网友的关注。国外网友经测试发现,V3 - 0324的代码能力是其最为突出的亮点之一。仅仅依靠简单的文本提示,它就能迅速开发出各种各样的网站和App,这种能力能够与当下全球最强大的闭源代码模型Claude 3.7 Sonnet思维链版本不相上下。而且更占优势的是,V3 - 0324不但开源免费,其推理效率也更高。

某网友分享说,新版的V3在不到一分钟的时间里就解开了一道密码谜题,可Sonnet 3.7用了大概5分钟却没能解开。另有网友一次性让V3 - 0324开发一个网站,生成了800多行代码,而且没有任何错误,该网友对其给出“免费、开源、速度超快”的评价,并且觉得开源模型正在推动大公司构建成本更低、性能更好的模型。甚至有网友仅凭一个提示就用V3 - 0324完成了一个登录页面的编码,还惊叹道“我们正在与未来对话”,对它的代码能力大为称赞。

开源地址:

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/tree/main

V3 技术亮点回顾

V3属于一种专家混合模型(Moe),其参数多达6710亿个,其中有370亿个参数处于激活状态。传统的大型模型大多运用密集神经网络结构,每个输入token的处理都要求全部参数被激活,这会造成巨大的算力消耗。在传统的混合专家模型里,专家负载的不平衡常常致使路由崩溃,这就好比交通拥堵让道路陷入瘫痪一样,会妨碍数据的传递,使计算效率降低。通常依靠辅助损失来平衡负载的方法,若辅助损失设置得过大,就会对模型性能造成损害。

DeepSeek在对V3进行创新时,提出了一种无需辅助损失的负载均衡策略,并且引入了“偏差项”。在模型训练期间,会给每个专家都赋予偏差项,然后将其添加到亲和力分数上,以此来决定top - K路由。模型会不断地对训练数据中的专家负载情况进行监测,如果专家负载过重,就会减小偏差项;如果负载过轻,就会增加偏差项,通过这种动态调整的方式,有效地实现专家负载的平衡,从而提升模型的性能。除此之外,V3运用节点受限的路由机制来限制通信成本,保证每个输入最多被发送到预先设定数量的节点,从而减少跨节点的通信流量,提高训练效率,让模型在维持高效的计算 - 通信重叠的同时,能够扩展到更多的节点和专家。

从国外开源评测平台kcores - llm - arena针对V3 - 0324的最新测试数据来看,它的代码能力取得了328.3分,这一分数超越了普通版Claude 3.7 Sonnet的322.3分,能够与思维链版本所获得的334.8分相媲美。

有网友指出,V3 - 0324极有可能是去年年末推出的DeepSeek V3的迭代升级版,就像OpenAI不断更新GPT - 4却不更改模型编号一样。而且,在大量创意写作任务方面,DeepSeek V3相对于R1有着更大的优势,因为其速度更快,能使用户更迅速地进行多次迭代。尽管它存在产生幻觉以及准确性欠佳的问题,不过考虑到人类会对文本加以编辑和审核,所以这一缺陷的影响不大。

自发布之后,DeepSeek V3就在诸多领域彰显出强劲的实力。在像AIME 2024、MATH这样的数学竞赛以及全国高中数学联赛(CNMO 2024)里,它远远超过了其他所有的开源与闭源模型;在中文能力这一方面,在教育类测评C - Eval和代词消歧等评测集上,它的表现和Qwen2.5 - 72B相差无几,而在事实知识C - SimpleQA方面则更具优势。它的训练成本还特别低,仅仅运用2048个H800 GPU,总的训练GPU卡时为2788千小时(其中预训练是2664千小时),平均下来每个GPU是1361小时,大概相当于56.7天,这要比同类模型低得多。

V3 - 0324版本的开源,毫无疑问会给全球的AI开发者带来一个更具威力且成本较低的工具,促使AI技术在更多领域实现创新应用并获得发展,在实际应用中它后续的表现值得人们持续关注。

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言