沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

DeepSeek-V3重磅开源!6710亿参数自研MoE模型引领国产AI新高度

2024-12-27来源:ITBEAR编辑:瑞雪

近日,“深度求索”官方公众号揭晓了一项重要进展,其DeepSeek-V3模型已正式上线并同步开放源代码。用户只需访问chat.deepseek.com官网,便能与这一最新版本的模型进行互动。

据官方介绍,DeepSeek-V3是一个具备6710亿参数的专家混合(MoE)模型,通过多个专家网络将问题空间精细划分为多个同质区域,有效提升了模型的处理能力。该模型在预训练阶段处理了高达14.8万亿的token,并激活了370亿参数。

DeepSeek-V3在多项评测中的表现尤为亮眼,不仅超越了Qwen2.5-72B和Llama-3.1-405B等开源模型的性能,还与世界顶尖的闭源模型GPT-4o和Claude-3.5-Sonnet等相媲美。

在知识、长文本处理、代码生成、数学计算以及中文理解等多个方面,DeepSeek-V3均取得了显著进步。尤其在算法代码和数学问题的处理上,其表现尤为突出。DeepSeek-V3的生成速度也大幅提升至60 TPS,相较于V2.5版本,速度提高了3倍。

为了让更多开发者能够轻松适配和应用DeepSeek-V3,官方不仅开源了原生FP8权重,还提供了BF16转换脚本。目前,SGLang、LMDeploy、TensorRT-LLM和MindIE等多个平台已支持V3模型的推理。

与此同时,DeepSeek还对API服务价格进行了调整。新的定价策略为:每百万输入tokens的价格为0.5元(缓存命中)或2元(缓存未命中),每百万输出tokens的价格为8元。为了让更多用户能够体验到新模型的强大功能,DeepSeek特别设置了长达45天的优惠价格体验期。

从即日起至2025年2月8日,无论是已注册的老用户还是在此期间内注册的新用户,均可享受DeepSeek-V3 API服务的优惠价格,即每百万输入tokens的价格为0.1元(缓存命中)或1元(缓存未命中),每百万输出tokens的价格为2元。

厦门快快网络科技:技术筑盾服务护航,一站式守护企业网络安全防线
其中,高防IP产品采用智能流量清洗技术,可自动识别并过滤恶意攻击流量,支持弹性防护带宽从10Gbps至1Tbps按需升级;服务器托管服务提供多线BGP机房资源,确保全国用户访问延迟低于50ms;DDoS防护方…

2026-01-03

2026无人机新规落地:从“野蛮生长”到有序飞行的进阶指南
根据新修订的《民用航空法》,从事民用无人驾驶航空器的设计、生产、进口、维修和飞行活动,需要向民航主管部门申请取得适航许可。山东省自2026年1月1日起施行的《山东省民用无人驾驶航空器公共安全管理办法》,明确规…

2026-01-03

捷途旅行者CDM:硬派造型邂逅智能科技,多元场景出行一步到位
捷途旅行者CDM融合硬派设计与智能科技,提供极致舒适与强劲动力,全面满足多元出行需求。

2026-01-03

石头科技再获突破:自移动设备与充电桩自主充电系统专利获批
国家知识产权局信息显示,北京石头世纪科技股份有限公司取得一项名为“一种自移动设备、充电桩及自主充电系统”的专利,授权公告号CN114665544B,申请日期为2022年3月。 天眼查资料显示,北京石头世纪科技…

2026-01-03