DeepSeek联合北大发布新论文梁文锋参与推理加速框架DSpark提升大模型速度-财经-沃资讯

当行业热议大模型智能水平时，DeepSeek选择将技术突破口对准推理效率这一关键痛点。这家人工智能企业联合北京大学研发的DSpark框架，通过创新性的半自回归架构，成功破解了大语言模型在高并发场景下的性能瓶颈。

在GitHub最新发布的论文中，研究团队揭示了现有技术路线的局限性。传统自回归模型因逐词生成机制导致GPU利用率低下，而并行草稿模型虽提升吞吐量却牺牲了生成质量。更关键的是，现有方案均未建立动态负载调节机制，无法适应实时对话等低延迟场景的复杂需求。

DSpark框架的创新之处在于构建了混合计算架构。其核心模块包含两种实现路径：马尔可夫头通过捕捉前一词元信息实现局部依赖，RNN头则通过循环状态累积完整上下文。这种设计既保留了并行计算的高效性，又通过轻量级串行模块确保语义连贯性。实验数据显示，两层Transformer结构的DSpark在生成长度指标上已超越五层DFlash模型。

技术突破迅速转化为实际应用。在DeepSeek-V4在线服务系统中，DSpark框架展现出显著优势：在维持相同吞吐量的前提下，用户端文本生成速度提升60%-85%。这种提升在智能客服、多轮对话等场景中尤为明显，有效缩短了用户等待时间。

开源社区同步迎来重要资源更新。研究团队不仅开放了DSpark模型权重，还发布了基于算法驱动的训练代码库DeepSpec。第三方测试显示，该框架在阿里Qwen3系列模型上表现突出：4B、8B、14B版本的可接受词元长度分别提升30.9%、26.7%、30%，相较并行草稿模型也有16%-18%的改进。

值得关注的是，DeepSeek创始人梁文锋直接参与了这个跨学科项目。这种产学研深度合作模式，为框架在工程实现与理论创新之间找到了平衡点。随着DSpark代码的全面开源，大模型推理效率的优化或将进入新的竞争阶段。

中国电信携手多方完成6G星地协同组网试验攻克关键技术难题

6月27日消息，近日，中国电信研究院与上海电信、中电信应急公司协同，携手清华大学、上海清申科技，依托云网融合中试平台的实星接入验证能力，完成面向6G的高轨、中轨与地面协同组网技术试验，实现“高轨全天时可靠通信…

2026-06-28

河北金融监管局核准刘泰任邯郸银行董事及董事长任职资格获官方认可

2026-06-28

B站17周年陈睿发声：内容过剩时代社区成优质内容生长沃土

2026-06-28

苹果Vision Pro项目核心高管保罗·米德下周离职，将转投OpenAI硬件部门

最近一段时间，他主要负责推进 AI 智能眼镜项目，并领导 AR 眼镜开发团队。现任 Vision Pro 与智能眼镜产品设计负责人弗莱彻 ·罗斯科夫（IT之家注：Fletcher Rothkopf）将接手他…

2026-06-28

欧朗科技冲刺北交所IPO：实控人夫妇控股超六成董事长弟弟离任副总经理仍持股

2026-06-28

DeepSeek联合北大发布DSpark框架：突破推理瓶颈速度提升最高达85%

2026-06-28

超力电器冲刺北交所IPO：实控人家族主导，正副董事长与90后董秘薪酬曝光

2026-06-28

山东临时供电需求旺，不同场景如何精准挑选适配的租赁发电车？

选择供电租赁服务时，可从几个核心维度进行评估：首先是设备参数覆盖范围，需要确认服务商可提供的设备功率区间是否匹配自身的用电负荷，避免出现功率不足或资源浪费的情况；其次是设备的安全性能，是否搭载过压、过流、防…

2026-06-28

DeepSeek联合北大发布新论文 梁文锋参与 推理加速框架DSpark提升大模型速度

DeepSeek联合北大发布新论文梁文锋参与推理加速框架DSpark提升大模型速度