沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

亚马逊2026 Nova AI挑战赛启幕:聚焦可信软件智能体开发新赛道

2026-01-23来源:快讯编辑:瑞雪

生成式人工智能正以颠覆性姿态重塑全球产业格局,软件开发领域成为这场变革的核心战场。从代码片段生成到全流程应用开发,AI技术不仅重构了开发范式,更催生出对系统可信度的全新要求——当智能体开始自主规划、执行并验证代码库变更时,如何确保其兼具高效性与安全性,已成为行业亟待突破的关键命题。

亚马逊近日宣布启动2026年度Amazon Nova AI挑战赛,这项面向全球高校的年度竞赛将聚焦软件工程领域的可信智能体开发。赛事特别设置"开发团队"与"红队"双赛道:前者需构建具备防御机制与可靠性的智能编码系统,后者则通过压力测试挖掘系统漏洞。评估体系首次采用"双维度计分制",要求参赛方案在完成复杂开发任务的同时,必须通过严格的安全验证。

"当AI从辅助工具进化为开发主体,我们需要的不仅是更聪明的算法,更是能经得起现实考验的稳健系统。"亚马逊AGI高级副总裁罗希特·普拉萨德(Rohit Prasad)指出,"今年的竞赛设计直指行业痛点——如何在提升模型处理复杂任务能力的同时,构建与之匹配的安全防护体系。"

本年度赛事呈现三大核心特征:其一,突破传统代码生成模式,要求参赛团队开发具备多步骤决策能力的智能体系统;其二,创新引入"安全权重"评估指标,将系统防护能力与功能实现效率置于同等地位;其三,测试用例全部取自真实工程场景,涵盖代码重构、功能迭代等典型开发流程。

竞赛流程方面,2025年11月10日将正式开放申请通道,全球高校团队可通过YouNoodle平台提交方案。经过筛选的十支入围队伍将获得亚马逊提供的专属资源支持,并在整个学年内完成系统开发与测试。最终评选不仅参考实验室数据,更将通过现场锦标赛验证系统在实际工程环境中的表现。

针对参赛者普遍关注的平衡性问题,赛事组委会特别强调:"真正的技术突破不在于单项指标的突破,而在于构建实用性与安全性的动态平衡。当智能体处理的任务复杂度提升时,其安全防护机制必须同步进化,这将成为评判系统优劣的核心标准。"

据技术白皮书披露,本届竞赛测试基准包含三大类场景:跨文件代码修改、第三方库集成、用户交互功能开发。每个场景均设置"功能完成度"与"安全合规性"双重评分维度,要求智能体在实现需求的同时,必须自动生成安全审计报告并通过预设防护机制检测。

目前,全球已有超过200所高校的技术团队表示关注。赛事技术委员会成员透露,部分参赛队伍已开始探索将形式化验证方法与大语言模型相结合的技术路径,试图从底层架构层面解决可信度难题。这场汇聚全球青年才俊的技术角力,或将为智能软件开发领域带来突破性进展。

宇树科技2025人形机器人成绩单:实际出货超5500台 本体量产下线超6500台
IT之家 1 月 22 日消息,宇树科技今日发布关于宇树 2025 年销量数据的澄清表示,过去一个月,网上流传着很多关于该公司 2025年出货数量的不实信息。宇树此前从未对外告知过 2025 年的销售数据。…

2026-01-23

复旦科研新突破:“纤维芯片”落地,为脑机接口等新兴领域发展注入新动力
该成果有望为纤维电子系统的集成提供新的路径,有望实现从“嵌入”到“织入”的转变,助力脑机接口、电子织物、虚拟现实等新兴领域的变革发展。目前,脑机接口的神经探针需连接外部信号处理模块,基于“纤维芯片”,可在直…

2026-01-23

马斯克达沃斯首秀:AI或明年超越人类智能,机器人时代与经济新图景将至
他预测,到2026年底甚至最迟2027年底,AI将出现比任何单个人类都更聪明的系统;而在5年内,AI有可能超越全人类的集体智能。 随着AI、机器人和能源议题主导2026年全球议程,马斯克的表态为未来5–10年…

2026-01-23