沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

中国信通院聚焦核心问题 正式开启可信互联网智能体首批测试评估

2026-03-11来源:快讯编辑:瑞雪

中国信息通信研究院近日宣布,将针对互联网智能体领域启动一项全新的测试评估工作。此次评估聚焦用户普遍关注的核心问题,包括功能可信度、权限可靠性、操作透明性以及行为可干预性等关键维度,旨在通过科学严谨的测评体系,推动行业规范化发展。

据了解,该测试体系围绕"能力真实""权限可靠""行为可控"三大核心类别展开,共设置16项主要指标,并细化为70余个具体测评项。评估将根据互联网智能体的不同服务形态进行分类实施,确保测评结果能够全面反映各类产品的实际表现。这种多维度、分层次的评估框架,既保证了测评的全面性,又突出了重点指标的针对性。

首批测试评估工作已正式启动,将按照两类形态、三种类型的分类标准对互联网智能体展开评估。根据安排,2026年3月至4月期间将陆续开展材料审核、技术测试和专家评审等环节,最终评估结果计划于2026年5月在相关产业大会上正式公布。这项工作将为行业提供权威的参考标准,帮助用户更好地识别和选择优质产品。

高通牵手NEURA Robotics,共探机器人“脑+神经系统”新架构促发展
IT之家 3 月 10 日消息,高通与机器人企业 NEURA Robotics 当地时间本月 9日宣布建立长期战略合作,双方将携手推动下一代机器人与物理 AI 的发展,共同开发机器人的“脑 + 神经系统”参…

2026-03-11

荣耀人形机器人Robot亮相MWC 2026,聚焦消费场景展现强大实力
CNMO了解到,当前,荣耀已领先诸多同行一步,成为全球首家正式进军消费级人形机器人市场的手机厂商。技术层面,荣耀Robot机器人搭载了奥比中光的Gemini 330系列双目3D相机,配合自研深度引擎芯片M…

2026-03-11

突破性能极限!我国科学家研发不规则多级孔热电聚合物材料实现新跨越
3月6日,在国家自然科学基金委、中国科学院和北京市政府的支持下,中国科学院化学研究所朱道本/狄重安研究团队与张德清课题组等合作,依托北京分子科学交叉研究平台和分子材料与器件研究测试平台提出并构建了不规则多级…

2026-03-11

中国信通院聚焦核心问题 正式开启可信互联网智能体首批测试评估
据中国信通院,中国信息通信研究院聚焦“功能可信”“权限可靠”“操作透明”“行为可干预”等用户关心的核心问题,正式启动可信互联网智能体测试评估工作,测试体系围绕“能力真实”“权限可靠”“行为可控”三大类16个…

2026-03-11

OpenAI推进AI安全布局:收购Promptfoo强化智能体协作平台安全防护
IT之家 3 月 10 日消息,OpenAI 美国当地时间 9 日宣布,该企业正在收购 AI 安全平台Promptfoo,此次交易的完成须满足惯例成交条件。 OpenAI 表示,Promptfoo 可帮助企…

2026-03-11

周鸿祎谈OpenClaw“龙虾”:创新亮点、使用短板与安全风险全解析
全国政协委员、360集团创始人周鸿祎接受北京日报客户端记者采访时表示,这是了不起的创新,但也有使用门槛过高、结果随机性强、安全风险突出等明显短板。周鸿祎说,“龙虾”与普通AI工具最大的不同在于,是完全属于用户…

2026-03-11