沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

OpenAI推出GPT-5.3-Codex:基准测试创新高,成开发者协作新利器

2026-02-06来源:互联网编辑:瑞雪

OpenAI 正式推出新一代编程模型 GPT-5.3-Codex,宣称其在编程能力与开发者协作体验上实现重大突破。该模型在多项基准测试中刷新纪录,同时支持任务执行过程中的实时交互,标志着人工智能从单一编程工具向通用计算机协作者转型。

在性能测试中,GPT-5.3-Codex展现出显著提升。SWE-bench Pro(公开版)测试显示其得分达56.8%,较前代56.4%微幅增长;Terminal-Bench 2.0测试中,成绩从64.0%跃升至77.3%;最引人注目的是OSWorld-Verified智能体计算机操作测试,得分从38.2%飙升至64.7%,证明其在复杂系统环境中的操作能力实现质的飞跃。官方特别强调,新模型运行速度较GPT-5.2-Codex提升25%,在保持精度的同时显著优化效率。

开发者协作模式迎来革命性升级。新模型支持用户在任务执行过程中随时介入引导,通过高频进度更新实现双向对话。开发者可实时提问、调整方案或修正方向,系统能够完整保留上下文信息,避免传统交互中常见的断层问题。这种设计使Codex从被动执行工具转变为具备主动协作能力的智能伙伴,大幅降低应用开发的技术门槛。

技术实现层面,OpenAI重构了模型的任务处理架构。通过动态上下文管理机制,系统在保持长序列记忆能力的同时,实现多轮交互的精准响应。在代码生成测试中,新模型展现更强的环境适应能力,能够根据开发者反馈动态优化输出策略,在复杂项目开发中表现出更强的稳定性。

产品落地方面,GPT-5.3-Codex已全面开放给ChatGPT付费用户,覆盖Plus、Team及Enterprise等订阅层级。用户可通过Codex专用应用、命令行工具、IDE扩展插件及网页端四种方式访问,API接口计划于近期上线。这种多端协同的部署策略,使不同技术背景的开发者都能找到适合的接入方式。

行业观察人士指出,该模型的突破在于重新定义了AI与开发者的协作边界。通过将编程任务分解为可交互的模块化流程,GPT-5.3-Codex使非专业开发者也能参与复杂系统开发,这可能引发软件开发领域的范式转变。随着API接口的开放,预计将催生大量基于该模型的垂直领域应用。

光伏电站环境监测仪:精准监测环境,为电站稳定运行保驾护航
光伏电站环境监测仪是保障光伏电站高效稳定运行的关键设备。它如同一位“智慧卫士”,时刻监测着电站周边的环境状况。 该监测仪功能强大,能精准测量多种环境参数。长期的数据积累有助于分析环境变化对电站的影响,为电站的…

2026-02-06

低轨卫星直连手机能耗远超地面网络?星链DTC能耗深度剖析
其中在通信领域中Minho Jo与Min Chen在2011年就提出在分析通信系统能耗时需考虑基站等通讯设施在建设过程中所涉及到的隐含能,并将基站制造过程中的隐含能和基站运营所消耗的直接能源结合在一起作为基站…

2026-02-06

马斯克布局太空光伏:万亿蓝海启幕,中国光伏企业成关键力量
近日,马斯克在达沃斯论坛上明确了他的太空能源蓝图:SpaceX与特斯拉计划未来三年内在美国建设总计200吉瓦光伏产能,各自承担100吉瓦。 值得注意的是,目前国内光伏企业在太空光伏领域已有所突破。Space…

2026-02-06