沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

OpenAI GPT-4.1系列发布:编程王者归来,百万tokens上下文处理新高度

2025-04-15来源:ITBEAR编辑:瑞雪

OpenAI公司近期宣布了一项重要更新,推出了GPT-4.1系列模型,这一消息引起了业界的广泛关注。此次发布的模型包括GPT-4.1、GPT-4.1 mini以及GPT-4.1 nano,它们通过API的形式向开发者开放。

据悉,GPT-4.1系列模型在多个方面相较于前代GPT-4o及其小型版本GPT-4o mini有了显著提升。特别是在编程能力、指令遵循以及长文本理解上,GPT-4.1系列模型展现出了更为卓越的性能。这些模型的上下文窗口支持高达100万tokens,且知识库已更新至2024年6月,确保了信息的时效性和准确性。

值得注意的是,目前GPT-4.1系列模型仅通过开发者API提供,普通用户暂时无法直接在ChatGPT页面上体验这些新模型。这一举措显示了OpenAI对开发者社区的重视,以及其在推动AI技术发展和应用方面的决心。

在编程方面,GPT-4.1模型相较于GPT-4o模型,代码生成速度提升了40%,同时用户输入查询的成本降低了80%。这一显著的改进使得GPT-4.1在编程领域具有更高的效率和更低的成本,为开发者提供了更为强大的工具。

GPT-4.1系列模型在多项基准测试中均表现出色。在编程测试SWE-bench Verified中,GPT-4.1得分54.6%,较GPT-4o提升了21.4个百分点。在指令遵循测试MultiChallenge中,GPT-4.1也提升了10.5个百分点。而在多模态长文本测试Video-MME中,GPT-4.1更是创下了72.0%的新纪录。这些测试结果表明,GPT-4.1系列模型在多个领域都具有卓越的性能。

除了GPT-4.1之外,GPT-4.1 mini和nano也展现了小型模型的巨大潜力。GPT-4.1 mini在多项基准测试中媲美甚至超越了GPT-4o,同时延迟降低了近一半,成本减少了83%。而GPT-4.1 nano作为最快、最经济的选择,拥有100万token的上下文窗口,在MMLU测试中得分80.1%,适合分类和自动补全任务。

GPT-4.1系列模型在实际应用中同样表现出色。例如,在Windsurf测试中,GPT-4.1在编程效率上提升了30%,减少了50%的不必要编辑。而在Thomson Reuters的法律AI助手CoCounsel中,使用GPT-4.1后,多文档审查准确率提升了17%。这些实际应用案例进一步证明了GPT-4.1系列模型的强大性能和广泛应用前景。

然而,随着GPT-4.1系列模型的发布,OpenAI产品命名的复杂性也进一步加剧。ChatGPT目前已包含多种模型选项,如GPT-4o、GPT-4o mini、o1-pro等。OpenAI首席执行官山姆·奥尔特曼早在2024年2月就承认了命名问题,并计划通过未来的GPT-5整合品牌,以缓解命名混乱。同时,OpenAI还计划在2025年7月前逐步淘汰API中的GPT-4.5 Preview模型。

在价格方面,GPT-4.1模型每100万tokens输入费用为2美元(约合14.6元人民币),每100万tokens输出费用为8美元(约合58.3元人民币)。相较于GPT-4o,GPT-4.1在提供更强悍性能的同时,还便宜了26%。而GPT-4.1 nano则是OpenAI最便宜、最快的模型,为开发者提供了更为经济高效的解决方案。

Valve推出Steam Frame新VR头显 正式宣告上一代Index头显停产
用户可通过无线适配器,将 PC 或 Steam Machine 上的平面屏(flatscreen)及 VR 游戏串流至 SteamFrame;与此同时,Steam Frame 本身也是一款独立设备,搭载高通…

2025-11-14

2025网购流量卡选购指南:不同场景实测教你选到网速稳的好卡
所以,简单概括一下:一张正规的网购流量卡,其网速表现与同运营商的线下套餐并无本质差异。 在流量卡领域,我认为“便宜”不一定直接等于“网速差”。•警惕“物联卡”冒充手机流量卡

2025-11-13

中国电信AI赋能6G发展:创新技术引领通信变革,拓展产业融合新路径
中电信数智科技有限公司“一种基于6G的天地一体化传输优化及拓扑测绘的方法”获国家发明专利授权,这项专利涵盖卫星与地面网络协同通信、频谱资源共享、高效信号传输等多个核心技术领域,为6G的落地应用铺设了一条“高…

2025-11-12

照片压缩至5M内超全指南!七大实用方法助你轻松搞定分享难题
具体的执行步骤是:将它们直接开启,随后去挑选照片,该应用会自动给出推荐的压缩级别,你能去预览最终结果,还能够对某些设置予以调整,比如把分辨率调低或者转换格式,借此令文件大小小于5MB,这对即时分享至社交媒体来…

2025-11-12

企业宽带选不对,带宽再大也白费!这些关键因素决定实际网速
• 网速(用户感知):即实际访问体验,取决于 3 个核心因素 —— 带宽只是基础,更重要的是网络质量、路由优化和并发处理能力。 真正专业的服务商,会从企业实际业务场景出发提供解决方案,而非一味推销高带宽产品…

2025-11-12

荣旭传媒技术破局:以专业方案化解直播痛点,成就高性价比之选
传统方案在视频、音频和网络方面存在诸多不足,而荣旭传媒通过先进的技术和专业的设备,有效解决了这些问题。传统方案的视频分辨率较低,画面不够清晰,而荣旭传媒的4K 超高清视频拍摄制作让画面质量有了质的提升;传统…

2025-11-12

Marantz与B&W组合:以多元功能承载家庭温情,让音乐共鸣融入日常
我在活动上最常遇到来宾,不管是男的,还是女的,他(她)问我:我手机上这些音乐能不能通过蓝牙,或Apple Airplay传到音响播放。 用高级音响回归音乐本身你会发现原来美好的东西就在身边最近我在电脑里找到了…

2025-11-12