马斯克xAI新模型Grok 4.2公测：能力毁誉参半，每周迭代能否逆袭？-游戏-沃资讯

在经历高层人事变动与多次跳票后，马斯克旗下xAI公司推出的Grok 4.2大模型终于以公测Beta版形式上线。这款参数规模为500B的模型在发布后迅速引发两极分化评价，既有用户盛赞其多模态能力，也有人质疑其性能与宣传存在差距。

马斯克在社交平台X上展开密集公关行动，连续转发十余条夸赞Grok 4.2的推文，并亲自发文强调："公测将持续至下个月，正式版将比Grok 4快得多、聪明得多。目前已知存在许多bug，团队正在每日修复。"他特别指出，新模型具备每周自我迭代能力，未来将形成常态化更新机制。

这款被马斯克称为"无偏见模型"的产品，实际测试中却暴露出显著倾向性。有开发者通过特定测试发现，Grok 4.2的回答风格与马斯克本人高度契合，引发关于模型中立性的讨论。更引发争议的是，在处理高难度逻辑推理任务时，500B参数规模被指难以支撑复杂计算需求，部分场景表现甚至不及参数规模更大的竞品。

技术层面仍存在诸多谜团。xAI至今未公布完整技术报告，仅在排行榜展示部分评测数据。据AI工程师Mark Krechman透露，当前版本属于"轻量级"测试版，中大型版本仍在开发中，该说法已获马斯克转发确认。值得关注的是，新模型引入的实时反馈优化机制，使其具备类似人类的实践学习能力。

在具体应用场景测试中，Grok 4.2展现出特殊优势。面对国内AI圈流行的"50米外洗车店"逻辑谜题，该模型给出符合预期的解决方案。更引发关注的是其通过"Caitlyn Jenner测试"的表现——当被问及跨性别者称谓问题时，Grok 4.2给出符合语境的回答，而ChatGPT和Gemini此前在该测试中均出现争议性回应。

伴随公测启动，xAI同步推出Grok imagine视频生成模板，目前仅限iOS用户使用。这款新工具的推出，显示出xAI在多模态领域的持续布局。尽管马斯克对Grok 4.2充满信心，但市场观察人士指出，在OpenAI、Anthropic等竞争对手持续发力的背景下，xAI仍需解决模型性能、开发透明度等关键问题。

从“千问帮我”到生活日常：AI深度融入开启万亿消费新图景

2026-02-19

从海鲜小老板到商业巨擘：中国首位手机用户徐峰的传奇与时代印记

在多次前往香港的过程中，他注意到对方的商人们手中都拿着一种黑色的大盒子在打电话，这让他不禁产生了浓厚的兴趣，心中默想着：如果我也能拥有这样的通讯工具，那该多好啊！随着时间推移，徐峰那部大砖头式的手机引起…

2026-02-19

黄仁勋忆往昔：众人对AI持观望时马斯克独具慧眼坚定力挺

2026-02-19

英伟达与Meta深化合作：数百万GPU部署携手推进AI前沿发展

Meta和英伟达继续合作，在其数据中心生产应用中部署基于 Arm 的英伟达Grace™ CPU，以提升性能，这是 Meta长期基础设施战略的一部分，旨在显著提高其数据中心的每瓦性能。两家公司还在合作部署…

2026-02-19

春晚舞台展科技魅力 12架国产中大型无人机首次集群惊艳亮相

在人工影响天气领域，该型无人机突破了复杂气象与地理条件的限制，攻克了无人机防除冰系统关键技术，在森林防灭火、生态修复、应急抗旱、增蓄保供、重大活动保障上，已成为防灾减灾与资源保障的重要支撑。报道称，本次集…

2026-02-19

春晚舞台见证中国民企机器人“进化”：技术创新赋能多元应用场景

据悉，该公司自去年11月开始筹备春晚节目以来，先后攻克导航定位、轨迹追踪、环境交互等难点，为应对春晚舞台与高难动作中的种种不确定性，机器人在算法、硬件、系统层面都得到了提升。 “这些技术突破不仅支撑了武术呈…

2026-02-19

比亚迪纯电K-Car海獭内饰官图亮相！2026年登陆日本市场售价约11万

2026-02-19

特斯拉Cybercab提前投产，马斯克发文祝贺，加州销售禁令同步解除

2026-02-19