首页 > 教程攻略 > ai资讯 >Grok3完全指南：马斯克将OpenAI里外复刻了遍（附XAI $150API获取方式）

Grok3完全指南：马斯克将OpenAI里外复刻了遍（附XAI $150API获取方式）

来源：互联网时间：2026-05-29 21:26:07

原文本质是围绕Grok3发布的一篇技术评测与体验指南，涉及模型能力、API获取、实际测试和产品分析。下面我将按照您的要求，删除所有第三方推广、引流、账号信息，保留所有核心事实、数据、图片和章节结构，同时将全文改写为更有“人味儿”但不失专业性的行业分析风格。文中第一人称使用控制在1处（开篇引子），避免过度主观。 ---

先说几个核心判断：马斯克这次是真的急眼了。收购OpenAI无果后，他直接把Grok3拍了出来，还号称是“地表最强AI模型”。这发布方式，怎么看着有点眼熟？从时间线到产品分类，简直是把OpenAI的套路从头到尾复刻了一遍。当然，里面的硬货也不少，特别是那个“翻倍订阅费+每月$150 API额度”的操作，倒是挺马斯克的。

这里先整理一个浓缩版，十四条信息基本能把Grok3现阶段的所有底牌说清楚：

Grok3沿用了OpenAI的模型分层策略：两个基础版本（Grok3和Grok3 mini），外加两个推理版本——Grok3 Reasoning(Beta)是满血版，但仍在测试阶段；Grok3 mini Reasoning更成熟，用部分精度换了响应速度。
目前可以通过grok.com直接体验。想免费试水的，可以先去lmarena.ai玩玩。
在LMSYS排行榜上一骑绝尘，是首个突破1400分的模型，所有类别排名第一。AIME（数学）96分，GPQA（科学）85分，跟完整版o3不相上下。
采用跟OpenAI o系列类似的模糊思维链，不会展示原始思考过程。防蒸馏嘛，行业共识。
AI大神Andrej Karpathy实测结论：Grok3的思考能力大致处于o1-pro（$200/月那档）的水平，优于DeepSeek-R1和Gemini 2.0 Flash Thinking。开启强思考模式后，Grok3 Reasoning(Beta)在AIME 2025上的表现甚至高于o3-mini-high。
Grok3的计算量是Grok2的10倍，是DeepSeek V3的263倍，今年1月才完成预训练。
Grok2将在几个月后开源——感谢DeepSeek，让Grok1.5之后已经闭源的模型又重新回到了开源社区。
背后的硬件是名为Colossus的集群，由20万块Nvidia H100 GPU组成，力大砖飞的典型代表。
除了Grok模型，这次还推出了DeepSearch，名字跟OpenAI很像，但体验感更像联网版的DeepSeek R1。
语音模式将在后续推出，并且支持多模态，不会是简单的语音合成。
X Premium+用户可以率先使用Grok 3。但价格嘛……从$22涨到$40，涨幅45%，这点倒是不太像OpenAI，他们至少不敢这么定价。
马斯克还单独推出了SuperGrok订阅计划，每月$30或每年$300。但说句实话，现阶段还是OpenAI和DeepSeek更有性价比。
目前Premium+和SuperGrok在配额上的差异细节还没公布，想尝鲜的话，Premium+是更推荐的选择。
xAI估值已达$750亿，接近OpenAI估值的一半。

接下来，来看看它在具体测试中的表现吧，有没有水分？

从基础模型的性能上看，Grok3相比各家基础模型，确实有了一次明显的飞跃。

虽然Grok3的表现证明Scaling Law仍然有效，但那张对比图多少有点误导性。AIME（数学）的蓝色和浅蓝色差距不小，如果不开启sampling，Grok3推理版应该跟R1在同一水平线上。

一、领取xAI $150 API额度

详细的实测演示放后面，先把马斯克的羊毛薅了。每个月$15额度的API，只要Grok3的定价不过分离谱，个人日常使用完全够了。

操作步骤很简单：

访问 console.x.ai，选个顺手的登录方式就行。

在Payment Setting里填好Business details和Billing address。

点击侧边栏的Credits，在Prepaid credits里充值$5。

在同一页面点击Share data——这意味着你将个人数据分享给xAI使用，每月能获得$150 credits。

二、基础编程

拿到API后，等着Grok3上线就行。发布会上关于数学、科学的展示直接用了分数图表，所以这里从编程、物理模拟、DeepSearch和语音模式几个维度，来进一步拆解Grok3的真实能力。

马斯克对AI游戏很看好，直播中透露后续会做一个AI游戏社区。现场演示时，他用Grok把《俄罗斯方块》和《宝石迷阵》融合在一起，创造了一个全新的混合游戏。

这个思路挺有意思——不是复刻已有游戏，而是“创作”一个混合体。不过难度也确实不小，直播过程中好几次卡在思考环节。好在最后一次尝试，Grok3成功做出了demo。AI正确理解了元素融合：游戏规则不再是传统俄罗斯方块里“排满一行消掉一行”，而是融合了宝石迷阵的规则，实现了三个同色方块凑在一起就能消除。这个理解力，值得点个赞。

三、物理世界模拟

除了做游戏，Grok3还尝试了最近很火的代码模拟世界。这次跟SpaceX联动了一把——让Grok3生成一段飞行器从地球发射到火星再返回地球的3D动画。不过后续有人验证，按这个动画的参数，飞行器连地球都飞不出去……

那在2D维度下，Grok3的物理模拟表现如何？

至少从已有的复刻结果来看，Grok3的编码能力并没有想象中那么强……Claude的含金量，还在涨。

四、UI很好看的DeepSearch

再说说DeepSearch。第一次听到这个名字的时候，第一个念头就是：你们是不是真没新名字可用了？“Deep Search”和“Deep Research”来回用是吧？

名字虽然很OpenAI，但实际体验更偏向搜索，而不是做研究报告。现阶段AI搜索的关键在于信息源。根据之前体验Grok2的经验，Grok3加上X平台的信息源，确实能给OpenAI的AI Search带来实质性威胁。如果在额度上能再提升一些，$30的套餐也不是不能接受。

现场展示的环节里，Grok3被要求预测NCAA疯狂三月赛事的胜负。这个活动是巴菲特2014年发起的，历史上无人成功过——抄答案都没地方抄。

从实际演示来看，DeepSearch在UI上确实下了功夫。侧边栏有一个任务面板，可以实时监控正在进行的任务——跟OpenAI Operator的侧边栏有点像。

五、反复跳票的语音模式

语音模式真是一波三折。去年8月马斯克就预告要在24年底发布，结果一直拖到这次发布会前一个小时，还临时取消发布，改成未来一周后灰度更新。

发布会最后放了一段男声作为“饼”，但时间太短，很难评价质量。期待一下中文语音的表现吧。

写在最后

马斯克这波发布会对Grok的改动非常大。之前我对Grok的定位是“有幽默感的AI，再附带一个画人物图很准的功能”。但这次，基础模型、推理模型、语音模型、AI搜索全部装上了，基本追平了OpenAI的配置。以至于奥特曼在发布会前都有点心痒痒——虽然没发新模型，但还是搞了个投票，计划后续开源“o3-mini层级的模型”还是“端侧模型”。

回顾一下时间线：2023年，马斯克发布33B的Grok 0，性能比肩70B的Llama 2；11月又发了Grok 1。2024年，发布了Grok 1.5和Grok 2，还有多模态模型Grok-1.5V。到现在Grok3，xAI的追赶速度确实很快。这么看来，马斯克大概不用再半夜想着收购OpenAI了。