首页 > 教程攻略 > ai资讯 >Grok3完全指南:马斯克将OpenAI里外复刻了遍(附XAI $150API获取方式)

Grok3完全指南:马斯克将OpenAI里外复刻了遍(附XAI $150API获取方式)

来源:互联网 时间:2026-05-29 21:26:07
原文本质是围绕Grok3发布的一篇技术评测与体验指南,涉及模型能力、API获取、实际测试和产品分析。下面我将按照您的要求,删除所有第三方推广、引流、账号信息,保留所有核心事实、数据、图片和章节结构,同时将全文改写为更有“人味儿”但不失专业性的行业分析风格。文中第一人称使用控制在1处(开篇引子),避免过度主观。 ---

先说几个核心判断:马斯克这次是真的急眼了。收购OpenAI无果后,他直接把Grok3拍了出来,还号称是“地表最强AI模型”。这发布方式,怎么看着有点眼熟?从时间线到产品分类,简直是把OpenAI的套路从头到尾复刻了一遍。当然,里面的硬货也不少,特别是那个“翻倍订阅费+每月$150 API额度”的操作,倒是挺马斯克的。

这里先整理一个浓缩版,十四条信息基本能把Grok3现阶段的所有底牌说清楚:

  1. Grok3沿用了OpenAI的模型分层策略:两个基础版本(Grok3和Grok3 mini),外加两个推理版本——Grok3 Reasoning(Beta)是满血版,但仍在测试阶段;Grok3 mini Reasoning更成熟,用部分精度换了响应速度。
  2. 目前可以通过grok.com直接体验。想免费试水的,可以先去lmarena.ai玩玩。
  3. 在LMSYS排行榜上一骑绝尘,是首个突破1400分的模型,所有类别排名第一。AIME(数学)96分,GPQA(科学)85分,跟完整版o3不相上下。
  4. 采用跟OpenAI o系列类似的模糊思维链,不会展示原始思考过程。防蒸馏嘛,行业共识。
  5. AI大神Andrej Karpathy实测结论:Grok3的思考能力大致处于o1-pro($200/月那档)的水平,优于DeepSeek-R1和Gemini 2.0 Flash Thinking。开启强思考模式后,Grok3 Reasoning(Beta)在AIME 2025上的表现甚至高于o3-mini-high。
  6. Grok3的计算量是Grok2的10倍,是DeepSeek V3的263倍,今年1月才完成预训练。
  7. Grok2将在几个月后开源——感谢DeepSeek,让Grok1.5之后已经闭源的模型又重新回到了开源社区。
  8. 背后的硬件是名为Colossus的集群,由20万块Nvidia H100 GPU组成,力大砖飞的典型代表。
  9. 除了Grok模型,这次还推出了DeepSearch,名字跟OpenAI很像,但体验感更像联网版的DeepSeek R1。
  10. 语音模式将在后续推出,并且支持多模态,不会是简单的语音合成。
  11. X Premium+用户可以率先使用Grok 3。但价格嘛……从$22涨到$40,涨幅45%,这点倒是不太像OpenAI,他们至少不敢这么定价。
  12. 马斯克还单独推出了SuperGrok订阅计划,每月$30或每年$300。但说句实话,现阶段还是OpenAI和DeepSeek更有性价比。
  13. 目前Premium+和SuperGrok在配额上的差异细节还没公布,想尝鲜的话,Premium+是更推荐的选择。
  14. xAI估值已达$750亿,接近OpenAI估值的一半。

接下来,来看看它在具体测试中的表现吧,有没有水分?

  • 从基础模型的性能上看,Grok3相比各家基础模型,确实有了一次明显的飞跃。
  • 虽然Grok3的表现证明Scaling Law仍然有效,但那张对比图多少有点误导性。AIME(数学)的蓝色和浅蓝色差距不小,如果不开启sampling,Grok3推理版应该跟R1在同一水平线上。

一、领取xAI $150 API额度

详细的实测演示放后面,先把马斯克的羊毛薅了。每个月$15额度的API,只要Grok3的定价不过分离谱,个人日常使用完全够了。

操作步骤很简单:

  1. 访问 console.x.ai,选个顺手的登录方式就行。
  1. 在Payment Setting里填好Business details和Billing address。
  1. 点击侧边栏的Credits,在Prepaid credits里充值$5。
  1. 在同一页面点击Share data——这意味着你将个人数据分享给xAI使用,每月能获得$150 credits。

二、基础编程

拿到API后,等着Grok3上线就行。发布会上关于数学、科学的展示直接用了分数图表,所以这里从编程、物理模拟、DeepSearch和语音模式几个维度,来进一步拆解Grok3的真实能力。

马斯克对AI游戏很看好,直播中透露后续会做一个AI游戏社区。现场演示时,他用Grok把《俄罗斯方块》和《宝石迷阵》融合在一起,创造了一个全新的混合游戏。

<iframe src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3865104554018390023"></iframe>

这个思路挺有意思——不是复刻已有游戏,而是“创作”一个混合体。不过难度也确实不小,直播过程中好几次卡在思考环节。好在最后一次尝试,Grok3成功做出了demo。AI正确理解了元素融合:游戏规则不再是传统俄罗斯方块里“排满一行消掉一行”,而是融合了宝石迷阵的规则,实现了三个同色方块凑在一起就能消除。这个理解力,值得点个赞。

三、物理世界模拟

除了做游戏,Grok3还尝试了最近很火的代码模拟世界。这次跟SpaceX联动了一把——让Grok3生成一段飞行器从地球发射到火星再返回地球的3D动画。不过后续有人验证,按这个动画的参数,飞行器连地球都飞不出去……

<iframe src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3865105260876300292"></iframe>

那在2D维度下,Grok3的物理模拟表现如何?

<iframe src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3865078794683842561"></iframe>

至少从已有的复刻结果来看,Grok3的编码能力并没有想象中那么强……Claude的含金量,还在涨。

四、UI很好看的DeepSearch

再说说DeepSearch。第一次听到这个名字的时候,第一个念头就是:你们是不是真没新名字可用了?“Deep Search”和“Deep Research”来回用是吧?

名字虽然很OpenAI,但实际体验更偏向搜索,而不是做研究报告。现阶段AI搜索的关键在于信息源。根据之前体验Grok2的经验,Grok3加上X平台的信息源,确实能给OpenAI的AI Search带来实质性威胁。如果在额度上能再提升一些,$30的套餐也不是不能接受。

现场展示的环节里,Grok3被要求预测NCAA疯狂三月赛事的胜负。这个活动是巴菲特2014年发起的,历史上无人成功过——抄答案都没地方抄。

<iframe src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3865105666280931331"></iframe>

从实际演示来看,DeepSearch在UI上确实下了功夫。侧边栏有一个任务面板,可以实时监控正在进行的任务——跟OpenAI Operator的侧边栏有点像。

五、反复跳票的语音模式

语音模式真是一波三折。去年8月马斯克就预告要在24年底发布,结果一直拖到这次发布会前一个小时,还临时取消发布,改成未来一周后灰度更新。

<iframe src="https://mp.weixin.qq.com/mp/readtemplate?t=pages/video_player_tmpl&action=mpvideo&auto=0&vid=wxv_3865106364045262851"></iframe>

发布会最后放了一段男声作为“饼”,但时间太短,很难评价质量。期待一下中文语音的表现吧。

写在最后

马斯克这波发布会对Grok的改动非常大。之前我对Grok的定位是“有幽默感的AI,再附带一个画人物图很准的功能”。但这次,基础模型、推理模型、语音模型、AI搜索全部装上了,基本追平了OpenAI的配置。以至于奥特曼在发布会前都有点心痒痒——虽然没发新模型,但还是搞了个投票,计划后续开源“o3-mini层级的模型”还是“端侧模型”。

回顾一下时间线:2023年,马斯克发布33B的Grok 0,性能比肩70B的Llama 2;11月又发了Grok 1。2024年,发布了Grok 1.5和Grok 2,还有多模态模型Grok-1.5V。到现在Grok3,xAI的追赶速度确实很快。这么看来,马斯克大概不用再半夜想着收购OpenAI了。

相关下载