Grok 3 由马斯克旗下人工智能公司xAI于2025年2月18日正式发布的旗舰大模型,被马斯克称为“地球上最聪明的人工智能。

在多个领域测试的分中Grok 3超越Gemini-2 Pro、DeepSeek-V3等主流模型,最高分达96分。当然Grok 3 大模型的训练成本也是史无前例的,该模型基于包含约20万块GPU的孟菲斯数据中心训练完成,算力消耗是DeepSeek V3的263倍,训练量是前代Grok 2的10倍 。

Grok 3

在Chatbot Arena(大模型竞技场)中 Grok 3 得分1402分,成为首个突破1400分的模型,超越GPT-4o和DeepSeek-R1。在编程、数学、创意写作、指令遵循、长查询、多轮对话等多个维度下Grok 3 都取得了第一的成绩。

Grok 3

 

使用平台

目前Grok 系列模型集成在X平台上(原Twitter),X 平台的Premium+订阅用户可优先体验Grok 3。非订阅客户目前可以在x平台体验Grok 2。

Grok 3

大家除了可以在推特上使用,Grok 也已经推出了专属的 Grok.com 网页般,使用X平台账号登录即可使用。

Grok 3

 

产品功能

  1. 多场景推理能力:在数学竞赛(AIME’24)、科学问答(GPQA)及编程测试(LCB Oct-Feb)中得分超越Gemini-2 Pro、DeepSeek-V3等主流模型,最高分达96分29
  2. 深度搜索(DeepSearch):支持联网搜索、数据分析、代码生成与调试,对标OpenAI的“Deep Research”,可生成3D动画代码或混合游戏开发脚本12
  3. 多模态交互:整合文本、图像分析与语音模式(一周后上线),支持语音对话记忆功能19
  4. 智能体能力:通过“Big Brain”模式调用额外算力进行深度思考,解决复杂问题如黎曼猜想

价格

  • 基础服务:X Premium+用户免费使用Grok 3基础版,功能受限,使用次数也有一定的限制。
  • SuperGrok订阅:想要使用更多的功能则需要订阅SuperGrok版本,每月30美元或年付300美元,解锁无限图像生成、DeepSearch高级查询及额外推理额度。

体验评价

从AI行业大牛@Andrej Karpathy 获得早期体验版本了解到,Grok 3 + Thinking 看起来大致处于 OpenAI 最强模型(o1-pro,$200/月)的前沿水平,稍微优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking

 

数据统计

相关导航

暂无评论

暂无评论...
图钉AI助手