马斯克,正面对决OpenAI、DeepSeek
迪丽瓦拉
2025-02-19 08:01:23
0

作 者丨倪雨晴

编 辑丨张铭心

在AI的牌桌上,埃隆·马斯克(Elon Musk)从不缺席。

太平洋时间2月17日,马斯克旗下人工智能初创公司xAI的大模型Grok-3正式面世。发布会上,xAI展示了一系列家族,包括Grok-3(Beta)、Grok-3 mini、首个推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning。

同时,xAI还推出了名为Deepsearch的智能搜索引擎Agent工具。从大模型到AI搜索应用,xAI紧跟竞品步伐通通上线。时常“一线冲锋”的马斯克,正加速在AI赛场上奔跑。

在预告中,马斯克将Grok-3标榜为“地球上最聪明的人工智能”。根据xAI展示的数据, Grok-3在多项基准测试中超越了DeepSeek-V3、Gemini-2 Pro、GPT-4o,刷新最新成绩。

在大模型的你追我赶中,AI的细分赛道上,最聪明的AI不断易主。这场“不进则退”的残酷竞赛中,马斯克也着急了。上周他还表示,为了提供最好的用户体验,xAI还在打磨产品,还需要一两周的时间。

但是面对新贵DeepSeek和劲敌OpenAI,马斯克快马加鞭急于让Grok-3亮相。一周后,xAI将会陆续上线完整功能,不过当前付费用户才能使用,Grok-3也未开源。新王不断涌现,AI界的技术狂人们还将继续过招。

谁是“最聪明的AI”

本次直播发布的时间并不长,只有半小时左右,马斯克和xAI团队基本上都在用数据和实操展现Grok-3的“智力”。

和很多模型一样,Grok-3在数学推理、科学逻辑推理和代码编写等方面表现出色。多项基准测试成绩显示,Grok-3在数学(AIME 2024)、科学问答(GPQA)、编码(LCB)上刷新SOTA(State of the Art,描述在某一特定领域内当前最佳的技术、方法或模型),击败了谷歌的Gemini-2 Pro、DeepSeek的V3模型、OpenAI的GPT-4o。

按照xAI提供的数据,在多个AI领域内,Grok-3已经登顶。马斯克表示,Grok-3的计算能力是前一代的“10倍以上”,并于1月初完成了预训练,“我们每天都在不断改进模型,实际上在24小时内,你就会看到改进。”

AI,正在以每分每秒的速度不分昼夜地进化着,大模型厂商之间的火药味更加浓烈。在Grok-3发布不久前,OpenAI的CEO Sam Altman还在社交媒体上发布了GPT-4.5的相关信息,表示测试者们尝试GPT-4.5后,有比预期更多的“感受到AGI”的时刻。

在铺天盖地的Grok-3报道中,Sam Altman穿插新品预告,吸引了不少关注。Sam Altman和马斯克的“针锋相对”,也将显示在产品的PK中。

xAI工程师介绍,虽然Grok起步较晚,但在MMLU得分上以超的速度追上了ChatGPT。Grok-3和Grok-3 mini在多方面性能上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。

与此同时,Grok-3也很明显在对标竞品,比如,马斯克还特别提到了推理性能,而推理是DeepSeek-R1的强项。

马斯克表示,Grok-3接受了合成数据的训练,可以通过反复检查数据来审查所犯的错误,以达到逻辑上的一致性,“因此,如果它得到了错误的数据,它会反思并删除错误的数据。它的基本推理非常好。”

而对于OpenAI,从Grok-3目前的数据看, 其似乎领先于OpenAI最新的ChatGPT。随着Grok-3即将上线,xAI和OpenAI之间的竞争将日益激烈。“最聪明的AI”,将会是一场持续的排位赛。

大模型竞速

近年来快速崛起的AI明星着实不少,xAI当属其一。技术狂热又多金的马斯克,在和OpenAI“决裂”后,转而成立自己的AI公司。

在算力基础上,马斯克也迅速囤卡。xAI团队自建Colossus超级计算集群,集群规模已经从10万块英伟达GPU扩展到20万块,基于自家集群训练出的Grok-3的性能也得到了增强。

在xAI一日千里之时,AI圈的同行也在飚速。2025年,大洋彼岸的DeepSeek-V3和R1掀起新浪潮,尤其是R1为业内称道。R1大模型的一个特点是采用了MOE架构(混合专家,Mixture-of-Experts),事实上Grok初代版本也使用了MOE架构。在开源世界中,如何练出绝世武功,还得看各家功力。

DeepSeek-R1模型的冲击下,在AI领域有大动作可不止xAI一家,不少公司都陆续放出大招。

2月6日,OpenAI宣布扩大ChatGPT搜索功能的用户范围,任何人无需注册,就可以使用ChatGPT的搜索功能;同一天,谷歌正式推出Gemini 2.0系列模型,包括Flash、Pro及Flash-Lite版本,继续提升AI能力,并提供更具性价比的解决方案。

2月13日,Sam Altman宣布,将很快发布GPT-5,并且免费无限使用;同日,文心一言官宣将于4月1日0时起全面免费,并且即日起上线深度搜索功能。

AI的第一梯队玩家都感受到“危机感”,不由得加快了迭代脚步,直接开启新一轮价格战,并探索更多应用场景形成商业闭环。有AI资深人士向21世纪经济报道记者表示,目前Grok-3需要付费使用,马斯克也在探索解决算力商业模式问题。

在技术、Agent应用竞速的同时,大模型厂商的融资也在竞速。有报道称,xAI正在接洽潜在的投资者,计划筹集约100亿美元资金,此轮融资可能使该公司估值达到约750亿美元;还有报道称OpenAI正在进行谈判,希望在新一轮融资中筹集高达400亿美元,这将使其估值达到3000亿美元。

在这场资金、技术、智力的金字塔游戏中,大模型竞速已从单纯的技术迭代演变为全维度的生态博弈。算力军备竞赛与开源策略并行,价格战倒逼商业闭环重构。有云计算高管向记者表示,目前AI产业已经过了炒作阶段,开始出现一些真正规模化的应用,大家会看到更多实用价值。

而这场以硅基智能为燃料的竞逐,能否加速构建通向AGI之路,大家都在拭目以待。

SFC

本期编辑 刘雪莹

相关内容

热门资讯

神宇股份涨3.85%,成交额2... 5月6日,神宇股份涨3.85%,成交额2.29亿元,换手率5.11%,总市值65.05亿元。 异动分...
广发基金宣布增加瑞银证券为云计... 广发基金管理有限公司近日发布公告,宣布增加瑞银证券为旗下部分ETF的一级交易商。此次新增的一级交易商...
特斯拉一季度净利锐减71%!马... 当地时间4月22日,特斯拉首席执行官埃隆·马斯克表示,他计划在5月“大幅”减少为特朗普政府工作,以专...
湖北国资:一年收了4家上市公司... 你好,我是涛哥,专注于并购重组投资。这是涛哥的第69篇原创文章。 2024年,湖北国资收了4家上市公...
红利策略进化论:从防御盾牌到现... 当前市场对贸易摩擦的敏感度明显降低,近期各类关税消息虽然层出不穷,但A股基本走出脱敏行情,相关板块波...
原创 腾... 海内外大厂大模型研发正在进入新升级周期,为了加速补齐技术短板,腾讯混元近日进行了大幅架构调整,重构研...
影响市场大事件:央行副行长陆磊... 每经记者:杨建 每经编辑:肖芮冬 |2025年4月24日 星期四| NO.1央行副行长:人民币已成为...
钧达股份通过港股IPO聆讯:光... 瑞财经 吴文婷 4月21日,海南钧达新能源科技股份有限公司(以下简称“钧达股份”)通过港交所聆讯,华...
紫燕食品发布2024年年报:创... 4月17日晚,上海紫燕食品股份有限公司(简称:紫燕食品,603057.SH)发布2024年年度报告。...
我市加快建设水利基础设施持续增... 我市加快建设水利基础设施持续增强水利支撑能力 ■ 截至目前,全市136个项目已开工建设,累计完成投资...