繁體簡(jiǎn)體

馬斯克推出Grok 3 AI競(jìng)賽白熱化

華夏經(jīng)緯網(wǎng) > 新聞 > 國(guó)際新聞      2025-02-19 11:37:20

左圖:示威者抗議特朗普政策的集會(huì)上高舉抵制馬斯克的海報(bào)。\美聯(lián)社;右圖:馬斯克(右一)與三位工程師17日在線上舉行Grok 3發(fā)布會(huì)。\網(wǎng)絡(luò)圖片

本港時(shí)間18日,馬斯克旗下人工智能初創(chuàng)公司xAI通過(guò)直播,發(fā)布號(hào)稱“地球最聰明的AI大模型”Grok 3。演示內(nèi)容顯示,Grok 3在數(shù)學(xué)、科學(xué)、編程三項(xiàng)能力的相關(guān)測(cè)評(píng)中,得分均高于其他主流AI模型。Grok 3總共用了20萬(wàn)個(gè)英偉達(dá)H100GPU訓(xùn)練,被質(zhì)疑為“性價(jià)比黑洞”。復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授張奇18日接受大公報(bào)專訪時(shí)表示,DeepSeek的出現(xiàn)加速了AI領(lǐng)域的競(jìng)爭(zhēng),諸如xAI和OpenAI等企業(yè)迫于壓力,不得不調(diào)整大模型的發(fā)布節(jié)奏以應(yīng)對(duì)市場(chǎng)變化。\大公報(bào)記者蘇雨潤(rùn) 戚佳潔

【大公報(bào)訊】本港時(shí)間18日,馬斯克旗下人工智能(AI)新創(chuàng)公司xAI推出AI模型Grok 3,并十分高調(diào)地宣稱,這是“地表最聰明的AI”,目標(biāo)是為了理解宇宙。根據(jù)xAI數(shù)據(jù),Grok 3在數(shù)學(xué)、科學(xué)以及編程三大基準(zhǔn)測(cè)試中的表現(xiàn)還不錯(cuò)。數(shù)據(jù)上是超越了所有主流模型,包括GPT-4o、DeepSeek-V3等。以數(shù)學(xué)測(cè)驗(yàn)為例,Grok 3取得了52分的最高成績(jī),而同屬xAI陣營(yíng)的Grok 3 mini則拿到40分,DeepSeek-V3以39分緊追在后,GPT-4o只有9分。

Grok 3一周后上線語(yǔ)音模式

Grok 3性能突破的背后是驚人的資源投入,xAI團(tuán)隊(duì)透露,Grok 3有20萬(wàn)個(gè)英偉達(dá)GPU、4億個(gè)GPU小時(shí)的算力支持。馬斯克在直播中首次披露,Grok 3訓(xùn)練過(guò)程累計(jì)消耗20萬(wàn)個(gè)英偉達(dá)GPU,訓(xùn)練在xAI公司的數(shù)據(jù)中心完成。馬斯克還說(shuō),Grok 3將在一周后上線語(yǔ)音模式。

據(jù)官方數(shù)據(jù),Grok 3的運(yùn)算能力依托由20萬(wàn)個(gè)英偉達(dá)H100GPU構(gòu)建的Colossus超算集群,據(jù)稱運(yùn)算能力是前代產(chǎn)品Grok 2的“10倍以上”,預(yù)訓(xùn)練階段的消耗相當(dāng)于一座核電站7%的月發(fā)電量。以市價(jià)計(jì)算,一個(gè)H100GPU大概在3萬(wàn)美元(約23.4萬(wàn)港元),那么Grok 3的訓(xùn)練成本就至少在60億美元(約468億港元)左右。相較于DeepSeek以遠(yuǎn)低于同行的成本訓(xùn)練出比肩OpenAI o1模型能力的R1模型,Grok 3的這一算力消耗屬實(shí)不小。在馬斯克公布Grok 3訓(xùn)練成本后,很快便有分析指出,Grok 3的算力消耗是DeepSeek-V3的263倍。

DeepSeek走紅加速行業(yè)競(jìng)爭(zhēng)

馬斯克宣稱“地球最聰明的AI大模型”。張奇則指出,Grok 3在推理能力上確實(shí)更進(jìn)一步,但就目前數(shù)據(jù)來(lái)看,它依然屬于大體量模型。至于其是否會(huì)對(duì)DeepSeek的市場(chǎng)造成沖擊,還需取決于它在實(shí)際場(chǎng)景中的使用效果。“完整部署Grok 3需要強(qiáng)大的計(jì)算量,許多企業(yè)出于性價(jià)比考量,可能不會(huì)選擇它?!?/p>

隨著Grok 3的發(fā)布,AI市場(chǎng)的競(jìng)爭(zhēng)格局愈發(fā)白熱化,各大企業(yè)為在這場(chǎng)技術(shù)競(jìng)賽中搶占優(yōu)勢(shì),紛紛加大研發(fā)投入,加速產(chǎn)品迭代。張奇表示,AI模型間的競(jìng)爭(zhēng)是行業(yè)常態(tài),不過(guò)此前相互追趕的速度相對(duì)較慢,DeepSeek的走紅讓行業(yè)競(jìng)爭(zhēng)進(jìn)一步提速。他告訴記者,GPT-4問(wèn)世后,各大企業(yè)在追趕多模態(tài)技術(shù)方面投入了大量時(shí)間與精力,企業(yè)間的追趕節(jié)奏一度放緩。而DeepSeek的出現(xiàn)將研發(fā)工作從“幕后”推向“臺(tái)前”,研發(fā)重點(diǎn)也從“訓(xùn)練”轉(zhuǎn)向“推理”,極大縮小技術(shù)壁壘,加速了大模型版本的迭代速率。

此外,值得注意的是,在本次直播發(fā)布會(huì)上,馬斯克多次提及DeepSeek。張奇表示,在Grok 1發(fā)布時(shí),xAI研發(fā)團(tuán)隊(duì)的關(guān)注焦點(diǎn)主要集中在OpenAI等頭部企業(yè),幾乎從未提及中國(guó)的AI模型。“DeepSeek的異軍突起徹底改變了這一狀況,這反映出馬斯克乃至美國(guó)科技界對(duì)中國(guó)AI企業(yè)技術(shù)突破與創(chuàng)新能力的高度認(rèn)可?!?/p>

文章來(lái)源:香港大公報(bào)
責(zé)任編輯:姚思寒
寰球熱點(diǎn)
國(guó)際觀察
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120170072
京公網(wǎng)安備 11010502045281號(hào)
違法和不良信息舉報(bào)電話:010-65669841
舉報(bào)郵箱:xxjb@huaxia.com

網(wǎng)站簡(jiǎn)介 / 廣告服務(wù) / 聯(lián)系我們

主辦:華夏經(jīng)緯信息科技有限公司   版權(quán)所有 華夏經(jīng)緯網(wǎng)

Copyright 2001-2024 By www.essencecafe.cn