馬斯克發表「Grok 3」 xAI：效能擊敗GPT-4o

新聞專員發達公司課長: 來源：財經刊物發佈於 2025-02-18 14:54

馬斯克發表「Grok 3」 xAI：效能擊敗GPT-4o

2025-02-18 14:33:10 記者郭妍希報導
馬斯克(Elon Musk、見圖右)旗下新創商xAI在週一(17日)晚間釋出最新旗艦AI模型「Grok 3」，號稱效能擊敗OpenAI的先進模型「GPT-4o」。
TechCrunch、Axios等外電報導，馬斯克17日在社交平台X的直播中指出，「Grok 3的運算能力比Grok 2高出一個數量級」，這是一個「極度追求真相的AI，即便這個真相有時並不政治正確。」

精確來說，Grok 3指的是一系列AI模型。小型版「Grok 3 mini」回答問題的速度較快，但會犧牲些許正確性。不是所有模型都立即可用，但會從週一開始陸續發布。

xAI聲稱，Grok 3在多項基準測試中擊敗Google的Gemini、DeepSeek的V3、Anthropic的Claude以及OpenAI的GPT-4o，當中包括評估模型運算數學題樣本能力的「AIME」測試，以及衡量模型解答博士級物理學、生物學和化學問題能力的「GPQA」測驗。

在眾籌的「Chatbot Arena」測驗中，Grok 3初期版本對問題的回應，相對於其他聊天機器人也更具競爭力。Chatbot Arena會讓不同AI模型打擂台，讓用戶票選出自己偏好的模型。

Grok 3還包括兩種版本「Grok 3 Reasoning」及「Grok 3 mini Reasoning」，能「徹底思考」(think through)問題，類似OpenAI「o3-mini」及DeepSeek「R1」模型的「推理」(reasoning)過程。推理模型在給出答案前會自行查驗事實，有助於避開一些常見陷阱。

xAI聲稱，Grok 3 Reasoning在數個熱門的能力測驗中，效能超越OpenAI「o3-mini」的最佳版本「o3-mini-high」，當中包括一款較新的數學能力檢驗模型「AIME 2025」。

上述推理模型可透過Grok應用程式(app)取得。使用者可要求Grok 3對較困難的問題進行「思索」(think)，以「大腦」(Big Brain)模式運用更多算力進行推理。馬斯克表示，部分推理過程會被刻意隱藏，以免其他AI模型開發商透過「蒸餾法」(distillation)從中提取知識。

Grok的推理模式還會加入新功能「DeepSearch」，能搜尋網路及社交平台X的資訊來進行分析，對用戶的詢問提供摘要回答。DeepSearch主要是回應像是OpenAI「Deep Research」的深度檢索工具。

X的Premium+訂閱戶可率先使用Grok 3，其他功能則須訂閱xAI的「SuperGrok」才能解鎖。SuperGrok月費30美元、年費300美元，能解鎖額外的推理及DeepSearch查詢次數，並包含無限次的圖像生成功能。

馬斯克還指出，xAI將在幾個月後讓Grok 2轉為開源模型。他說，「我們的做法是，在最新版本完全推出後，會將上一版本開源。」

(圖片來源：xAI)

＊編者按：本文僅供參考之用，並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦，讀者務請運用個人獨立思考能力，自行作出投資決定，如因相關建議招致損失，概與《精實財經媒體》、編者及作者無涉。



1.1k 次閱讀 ⋅ 2 條評論 ⋅ 舉報

認同 (0) 打賞 (0) 轉發 (0) 收藏 (0)

評論請先登錄或註冊

最新點讚感謝文討論文全部評論（2）

馬斯克發表「Grok 3」 xAI：效能擊敗GPT-4o

熱門資訊

新聞專員的粉絲

最近瀏覽

發達資訊

發達社區

關於我們

關註我們

官方客服

馬斯克發表「Grok 3」 xAI：效能擊敗GPT-4o

熱門資訊

新聞專員 的粉絲

最近瀏覽

發達資訊

發達社區

關於我們

關註我們

官方客服

新聞專員的粉絲