
-
新聞專員 發達公司課長
-
來源:財經刊物
發佈於 2025-02-18 14:54
馬斯克發表「Grok 3」 xAI:效能擊敗GPT-4o
2025-02-18 14:33:10 記者 郭妍希 報導
馬斯克(Elon Musk、見圖右)旗下新創商xAI在週一(17日)晚間釋出最新旗艦AI模型「Grok 3」,號稱效能擊敗OpenAI的先進模型「GPT-4o」。
TechCrunch、Axios等外電報導,馬斯克17日在社交平台X的直播中指出,「Grok 3的運算能力比Grok 2高出一個數量級」,這是一個「極度追求真相的AI,即便這個真相有時並不政治正確。」
精確來說,Grok 3指的是一系列AI模型。小型版「Grok 3 mini」回答問題的速度較快,但會犧牲些許正確性。不是所有模型都立即可用,但會從週一開始陸續發布。
xAI聲稱,Grok 3在多項基準測試中擊敗Google的Gemini、DeepSeek的V3、Anthropic的Claude以及OpenAI的GPT-4o,當中包括評估模型運算數學題樣本能力的「AIME」測試,以及衡量模型解答博士級物理學、生物學和化學問題能力的「GPQA」測驗。
在眾籌的「Chatbot Arena」測驗中,Grok 3初期版本對問題的回應,相對於其他聊天機器人也更具競爭力。Chatbot Arena會讓不同AI模型打擂台,讓用戶票選出自己偏好的模型。
Grok 3還包括兩種版本「Grok 3 Reasoning」及「Grok 3 mini Reasoning」,能「徹底思考」(think through)問題,類似OpenAI「o3-mini」及DeepSeek「R1」模型的「推理」(reasoning)過程。推理模型在給出答案前會自行查驗事實,有助於避開一些常見陷阱。
xAI聲稱,Grok 3 Reasoning在數個熱門的能力測驗中,效能超越OpenAI「o3-mini」的最佳版本「o3-mini-high」,當中包括一款較新的數學能力檢驗模型「AIME 2025」。
上述推理模型可透過Grok應用程式(app)取得。使用者可要求Grok 3對較困難的問題進行「思索」(think),以「大腦」(Big Brain)模式運用更多算力進行推理。馬斯克表示,部分推理過程會被刻意隱藏,以免其他AI模型開發商透過「蒸餾法」(distillation)從中提取知識。
Grok的推理模式還會加入新功能「DeepSearch」,能搜尋網路及社交平台X的資訊來進行分析,對用戶的詢問提供摘要回答。DeepSearch主要是回應像是OpenAI「Deep Research」的深度檢索工具。
X的Premium+訂閱戶可率先使用Grok 3,其他功能則須訂閱xAI的「SuperGrok」才能解鎖。SuperGrok月費30美元、年費300美元,能解鎖額外的推理及DeepSearch查詢次數,並包含無限次的圖像生成功能。
馬斯克還指出,xAI將在幾個月後讓Grok 2轉為開源模型。他說,「我們的做法是,在最新版本完全推出後,會將上一版本開源。」
(圖片來源:xAI)
*編者按 :本文僅供參考之用,並不構成要約、招攬或邀請 、誘使、任何不論種類或形式之 申述或訂立任何建議及推薦,讀者務請運用個人獨立思考 能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。