新聞專員 發達公司課長
來源:財經刊物   發佈於 2025-01-13 21:04

馬斯克:AI訓練去年就已耗盡現實世界的所有資料

2025-01-13 11:22:22 記者 郭妍希 報導
全球首富馬斯克(Elon Musk)認同其他AI專家看法,現實世界能用來訓練AI模型的資料,已經消耗得差不多了。
TechCrunch報導,馬斯克近日在拉斯維加斯消費電子展(CES)期間,於社交平台X接受Stagwell執行長Mark Penn訪問時指出,基本上,AI訓練已將人類累積的知識全數耗盡,時間點落在去(2024)年。

馬斯克呼應OpenAI前科學長Ilya Sutskever去年12月在機器學習會議「NeurIPS」的說法。Sutskever當時說,AI產業能消耗的數據已觸頂(peak data);在缺少訓練資料的情況下,將迫使AI模型改以其他方法研發。

馬斯克暗示合成資料(synthetic data,也就是AI模型自行生成的數據)將是未來之路。他說,「補充現實世界數據的唯一方法就是合成資料,由AI負責創造訓練用的數據。」透過合成資料,「AI會替自己打分數,並展開自我學習的過程。」

微軟(Microsoft)、Facebook母公司Meta、OpenAI及Anthropic等企業早已開始使用合成資料訓練AI模型。科技市調機構Gartner估計,2024年AI及分析專案使用的資料中,約60%是合成資料。

事實上,1月8日開源的微軟AI模型「Phi-4」就是以合成資料輔以現實世界數據來訓練。Google的「Gemma」模型也是如此。Anthropic使用部分合成資料來開發表現最佳的系統之一「Claude 3.5 Sonnet」。Meta則運用AI生成數據來微調最新推出的Llama系列模型。

(圖片來源:shutterstock)

*編者按 :本文僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,讀者務請運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《精實財經媒體》、編者及作者無涉。

評論 請先 登錄註冊