鉅亨網編譯張祖仁 綜合外電 2025-03-11 19:53
mexta開始測試其首款自有AI訓練用晶片。(圖:REUTERS/TPG)
消息人士透露,Facebook 母公司 mexta (
mexta-US) 正在測試其首款用於訓練人工智慧 (AI) 系統的自有晶片。這是該公司轉向設計更多自有客製化晶片並減少對輝達 (Nvidia)(
NVDA-US) 等外部供應商的依賴的一個重要里程碑。
消息人士表示,這家全球最大社群媒體公司已開始小規模採用該晶片,並計劃在測試順利的情況下擴大產量以供大規模使用。
推動自有晶片開發是 mexta 長期計劃的一部分,以降低其龐大的基礎設施成本,因為該公司對 AI 工具進行了巨額投資以推動成長。
還擁有 Instagram 和 WhatsApp 的 mexta 預測 2025 年總支出將達到 1140 至 1190 億美元,其中高達 650 億美元的資本支出主要來自 AI 基礎設施的支出。
其中一位消息人士說,mexta 的新訓練晶片是一款專用加速器,意味著它只用於處理特定的 AI 任務。這可以使其比通常用於 AI 工作負載的整合式圖形處理單元 (GPU) 更節能。
這位知情人士表示,mexta 正在與台灣晶片製造商台積電 (
TSM-US)(
2330-TW) 合作生產該晶片。
另一位消息人士指出,測試部署是在 mexta 完成晶片的首次「流片」後開始的。「流片」是矽片開發工作成功的重要標誌,意指將初始設計發送到晶片工廠。
一次典型的流片要花費數千萬美元,大約需要 3 到 6 個月的時間才能完成,而且不能保證測試一定會成功。如果失敗,則需要 mexta 診斷問題並重複流片步驟。
該晶片是該公司元訓練和推理加速器 (MTIA) 系列中的最新產品。該專案多年來一直起步不順,一度在類似的開發階段放棄一款晶片。
然而,mexta 去年開始使用 MTIA 晶片進行推理,即在用戶與 AI 系統互動時執行該系統所涉及的過程,用於推薦系統確定哪些內容會出現在 Facebook 和 Instagram 的新聞推送中。
mexta 高層表示,希望在 2026 年開始使用自有晶片進行訓練,或透過運算密集的流程向 AI 系統輸入大量資料來「教」它如何執行。
高層表示,與推理晶片一樣,訓練晶片的目標是從推薦系統開始,然後用於聊天機器人 mexta AI 等生成式 AI 產品。
mexta 產品長考克斯 (Chris Cox) 上周在摩根士丹利技術、媒體和電信會議上表示:「我們正在研究如何對推薦系統進行訓練,以及最終如何考慮對新一代 AI 進行訓練和推理。」
他將 mexta 的晶片開發工作描述為「一種從走到爬和跑步的過程」,但表示高管們認為第一代用於推薦的推理晶片是「巨大的成功」。
mexta 先前曾停止內部客製化推理晶片的生產,因為該公司在一次與目前正在進行的訓練晶片類似的小規模測試部署中失敗了,之後改變方向,並在 2022 年訂購了價值數十億美元的輝達 GPU。
自那時起,這家社群媒體公司一直是輝達的最大客戶之一,累積了大量 GPU 來訓練其模型,包括用於推薦和廣告系統以及其 Llama 基礎模型系列。這些部門也為每天使用其應用程式的 30 多億人進行推理。
今年,這些 GPU 的價值受到質疑,因為 AI 研究人員越來越懷疑透過添加更多數據和運算能力來繼續「擴大」大型語言模型能取得多大進展。
今年 1 月底,中國新創公司 DeepSeek 推出了新的低成本模型,進一步強化了人們的疑慮,該模型比大多數現有模型更加依賴推理,優化了計算效率。
在 DeepSeek 引發的全球 AI 股票暴跌中,輝達股價一度下跌五分之一,但隨後股價收復大部分失地,投資人押注該公司的晶片仍將是訓練和推理領域的產業標準,不過由於整體貿易擔憂,該公司股價再次下跌。