慧
世界基礎模型、GeForce RTX 5、還有機器人,CES 2025 NVIDIA 黃仁勳 8 大演講重點一次看
Sisley黃仁勳:「機器人的 ChatGPT 時刻即將到來!」
NVIDIA 執行長黃仁勳今(7)日在 CES 2025 發表專題演說,內容觸及全新的 Cosmos 世界基礎模型平台、Omniverse、機器人開發、自駕車、AI 應用以及個人電腦和工作站等。以下為《INSIDE》為各位讀者整理出來的 8 大重點,包括黃仁勳的演講內容,以及 NVIDIA 在 CES 2025 所宣布的新品及服務。
GeForce RTX 50
Photo Credit:NIVIDIA
黃仁勳在 CES 2025 keynote 演講中,亮相了新 GeForce RTX 50 系列顯示卡:RTX 5090、RTX 5080、RTX 5070 Ti 和 RTX 5070,採用 Blackwell 架構,將於一月稍晚上市。
四款顯示卡的售價依序分別為:1999 美元、999 美元、749 美元、549 美元,其中 RTX 5070 擁有 RTX 4090 的效能,且售價遠低於後者的 1599 美元。
AI 基礎模型和開發平台
Photo Credit:NIVIDIA
黃仁勳:「機器人的 ChatGPT 時刻即將到來!」
NVIDIA CEO 黃仁勳宣布推出 NVIDIA Cosmos 平台,在這個平台裡包含最先進的生成世界基礎模型、先進的標記器、防護機制和加速影片處理管道,該平台將可用於推動自駕車和機器人等實體人工智慧(AI)系統的發展。
黃仁勳在演講開頭時講到 AI 在當代的發展,生成式 AI 之後將進入代理 AI(Agent AI)時代,以及「實體 AI 時代」,也就是現在正在興起的人形機器人,當然還包括了自動駕駛車。
close
arrow_forward_ios
了解更多
Pause
00:00
00:29
00:30
Mute
然而,實體 AI 模型開發成本高昂,需要大量的真實世界資料和測試。Cosmos 世界基礎模型(WFM)則能讓開發人員能夠方便產生大量逼真又符合物理原則的合成資料,以訓練和評估其現有模型。開發人員也可以微調 Cosmos WFM 來自訂模型。
NVIDIA 表示,將以開放模型授權的方式提供 Cosmos 模型,以加速推動機器人及自駕車社群的發展。
- NVIDIA Cosmos 世界基礎模型平台:該平台目的在加速物理 AI 的發展,例如自駕車和機器人。它包含多項重要元件:
- 生成式世界基礎模型:這些模型可以預測和產生物理一致的影片和世界狀態。NVIDIA 在 CES 上發布了超過 12 個基於擴散和自迴歸模型,讓開發者可以從文字和影片提示生成虛擬世界狀態或影片。Cosmos 模型是在數百萬小時的駕駛和機器人影片上訓練而成。
- 進階的影片標記器:NVIDIA Cosmos 的影片標記器提供高達 8 倍的壓縮率和 12 倍的效能,協助開發者建構更高品質、更高效能的世界基礎模型,同時節省訓練和推論成本。
- 安全機制(Guardrails):Cosmos 平台內建安全機制,可以在預處理階段減輕有害的文字和圖像輸入,並在後處理階段篩選生成的影片以確保安全。
- 加速的影片處理管道:Cosmos 平台包含一個基於 NVIDIA NeMo 框架的影片處理管道,可以加速影片資料的處理和標記。
NVIDIA 提及,許多領先的機器人和汽車公司,包括 1X、Agile Robots、Agility、Figure AI、Foretellix、Fourier、Galbot、Hillbot、IntBot、Neura Robotics、Skild AI、Virtual Incision、Waabi 和 XPENG,以及共享乘車巨頭 Uber 都在率先採用 Cosmos。
自駕車
Photo Credit:NIVIDIA- NVIDIA DRIVE Hyperion 平台: 這個平台已經通過了 TÜV SÜD 和 TÜV Rheinland 的產業安全評估,將用於下一代自駕車的開發。最新的 DRIVE Hyperion 版本將採用基於 NVIDIA Blackwell 架構的高效能 DRIVE AGX Thor 系統單晶片。
- NVIDIA DRIVE AI 系統檢查實驗室: 這個實驗室已經獲得 ANSI 國家認證委員會的認證,可以對自駕車軟體和系統進行功能安全、網路安全和 AI 功能安全檢查,協助合作夥伴滿足汽車產業嚴格的安全標準。實驗室的首批參與者包括 Continental 和 Sony SSS-America。
- NVIDIA DriveOS:這個汽車作業系統已經通過安全認證,符合汽車市場的功能安全和網路安全要求。它是一個安全的軟體平台,可讓汽車製造商在車輛的生命週期內更新軟體和功能。
Toyota、Aurora 和 Continental 都加入了使用 NVIDIA DRIVE 平台開發和建構自動駕駛車隊的行列。
Toyota 將在其下一代汽車中採用高效能的 NVIDIA DRIVE AGX Orin 系統單晶片以及安全的 DriveOS 作業系統;Aurora 和 Continental 則將合作在全球範圍內建構和部署基於 NVIDIA DRIVE Thor 和 NVIDIA DriveOS 的無人駕駛卡車。
NVIDIA 也強調了其「三電腦」策略,其中包括:
- NVIDIA DGX 系統:用於在資料中心訓練基於 AI 的堆疊。
- NVIDIA Omniverse:在 NVIDIA OVX 系統上運行,用於模擬和生成合成資料。
- NVIDIA AGX 車載電腦:用於處理即時感測器資料以確保安全。
這些系統共同組成了自駕車開發的完整解決方案。隨著 Cosmos 加入「三電腦」解決方案,開發者可以獲得資料飛輪,將數千英里的人類駕駛里程轉化為數十億英里的虛擬駕駛里程,以提高訓練資料的品質。
機器人開發
Photo Credit:NIVIDIA- NVIDIA Isaac GR00T 藍圖:這個藍圖可以幫助開發者使用模仿學習來訓練人形機器人。它可以從少量的人類示範中產生大量的合成運動資料,讓開發者更容易、更快速地訓練機器人。
透過結合合成資料工作流程和 NVIDIA Cosmos 世界基礎模型,Isaac GR00T 藍圖可以加速通用人形機器人的開發。
Isaac GR00T 讓開發者可以輕鬆地從少量的人類示範中生成大量的合成資料集。其產生的資料集可以用作機器人策略的輸入,教導機器人在 NVIDIA Isaac Lab(一個用於機器人學習的開源模組化框架)中安全有效地移動和與環境互動。
一些主要的機器人公司已經開始採用 Isaac GR00T 並展示了成果,包括 Boston Dynamics 和 Figure。
除了上述重點之外,NVIDIA 官方還補充介紹了以下重點:
AI 應用
- NVIDIA AI Refinery for Industry:Accenture 宣布推出以 NVIDIA AI Enterprise(包含 NVIDIA NeMo、NVIDIA NIM 微服務和 AI 藍圖)打造的 AI Refinery for Industry,以協助企業將 AI 代理快速投入生產。
AI Refinery for Industry 解決方案由 Accenture AI Refinery 和 NVIDIA 提供支援,可以幫助企業建構客製化的 AI 網路。
- 用於影片搜尋和摘要的 NVIDIA AI 藍圖:這個藍圖包含代理 AI 功能,例如思維鏈推理、任務規劃和工具呼叫,可以幫助開發者簡化強大且多樣化的視覺代理的創建,以解決各種問題,可讓企業和個人能夠提高生產力和安全性。
個人電腦和工作站
- NVIDIA Project DIGITS:這是一款個人 AI 超級電腦,搭載全新的 GB10 Grace Blackwell 超級晶片,可以讓開發者在桌面上執行大型 AI 模型。它提供 1 petaflop 的 AI 計算效能和 128GB 的統一記憶體,可以執行高達 2000 億參數的 AI 模型。
Project DIGITS 的目標用戶是 AI 開發人員、研究人員、資料科學家和學生,他們可以使用它來進行 AI 模型實驗和原型製作、微調 AI 模型、進行 AI 推論,以及執行本機 AI 推論以用於聊天機器人或程式碼輔助工具。 Project DIGITS 將於 5 月上市,售價 3000 美元起。
- 適用於 RTX PC 和工作站的 AI 基礎模型:這些模型是容器化的 NVIDIA NIM 微服務,可以透過業界標準 API 輕鬆下載和連接。 它們包含社群提供的頂級 AI 模型以及 NVIDIA 開發的模型,可以部署在從 PC 到資料中心再到雲端的任何地方。
- 適用於 RTX 的 AI 藍圖:這些藍圖提供 AI 工作流程的自訂和可擴展參考實作,幫助開發者建立複雜的 AI 應用程式,例如應用程式助理和內容生成器。其中一個藍圖可以讓使用者從任何 PDF 文件,轉換成引人入勝的 Podcast。
Omniverse
- NVIDIA Omniverse Mega 藍圖:這個藍圖可以用於建構工業機器人車隊的數位孿生,讓企業可以透過軟體定義的測試和最佳化來模擬和改善工廠和倉庫的營運。 Mega 藍圖整合了 Omniverse Sensor RTX,讓機器人開發者可以模擬各種感測器的資料,並追蹤機器人、相機、設備和數位人類的動作。
- Omniverse Sensor RTX:這個平台可以進行高傳真、可擴展的感測器模擬,加速自駕車和機器人的開發。 它讓開發者可以在虛擬環境中產生物理精確的感測器資料,用於訓練和驗證 AI 模型。
大型語言模型
- NVIDIA Llama Nemotron 和 Cosmos Nemotron 模型:這些是針對 AI 代理開發進行最佳化的開源大型語言模型。這些模型將作為託管 API 和下載版本在 build.nvidia.com 和 Hugging Face 上提供。
Llama Nemotron 模型是基於 mexta 的開源 Llama 基礎模型建構的。NVIDIA 對這些模型進行了最佳化,並使用其最新的技術和高品質數據集進行訓練,以增強其代理 AI 功能。
- Cosmos Nemotron 模型是視覺語言模型(VLMs),可與 NVIDIA Cosmos 世界基礎模型平台搭配使用。這些模型可以分析和回應來自自動化機器、醫院、商店、倉庫,以及體育賽事、電影和新聞的圖像和影片。
核稿編輯:Chris