〈AWS雲端年會〉亞馬遜秀自家Nova系列AI模型明年Q1推生成式語音模型

chen2929 發達集團總裁: 來源：財經刊物發佈於 2024-12-04 08:05

〈AWS雲端年會〉亞馬遜秀自家Nova系列AI模型明年Q1推生成式語音模型

鉅亨網記者魏志豪美國拉斯維加斯 2024-12-04 07:25

亞馬遜執行長Andy Jassy。(鉅亨網記者魏志豪攝)

亞馬遜 (AMZN-US) 執行長 Andy Jassy 今 (3) 日親自為 AWS re:Invent 2024 站台，並在會中宣布推出自家 Nova 系列生成式 AI 模型，並提供給客戶四種版本，也針對自動生成圖片與影片分別推出 Nova Canvas 與 Nova Reel，更釋出 Nova Any-to-Any，實現文字、語音、圖像與影片間相互轉譯的可能。

Andy Jassy 指出，儘管目前已有各式各樣的模型，但客戶還是很難找到一個具備正確知識、成本效益和低延遲組合且最適合其業務需求的模型，以大模型來看，知識較豐富、但成本高，反應時間較長，而小模型運行速度快、成本較低，但能力較差。

因此，亞馬遜藉由模型蒸餾 (Model Distillation) 技術，將大模型的知識壓縮轉移至小模型，同時保留小模型性能特徵，並在自家 Bedrock 平台上運行，讓客戶可以在同一模型中選擇自己所需大小的模型。

亞馬遜此次針對 Nova 系列推出四種規格，包含 Micro、Lite、Pro 與 Premier，前三款已經可提供給 AWS 用戶使用，Premier 則預計年第一季推出，並預估 Nova 系列模型可較現有平台上的模型節省 75% 的成本。

亞馬遜此次也同步推出 Nova Canvas 和 Nova Reel，分別為圖片、影音的生成式模型；Andy Jassy 說，其模型已幫助亞馬遜消除賣家和廣告業者間的障礙，如在影片廣告中可以為產品建立關鍵字等新策略，依據單一影片曝光的產品數量是先前的 5 倍，每個廣告中的圖片數量是原來的 2 倍，讓預算更精準投放。

另外，Andy Jassy 也說，亞馬遜已將技術延伸至語音生成語音 (Speech to Speech) 的模型，預計明年第一季推出，並在未來進一步推出任何形式均可輸入、生成的模型，代表使用者可透過文字生成語音、影片內容轉換為文字或者文字生成圖片等，實現更多元的應用場景。