輝達等AI巨擘「頭殼摸咧燒」！繼DeepSeek後阿里也祭重磅AI新模型

chen2929 發達集團總裁: 來源：財經刊物發佈於 2025-01-30 08:40

輝達等AI巨擘「頭殼摸咧燒」！繼DeepSeek後阿里也祭重磅AI新模型

2025/01/29 14:35

繼DeepSeek後，阿里也祭重磅AI新模型（法新社）
高佳菁／核稿編輯
〔財經頻道／綜合報導〕輝達等AI巨擘「頭殼摸咧燒」，中國不只有DeepSeek，阿里也在除夕夜，拋出重磅新模型，專家表示，Qwen2.5-Max的發佈是中國AI陣營在高性能、低成本技術路線上的另1個重要突破，若Qwen-2.5-max的性能確實展現出預期水平，加上其低成本優勢與完整雲生態，或將引發DeepSeek之後的中國AI資產新1輪重估。
在全球科技股籠罩在DeepSeek掀起的風暴時，外媒報導，1月29日凌晨，阿里通義千問團隊悄悄上線的大模型Qwen2.5-Max，在多個權威基準測試中，展現出與全球頂級模型比肩的性能。
報導指出，Qwen2.5-Max採用超大規模MoE（混合專家）架構，基於超過20兆token的預訓練資料。
在測試大學程度知識的MMLU-Pro、評估程式設計能力的LiveCodeBench、綜合能力評估的LiveBench，以及近似人類偏好的Arena-Hard等多個權威評測中，該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩，甚至領先的性能。
阿里團隊表示，隨著後訓練技術的不斷進步，下一個版本將有望達到更高水準。
市場人士分析稱，先前過度聚焦DeepSeek，卻忽略了包括阿里通義在內的中國AI整體性追趕，如果說DeepSeek V3的橫空出世展現了中國AI的銳度，那麼這次阿里的突破則體現了產業生態的深度進化。
在Qwen2.5-Max發布當天，阿里雲百煉平台同步開放了完整的工具鏈支持，開發者可以直接在雲端呼叫。這種"超算集群+開源生態+雲端原生"的三位一體架構，與北美AWS、Azure、GCP三大雲端服務商的商業模式形成鏡像。
此外，根據摩根士丹利最新研報，低成本高效能模型也將重塑資料中心和軟體產業格局，大摩指出，對中國資料中心而言，短期內，如果大型科技公司採用類似技術路線，可能減少AI訓練相關需求。但從長遠來看，低成本模型將推動推理需求成長，對第一線城市資料中心形成利多；對於中國軟體產業，AI模型成本的降低將降低應用程式運行AI功能的門檻，從供給面改善產業環境。
如果阿里Qwen-2.5-max的性能確實展現出預期水平，加上其低成本優勢與完整雲生態，或引發DeepSeek之後的中國AI資產新一輪重估。



3.9k 次閱讀 ⋅ 2 條評論 ⋅ 舉報

認同 (0) 打賞 (0) 轉發 (0) 收藏 (0)

評論請先登錄或註冊

最新點讚感謝文討論文全部評論（2）

輝達等AI巨擘「頭殼摸咧燒」！繼DeepSeek後阿里也祭重磅AI新模型

熱門資訊

chen2929 的粉絲

最近瀏覽

發達資訊

發達社區

關於我們

關註我們

官方客服

輝達等AI巨擘「頭殼摸咧燒」！繼DeepSeek後 阿里也祭重磅AI新模型

熱門資訊

chen2929 的粉絲

最近瀏覽

發達資訊

發達社區

關於我們

關註我們

官方客服

輝達等AI巨擘「頭殼摸咧燒」！繼DeepSeek後阿里也祭重磅AI新模型