2025/01/29 14:35
繼DeepSeek後,阿里也祭重磅AI新模型(法新社)
高佳菁/核稿編輯
〔財經頻道/綜合報導〕輝達等AI巨擘「頭殼摸咧燒」,中國不只有DeepSeek,阿里也在除夕夜,拋出重磅新模型,專家表示,Qwen2.5-Max的發佈是中國AI陣營在高性能、低成本技術路線上的另1個重要突破,若Qwen-2.5-max的性能確實展現出預期水平,加上其低成本優勢與完整雲生態,或將引發DeepSeek之後的中國AI資產新1輪重估。
在全球科技股籠罩在DeepSeek掀起的風暴時,外媒報導,1月29日凌晨,阿里通義千問團隊悄悄上線的大模型Qwen2.5-Max,在多個權威基準測試中,展現出與全球頂級模型比肩的性能。
報導指出,Qwen2.5-Max採用超大規模MoE(混合專家)架構,基於超過20兆token的預訓練資料。
在測試大學程度知識的MMLU-Pro、評估程式設計能力的LiveCodeBench、綜合能力評估的LiveBench,以及近似人類偏好的Arena-Hard等多個權威評測中,該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領先的性能。
阿里團隊表示,隨著後訓練技術的不斷進步,下一個版本將有望達到更高水準。
市場人士分析稱,先前過度聚焦DeepSeek,卻忽略了包括阿里通義在內的中國AI整體性追趕,如果說DeepSeek V3的橫空出世展現了中國AI的銳度,那麼這次阿里的突破則體現了產業生態的深度進化。
在Qwen2.5-Max發布當天,阿里雲百煉平台同步開放了完整的工具鏈支持,開發者可以直接在雲端呼叫。這種"超算集群+開源生態+雲端原生"的三位一體架構,與北美AWS、Azure、GCP三大雲端服務商的商業模式形成鏡像。
此外,根據摩根士丹利最新研報,低成本高效能模型也將重塑資料中心和軟體產業格局,大摩指出,對中國資料中心而言,短期內,如果大型科技公司採用類似技術路線,可能減少AI訓練相關需求。但從長遠來看,低成本模型將推動推理需求成長,對第一線城市資料中心形成利多;對於中國軟體產業,AI模型成本的降低將降低應用程式運行AI功能的門檻,從供給面改善產業環境。
如果阿里Qwen-2.5-max的性能確實展現出預期水平,加上其低成本優勢與完整雲生態,或引發DeepSeek之後的中國AI資產新一輪重估。