chen2929 發達集團總裁
來源:財經刊物   發佈於 2025-08-15 05:39

英媒驚爆華為晶片出包 DeepSeek AI模型難產

2025/08/14 15:19  
外媒披露,中國DeepSeek新模型延後問世,原因是華為晶片出包。(路透)
陳麗珠/核稿編輯
〔財經頻道/綜合報導〕《金融時報》披露,中國AI新創DeepSeek今年初推出R1模型之後,北京敦促改用華為的Ascend(昇騰)晶片,取代搭載輝達晶片,如今因使用華為晶片訓練發生困難,被迫延後發表新模型,凸顯北京推動技術自主取代美國面臨瓶頸。
報導指出,中國DeepSeek 因未能使用華為晶片成功訓練其新模型而延後發布,凸顯了北京在取代美國技術方面面臨限制。
據三位知情人士透露,自今年 1 月推出 Ri 模型後,DeepSeek 在北京當局鼓勵下,改採用華為的 Ascend晶片,而非使用輝達晶片。
然而,這家中國新創公司在使用 Ascend 晶片進行 R2 模型訓練的過程中,遇到持續的技術問題,最後不得不使用輝達晶片進行訓練,並以華為晶片負責推理(inference)。這正是新模型原定5月發表卻延後的主因,從而在產業競爭之中屈居下風。
報導說,DeepSeek 遭遇的挑戰顯示,中國晶片在關鍵任務上仍落後於美國對手,凸顯中國在追求科技自給自足的道路上面臨的挑戰。
中國業界人士坦言,與輝達產品相比,中國研製的晶片穩定性明顯不足,且晶片之間通訊的速度較慢,軟體能力也差了一截。
2名知情人士透露,DeepSeek創辦人梁文鋒對於R2模型進展遲滯感到不滿,為了解決技術問題,華為派遣工程師組成的團隊前往DeepSeek,協助R2模型的開發,目前雙方仍在努力合作解決問題。

評論 請先 登錄註冊