
-
新聞專員 發達公司課長
-
來源:財經刊物
發佈於 2025-04-02 14:30
DS公布新專利,可減少數據獲取時網路資源消耗
2025-04-02 13:33:25 記者 新聞中心 報導
據陸媒報導,根據中國國家智慧財產權局中國專利公布公告網獲悉,中國人工智慧(AI)初創公司DeepSeek(深度求索;DS)關聯公司杭州深度求索人工智慧基礎技術研究有限公司申請的「一種廣度數據獲取的方法及其系統專利」於本(4)月1日公布,可減少數據獲取時網路資源消耗。
專利摘要顯示,該發明的有益效果在於發現盡可能多的網頁連結,並減少對網站的流量衝擊;對已下載的內容進行分析,對未下載的連結進行品質推斷,透過擇優下載分配額度的方式,減少低品質網頁下載和重複下載,提高數據品質及下載效率,減少在數據獲取過程中網路資源的消耗;採用單獨的信息回灌對列,保證網頁信息庫修改操作的原子性和穩定性。
在專利背景技術說明指出,許多大語言模型(Large Language Models,LLMs)被訓練應用於自然語言處理領域,用於研究實現人與電腦之間用自然語言進行有效通信的各種理論和方法。然而,現有的數據獲取技術存在諸多問題,例如對複雜網站進行採集時,無法獲取完整連結;容易過量下載,造成對方網站崩潰;對下載頁面不進行內容品質分析和推斷,造成重複下載或低質下載、影響數據獲取的效率。因此,在大量網頁數據獲取的過程中,如何快速、精準、安全、高效採集互聯網數據變得至關重要。
另外,DeepSeek首次用於地震國際救援,近日在緬甸強震救援行動中,一項由中國團隊開發的中緬英互譯系統發揮了重要作用,為救援工作的順利開展提供有力支援。地震發生後,中國駐緬甸使館表示,在救援工作中使用了基於DeepSeek緊急開發的中緬英互譯系統,該系統由中國國家應急語言服務團秘書處和北京語言大學迅速組建的語言服務支援團隊,在短短七小時內利用DeepSeek開發完成,為中國大模型首次用於地震國際救援。