DeepSeek火爆全球 人工智能或進入普惠時代

2025年1月20日,DeepSeek發佈新一代推理大模型 DeepSeek-R1,以極致的“性價比”在全球AI競技場投下“技術普惠”的深水炸彈。

這不僅是算法對算力的逆襲,更是開源生態對閉源生態的降維打擊……隨後全球47萬個衍生模型在20天內破土而出,昇騰、騰訊雲等200多家生態夥伴構建起自主可控的AI產業鏈,甚至倒逼OpenAI宣佈GPT-5免費開放。

如今,DeepSeek的神話還在續寫……深度適配、開源、差異化競爭成爲當下熱點。

成本重構改寫行業規則

從陽春白雪到下里巴人,DeepSeek讓AI真正飛入尋常百姓家。無論是專業人士的複雜工作場景,還是普通用戶日常娛樂、學習,都能輕鬆駕馭,極大降低了大衆運用AI 技術的門檻。

性能是衡量一個模型優劣的關鍵指標。在性能層面,DeepSeek其獨創的專家混合架構(MoE)通過任務分解與多專家協同,顯著提升數學推理效率,數學推理能力超過OpenAI o1;基於2000億Token訓練量的代碼生成模型,在數學推理和代碼任務上已超越GPT-3.5。

成本控制則成爲DeepSeek顛覆行業的關鍵。DeepSeek R1以557.6萬美元的訓練成本(僅爲Gpt-4的1/10)和API調用價格(OpenAI的1/30),徹底打破“算力軍備競賽”的行業困局。這種“高性能+低成本”組合,直接推動全球AI服務價格體系重構,迫使頭部廠商加速技術迭代。

正因如此,DeepSeek吸引了國內衆多企業的目光。國家超算互聯網平臺相關負責人向中國工業報表示,根據傑文斯悖論(傑文斯悖論:技術進步提高了資源使用效率,但最終會導致該資源的總消耗量不降反增),像DeepSeek這樣由技術創新提升效率的工具,其廣泛應用將大規模帶動算力需求的增加。

因此,社會迫切需要打造能夠應對高峰值的大規模算力中心,也需要類似超算互聯網的全國一體化算力網絡,將全國各地的算力中心連接起來,形成面向全國算力資源池,實現全國算力資源的統一管理。此外,還要建立“算力+應用”的一體化交付體系,促進供需雙方的高效對接。

中國工業報瞭解到,作爲國家級綜合算力服務平臺,目前超算互聯網已連接國內14個省區市的20多家超算和智算中心。目前,平臺上已有各類算力商品超6500款,其中AI模型服務近240款,既有DeepSeek、Qwen等國內開源模型,也有Llama、Stable Diffusion、Gemma等國外AI開源模型。

國家超算互聯網平臺相關負責人向中國工業報表示,當前各類用戶使用AI模型熱情高漲,DeepSeek Chatbot 可視化界面僅上線首日,訪問量就突破了百萬量級,用戶紛紛表達出對DeepSeek 最新版本與多模態(支持多種信息輸入方式,如文本、圖像、語音等)的期待。資深開發者和企業用戶,對AI Web應用、私有化API調用提出更多需求。接下來,超算互聯網平臺將積極響應用戶需求,上線更多版本和功能。

開源生態引爆產業協同

DeepSeek的開源策略被視爲國產AI生態的“催化劑”,它基於MIT許可證(一種非常寬鬆的開源軟件許可證),將算法、模型及訓練細節向全球開發者開放。DeepSeek 的開源策略帶來的“飛輪效應”顯著:上線20天日活突破2000萬,全球開發者創建47萬個衍生模型(即通過對基礎數據進行處理、清洗、轉換和聚合等操作後得到的數據模型),形成最活躍的開發生態。

開源不僅降低技術門檻,更激活產業鏈協同效應。DeepSeek性能強大的另一方面,也對芯片性能提出了多元且高要求的挑戰。如今,昇騰、沐曦等18家廠商已完成適配。

據中國工業報瞭解,芯片企業江原科技已可單卡支持DeepSeek-R1 1.5B/7B/8B/14B/32B/70B全部6個蒸餾模型(一種將複雜大型模型的知識遷移到更小、更簡單模型的技術)。

“我們在適配DeepSeek-R1這些蒸餾模型的時候並沒有碰到什麼技術難題,基本上達到了開箱即用的適配速度。”江原科技副總裁楊麗慧向中國工業報表示,開源框架使產業鏈各環節能“專注所長”,這次適配和優化能夠達到很高的效率,很大程度上要歸功於開源。DeepSeek是開源大模型的代表,首次實現了開源模型性能追平閉源模型的性能,這對整個產業鏈,特別是國產化產業鏈來說都是非常正向的激勵。

昇騰相關專家向中國工業報表示:“大模型將從技術摸高走向‘技術摸高+工程創新’並行,訓練需求持續增長。頭部玩家將戰略堅定投入預訓練基礎模型創新,豐富模型組合,加速探索AGI(通用人工智能)。”

據中國工業報瞭解,昇騰擁有強大的 AI 計算能力和先進的集羣技術,上述專家表示,雙方合作能讓 DeepSeek 充分利用昇騰的算力優勢,進一步優化模型訓練和推理過程,從而提升大模型的性能、效率和準確性。比如在處理複雜的自然語言理解、圖像識別等任務時表現得更加出色,推動國產大模型技術達到新高度。

中國電信研究院戰略發展研究所副主任分析師魏玥向中國工業報分析說道,之前由於AI大模型對算力要求較高,國產化芯片在性能和成本方面基本沒有優勢,AI大模型主要依賴進口高端芯片,國產化算力的目標客戶和市場空間有限,對智算基礎設施的建設和運營等造成影響。DeepSeek打破了算力桎梏,爲國產化算力帶來新機遇。

場景落地多點開花

DeepSeek的高效推理與多模態擴展能力,使其在雲、邊、端及多行業場景中快速滲透。據中國工業報瞭解,目前各大雲服務商如阿里雲、騰訊雲等十大平臺已全面支持DeepSeek模型;垂類應用中,吉利汽車融合DeepSeek R1優化智能座艙交互,浪潮海嶽大模型則借其複雜推理能力切入高門檻場景。

近日,寧夏交建交通科技研究院聯合北京中關村科金研發的“靈築”行業大模型應用平臺正式接入DeepSeek模型,通過更專業的行業知識問答、技術文檔撰寫、投標文件輔助生成、Excel表格自動生成等衆多場景,藉助大模型技術變革行業工作方式。

“定位於企業服務垂域大模型的海嶽大模型差異化優勢顯著,在接入DeepSeek之後更是解鎖了企業智能化新高度。”浪潮通用軟件有限公司海嶽大模型研發負責人、首席技術架構師周祥國和中國工業報談到,海嶽大模型接入DeepSeek後,一方面,海嶽大模型應用場景可以進一步向專業垂直領域縱深滲透,利用DeepSeek-671B的複雜推理能力,分析預測、科學計算、長文本生成等能力,可以使處理專業型、知識密集型任務的能力大幅提升,更好地切入高門檻場景應用;另一方面,它也爲海嶽大模型橫向擴展應用領域、應用行業,提供了一種相對低成本高效率的垂域大模型訓練範式。

最爲關鍵的是,基於DeepSeek的長思維鏈和多層邏輯拆分能力,海嶽大模型智能應用的準確性得到顯著提升。如,在通用問答場景中,海嶽智能問答助手基於DeepSeek,能夠精準定位並回答覆雜問題,有效解決大模型的“幻覺”問題。

根據第三方國際諮詢機構Gartner預測,DeepSeek將推動AI服務成本年均下降90%,到2027年70%企業將採用“大模型+微調”混合架構。青雲科技市場總監王玉圓向中國工業報介紹說,DeepSeek帶來的不僅是推理成本的降低,更多的是給大模型公司一種新的思路。隨着大模型向着多模態融合深入、推理需求逐漸爆發的趨勢發展,會誕生更多、更專業、更精準的大模型,大模型一定會向垂直領域深度滲透,與實體經濟加速融合。

早在2023年青雲就推出了AI算力雲服務,王玉圓表示:“目前使用中的客戶都肯定了青雲提供的DeepSeek服務。其中不少客戶還要對外提供企業級服務。”

爲加速人工智能大模型技術在企業級場景中的規模化落地,2月14日寧暢信息產業(北京)有限公司(以下簡稱“寧暢”)正式發佈DeepSeek大模型一體機解決方案,搭載業界領先的DeepSeek R1/V3滿血版模型和蒸餾版模型,通過軟硬件深度協同優化,爲企業提供從部署到場景定製的全棧交付能力,幫助製造、金融、醫療、科研等行業突破AI應用瓶頸。

普惠化、差異化成落地關鍵

DeepSeek的成功源於技術突破與成本控制的平衡、開源生態的快速擴張,以及對市場需求的前瞻性把握。

國家超算互聯網平臺相關負責人表示,其帶動了包括強化學習、蒸餾技術(大模型知識轉移給小模型模式)等發展,它不僅挑戰了傳統AI研發路徑,更推動了AI技術的普惠化進程,AI行業應用企業將迎來全面爆發,中國的大市場將孕育出一批類似互聯網時代的超級平臺型和應用型企業。

衆所周知,AI與互聯網不同,它具有去中心化和廣泛滲透的特點。AI的行業和個人應用將更加多樣化。對算力需求增加,二次開發和創新的需要,也會同時增加。

儘管DeepSeek推動國產AI跨越式發展,挑戰亦隨之顯現。近年來,國內三大電信運營商面臨同質化壓力。中國電信率先於2月1日成爲國內首家實現DeepSeek模型落地的運營商級雲平臺。

魏玥向中國工業報分析,智算雲服務是以大模型爲牽引的,而DeepSeek將各廠商能提供的大模型的能力統一到了一個水平,如何形成差異化優勢就成爲主要挑戰和競爭關鍵。

在魏玥看來,雲服務的商業模式簡單來說是以服務的形式向客戶提供IT硬件和軟件,AI大模型則是雲服務商可以提供的軟件之一。在衆多IT硬件和軟件中,雲服務商選擇哪些作爲重點展開資源佈局、技術創新、產品研發和市場營銷等,很大程度上由客戶需求驅動。“中國電信在DeepSeek推出後,緊鑼密鼓地推進模型接入和全場景上架,也是因爲捕捉到了政企和公衆客戶對DeepSeek高漲的興趣和需求。”魏玥說道。

對於行業中質疑“接入DeepSeek是對企業自研大模型否認”的聲音,魏玥給出解釋:“中國電信自研的星辰大模型,將走出與DeepSeek互補的發展路徑,將更多資源投入中國電信更有優勢和積累的領域,比如目前已支持數十種方言的語音大模型,需要深度理解行業知識和客戶需求的各個行業大模型,以及利用DeepSeek蒸餾形成高性能輕量級模型並與終端結合等。”

在魏玥看來,DeepSeek迅速出圈再一次證實,普惠對於科學技術的規模應用至關重要。雲服務依託資源共享和規模效應等,可以促進IT普惠化,是實現AI大模型普惠的關鍵途徑。

未來,如何在普惠性與專業性、開源共享與商業回報間找到平衡點,將決定這場AI產業變革的最終深度。正如周祥國所言,在數字經濟中,無論是數字產業化還是產業數字化,技術都只是手段,真正發揮價值的還在於應用。

來源:中國工業報

責編:左宗鑫

編輯:馬鍶宇(實習生)