“中國BAT” 大戰 “美國OMG”
不止百模大戰,也是中美爭鋒。
來源 | AI黑馬
作者 | 張沉浮
早在2017年,國家就出臺了新一代人工智能發展規劃,明確將人工智能列爲國家戰略。今年4月28號,中央政治局會議更是重點提及要重視通用人工智能的發展,營造創新生態。7月13日,《生成式人工智能服務管理暫行辦法》公佈,鼓勵技術在各行業和各領域的創新應用。
人工智能三大要素,算力、算法和數據。其中,中國兩國在算力方面差距不大,按2022年年底的數據,美國佔全球算力36%,中國佔31%。
不可否認的是,中美在AGI和AIGC上還是存在差距的。
大模型的基礎是深度學習框架,美國的Tensorflow和PyTorch已經深耕深度學習框架生態多年,雖然國內企業也自主開發了深度學習框架,但市場考驗還不夠,生態還有待打造。
鄔賀銓院士認爲:“在中國從事AI研究的技術人員不算少,但具有架構設計能力和AIGC數據訓練提示師水平的人才仍然短缺。在ChatGPT出現之前,有人認爲中國在AI方面的論文與專利數與美國不相上下,ChatGPT的上線使我們看到了在AIGC上中美的差距,現在是需要清楚認識和重視我們面對的挑戰,做實實在在的創新。”
現在許多公司和研究機構都處在“百模大戰”之中,不論初創公司還是大公司,充分競爭的市場纔是好市場,充分競爭的公司纔是好公司。
張亞勤院士認爲:“大模型時代纔剛剛開始,42公里的馬拉松我們剛跑到5公里,算力、數據不夠都不成問題。中國在PC時代落後於美國,但在移動互聯時代領先於美國(數字支付、微信、短視頻),AI時代要給創業者、科研人員、企業更多信心。”
一些產業從業人士指出,在AI大模型上中美爭鋒,主要是“OMG”和“BAT”的戰鬥。
我們依次看一下這六家企業:OpenAI、Meta、Google、百度、阿里、騰訊。
1)Open AI
2022年11月30日,OpenAI發佈ChatGPT。作爲ChatGPT的母公司,Open AI引領着AI大模型的發展。2016年微軟投資了OpenAI十億美金。2020年推出的 GPT-3 ,有1750億參數,是大模型的技術。2022年推出的 ChatGPT 是基於大模型的產品形態。2023年微軟繼續投入100億美金,OpenAI+微軟已成爲最具影響力的AI力量。
2)Meta
Facebook先是押注元宇宙,如今又入局AI大模型。扎克伯格是蹭熱點,還是全面發力?過去Facebook的使命是“Make the world more open and connected”,這個話也是非常具有互聯網時代特色的,就是開放、連接。如今,扎克伯格已然意識到這個東西不夠了,他說我們要“Bring the world closer together”,怎麼才能“closer together”呢?還是要通過用戶畫像、通過人工智能的技術,找到人和人之間相同的興趣,把他們連接在一起。MetaAI發佈了開源大模型LLaMA,可以在單個GPU上運行。
3)Google
2023年5月10日,谷歌在兩個小時的大會裡提及“AI”200多次,並一口氣推出了AI大模型PaLM2、AI機器人Bard、AI搜索、AI辦公等多款模型和產品,一套完整的AI系統全面嵌入谷歌旗下超過25個產品和應用。
圖注:谷歌搜索將在產品搜索頁面同時展示其產品描述、評論、價格和展示圖等信息。
4)百度
2023年3月16日,百度在中國率先發布文心大模型。據瞭解,百度是中國最早佈局大模型的公司,於2019年就開始了預訓練模型 Ernie1.0。目前,文心大模型家族已形成文心大模型+工具與平臺+產品與社區的龐大大家族。
除了依託百度搜索的海量數據優勢,百度在AI大模型領域的“四層模式”(芯片層+框架層+模型層+應用層)纔是其在“百模大戰”中的核心競爭力。百度之所以能夠在Google、Meta、阿里、騰訊等大廠之前先做出來“文心一言”,就是因爲這四層的全棧佈局。
百度在芯片層的佈局是崑崙芯,已經量產幾萬片。崑崙芯第三代,預計2024年初量產。飛槳屬於框架層,文心屬於模型層。
5)阿里
2023年,4月11日,阿里發佈大模型。張勇表示,阿里巴巴所有產品未來將接入“通義千問”大模型,進行全面改造,包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬、餓了麼等。他認爲,面向AI時代,所有產品都值得用大模型重新升級。
阿里雲也面向企業提供普惠的AI基礎設施和大模型能力。未來每一個企業都可以通過阿里雲調用通義千問的全部能力,也可以結合企業自己的行業知識和應用場景,訓練自己的企業大模型。比如,每個企業都可以有自己的智能客服、智能導購、智能語音助手、文案助手、AI設計師、自動駕駛模型等。
圖注:釘釘會議能夠隨時生成會議記錄並自動總結會議紀要、生成待辦事項。
6)騰訊
直到2023年6月19日,騰訊才姍姍來遲地開了場發佈會。騰訊對外公佈行業大模型研發進展,宣佈將助力企業構建專屬大模型及智能應用,爲企業提供MaaS一站式服務。
據瞭解,騰訊將爲文旅、政務、金融等10餘個行業,提供超過50個大模型行業解決方案。比如,基於騰訊雲智能媒體AI中臺,爲央視打造人工智能開放平臺,提供智能標籤、修復、智能翻譯等30多種算法。爲上海大學,利用騰訊雲教育行業大模型能力,構建專屬的教育行業大模型基礎平臺,覆蓋在校生和畢業生全生命週期業務,將提供教學助手、人才培養、招生就業助手和作業批改等服務;此外,騰訊企點、騰訊會議、AI代碼助手等多款頭部SaaS產品,也迎來了能力升級。
我們認爲,中國大模型戰隊中除了BAT,還應該重點關注四家企業和機構,360、華爲、智源和智譜。
百度、阿里、騰訊、360、華爲、智源、智譜,就好比是中國AI大模型的“戰國七雄”。
7)360
2023年6月13日,360集團對外發布了360智腦大模型。360關於大模型的戰略是八個字:“兩翼齊飛、四路併發”。
“兩翼齊飛”,一方面要發展大模型的技術,另一方面要場景化、產品化、平民化、垂直化。只是模仿ChatGPT,做了一個搜索對話框,做了一個聊天機器人,指望這個東西帶來工業革命是不現實的。場景分爲四路:一是To C的場景,搜索引擎+瀏覽器和桌面。二是面向中小企業。三是面向政府、大型企業。四是面向行業的GPT,跟有行業數據的合作伙伴相結合。
8)華爲
2023年7月7日,華爲發佈盤古大模型3.0.“不作詩、只做事”、“AI 重塑千行百業”、“AI for Industries ”華爲的盤古大模型聚焦行業價值場景,圍繞行業重塑、技術紮根、開放同飛三大方向,爲行業客戶提供服務。
盤古大模型3.0是一個完全面向行業的大模型系列,包括5+N+X三層架構。
華爲從2019年到2021年之間就開始立項做盤古大模型。2021年發佈了盤古NLP大模型、盤古機器視覺大模型、盤古科學計算大模型、盤古藥物分子大模型。到2022年在行業中拓展應用,發佈了盤古礦山大模型、盤古氣象大模型、盤古海浪大模型、盤古金融OCR大模型。2023年7月7日發佈的盤古大模型3.0,重點提及了5個基礎大模型(自然語言、多模態、視覺、預測、科學計算)和7個行業大模型(政務、金融、製造、藥物分子、礦山、鐵路、氣象)。
9)智源
2023年6月9日,智源研究院院發佈了全面開源的“悟道3.0”系列大模型及算法。繼 2021 年悟道大模型項目(悟道1.0於2021年3月發佈)連創“中國首個+世界最大”紀錄之後,智源 “悟道3.0 ”進入全面開源新階段,帶來一系列領先成果:“悟道·天鷹”(Aquila)語言大模型系列、天秤(FlagEval)開源大模型評測體系與開放平臺,“悟道 · 視界”視覺大模型系列,以及一系列多模態模型成果。
10)智譜
2023年3月,基於千億基座模型的ChatGLM開啓內測。智譜AI由清華大學計算機系的技術成果轉化而來,致力於打造新一代認知智能通用模型,提出了Model as a Service(MaaS)的市場理念。公司於2021年合作研發了雙語千億級超大規模預訓練模型GLM-130B,並主導構建了高精度通用知識圖譜,把兩者有機融合爲數據與知識雙輪驅動的認知引擎,並基於此千億基座模型打造ChatGLM。此外,智譜AI也推出了認知大模型平臺Bigmodel.ai,形成AIGC產品矩陣。通過認知大模型鏈接物理世界的億級用戶、賦能元宇宙數字人、成爲具身機器人的基座,賦予機器像人一樣“思考”的能力。
最後,我們回看幾個問題。
1、中國爲什麼一定要自研AI大模型?
基於戰略安全角度和經濟商業價值,都能得出中國一定要自研AI大模型這一確切答案。從中美貿易戰到芯片卡脖子等,中國政府必然要保證關鍵技術的自主可控和國家安全。並且OpenAI和微軟的實踐也表明了,AI大模型將有巨大的商業價值,中國企業需要抓住這一機遇。
李開復也認爲,“使用海外的開源大模型就可以做出中國版的OpenAI”的說法是絕對錯誤的,技術的天花板將決定你永遠做不出達到或超越GPT-4.0技術水平的大模型。此外,拿海外訓練出來的大模型,在國內做微調是值得商榷的。因爲國內外的文化習慣、法律法規不同,所以自主創新做大模型是中國企業的必經之路。
2、中國AI大模型產品何時能趕上“ChatGPT”?
李彥宏曾公開表示,文心一言與ChatGPT版本差距並不明顯,可能只相差一兩個月的時間。對於這種說法,王小川則調侃稱,媒體採訪的可能是平行世界的李彥宏。
王小川認爲國內目前的大模型和ChatGPT的差距不可能只是兩個月。“如果在追上目前ChatGPT-3.5的水平,大概今年內就能做到,但如果要追上未來的GPT-4和GPT-5,預計要3年左右的時間。”
艾瑞諮詢認爲,與ChatGPT功能對標的大語言模型(Large Language Models, LLMs),目前國外主要有Google推出的Gopher、LaMDA以及Meta的Llama等;國內爲百度首發的“文心一言”、360發佈的大語言模型、阿里發佈的“通義千問”、商湯發佈的 “商量”等。雖從對話和文本生成的直觀體驗看ChatGPT略勝一籌,但對於Google等國外大廠而言,克隆ChatGPT並不存在太高壁壘,當前暫時落後主要是出於公司戰略與技術理念差異,選擇了不同技術路線,隨着各家探索成果和新技術方法的實踐不斷推進,仍存在對GPT系列模型趕超的可能。對百度等國內大廠而言,則在數據、算力、工程化能力等關鍵要素上存在短板,短期內難以對國外領先大模型實現趕超,爲跟隨者角色,長期更需要國內AI全產業鏈整體進化。
3、AI大模型的競爭關鍵和創新機會在哪?
1)通過OMG可以看到:ChatGPT在邏輯推理、上下文理解等方面的能力,是模型參數量達到該量級後“涌現”出的,即所謂的“大力出奇跡”。在此之前,堅定的科研初心,豐厚的資本支持,是中國科技企業需要向美國科技企業認真學習的。
2)通過百度可以看到:“基礎層+模型層+應用層”,底層技術的積累至關重要。無論是芯片層的崑崙還是框架層的飛槳,“根技術”的深厚決定枝葉的生長速度。
3)通過阿里可以看到:“互聯網時代的產品都值得用AI重新升級”。阿里是這麼說的,也是這麼做的。必然有後浪高舉AI原生的旗幟,顛覆馬雲的互聯網思維。
4)通過騰訊和華爲可以看到。無論是雲服務還是大模型,競爭的核心和商業的重點,都指向行業ToB服務,AI大模型要更有行業價值,也要“離錢更近一點”。
5)通過360可以看到,數字人是大模型重要的應用入口,大模型的發展要和國家的產業數字化戰略相結合,企業級垂直大模型更爲關鍵。把大模型拉下神壇,變成每個企業、政府部門都感覺能夠直接使用的東西。
4、中小企業該如何面對AI大模型?
李開復說:
我們完全可以想象今天的Word、PowerPoint、Excel、Photoshop等應用通通都會用AI大模型重寫一次,而且重寫之後它的用戶體驗會變,甚至商業模式也會變。
李彥宏說:
業界有一種說法,大模型時代來了,每一個產品都值得重做一遍。但誰真正重新做了一遍呢?百度要做第一個把全部產品重做一遍的公司,不是整合,不是接入,是重做,重構!
也有企業保持理性:
折騰是找死!不折騰是等死!
大模型更像是巨頭的遊戲和軍備競賽,它和芯片、語料息息相關,如果沒有巨量的資金儲備,很難真正做大模型;非巨頭還是要理性看待大模型。
大模型是基礎建設,行業模型與應用場景等將擁有更大的發展機會?
創業黑馬近期舉辦了兩期AIGC產業營,參與者大多都是中小企業,300家。
通過其數據可以發現:25%的企業已經開始探索和應用AIGC,傳統產業的企業期望利用AIGC轉型升級,300家企業分佈在企服、消費、培訓、文娛、營銷等各個行業領域。
但無論如何,中小企業不得不去思考:
有沒有能力做AI大模型或行業模型?
自己的行業會不會出現新的AI產品?
新的AI產品會不會顛覆自己?
自己有沒有能力做出那個AI產品?
自己原有產品如何基於AI新技術進行迭代創新?
自己基於大模型做微調做應用層創新?
基於國內外的哪個大模型做應用研發和產品創新?
不考慮大模型,直接用AIGC的產品或工具,簡單粗暴降本增效?
最後,還有一點值得大家注意:
“十年前的傳統觀點認爲,人工智能首先會影響體力勞動,然後是認知勞動,再然後,也許有一天可以做創造性工作。現在看起來,它會以相反的順序進行。”
高科技投機機構ARK Invest預測,以AIGC爲代表的新一代人工智能技術將輔助知識工作者(包括教師、律師、醫生、財務、程序員等白領職業)提高工作效率。報告預測,到 2030 年,AI 將大幅提高知識工作者的工作效率,平均工作效率增加140%,新一代人工智能技術將有可能大幅度降低腦力勞動者的工作強度。如果這一切成爲現實,或將是繼人類歷史上由於動力革命而擺脫繁重的體力勞動之後,人類社會發生的又一次偉大的技術革命。
上面引號裡那句話,是ChatGPT創始人,山姆·阿爾特曼,說的。
他還說過一個觀點:
“沒必要擔心被AI取代,人類和機器終將融爲一體。”