關於AI和大模型,工信部、上海市、商湯科技等重磅發聲

以“模速空間——開發者的模力之源”爲主題的2024全球開發者先鋒大會3月23日在上海開幕。本屆大會上,工業和信息化部副部長王江平、上海市副市長陳杰、美國國家工程院外籍院士沈向洋、商湯科技董事長兼首席執行官徐立等圍繞大模型爲代表的生成式人工智能等前沿技術發聲。

工業和信息化部:努力繁榮開源生態 持續完善開源的頂層設計

王江平在致辭中表示,在開發者貢獻共享精神的推動下,開源已全面融入軟件生產過程。工業和信息化部努力爲軟件開發者營造良好的開發環境,做好服務保障,充分發揮開源生產方式的作用,共促軟件產業高質量發展。

一是要努力繁榮開源生態,持續完善開源的頂層設計,發揮全國性開源基金會的作用,打造開源文化傳播的活水泉、優質開源項目的策源地和優秀開源人才的育苗池。

二是打造優質的軟件產品,鼓勵開發者緊跟新技術的發展趨勢,洞察千行百業痛點、難點和需求變化,充分釋放新時代開發者的智慧和才能,打造更多高水平的軟件產品。

三是深化行業應用,堅持好軟件是用出來的,不斷地完善配套政策,開放高端場景和數據資源,支持千行百業利用軟件加快數字化轉型,努力培育新業態、新模式,加速形成新質生產力。

四是要深入開展國際合作,支持廣大開發者和軟件企業以更加開放的姿態,深入交流、廣泛合作,充分利用國內外開源組織的平臺,踊躍發聲,積極貢獻,不乏創新活力。

“近年來,我國軟件產業始終保持高速增長,2023年底產業規模超過12萬億元,有力支持了經濟社會數字化的轉型。我們積極培育以開放、共建、共享、共治爲代表的開源生態,開源理念已在我國深入人心。”王江平表示,開源基礎設施初步齊備,優質的開源項目、活躍的開源社區、優秀的開源貢獻者不斷涌現。中國已成爲全球開源生態的重要的參與方和貢獻力量。

上海:探索大模型新型開源和推廣模式

大會期間,陳杰在發表致辭時表示,上海將進一步發揮超大城市的綜合優勢,加快建設具有更高影響力的人工智能高地。

一是加強核心技術的突破,推動智能芯片關鍵技術和應用適配,打造更多元開放的智能計算生態,支持通用大模型和垂直大模型的研發,積極推進大模型和具身智能的融合發展。

二是進一步加大開源開發的力度,探索大模型的新型開源和推廣模式,推出更多具有示範性、標誌性的應用場景,牽引大模型在金融、教育、醫療等典型領域的垂直應用。

三是加快培育創新創業的生態,深化載體建設,提升服務能級,完善標準體系、安全準則、倫理規範。

陳杰表示,人工智能是上海重點發展的先導產業,長期以來上海集聚資源,加快打造世界級的產業集羣。

“我們的創新成果在不斷涌現。上海人工智能實驗室開發的‘書生浦語’大模型開源發佈,24款大模型也進行了備案,多款人形機器人也即將發佈。”陳杰表示,“產業的載體也在持續拓展,徐匯的模速空間已經成爲創業的熱土,兩萬平方米的載體已經投入使用,吸引了60多家大模型企業入駐,形成了算力調度、開放數據、評測服務、金融服務、綜合服務等全方位的創新創業的保障,產業生態也持續完善。上海率先發布了支持大模型的若干政策、舉措,推動了大模型語料聯盟的實體化運作,開源一系列高質量的語料數據。”

沈向洋:大模型將橫掃所有垂直行業 算力是門檻

“通用人工智能時代,我們的機會到底在哪裡?每個人講來講去都是一個詞——AGI,以大模型爲代表的通用人工智能。”沈向洋表示。應該如何思考通用人工智能,沈向洋提出了五個方面的見解。

一是重新思考人機關係。大模型出現以後,實際上迫使人們重新思考人機關係。計算機經歷了幾十年的發展,真正的贏家是做人機交互。

二是大模型將橫掃所有垂直行業。“以A100爲參考,通用大模型沒有萬卡,不上萬億參數的話,基本上就不太好意思說是通用模型。”沈向洋表示,行業大模型大致上可能是千億卡的訓練規模。未來,最有意思的是個人大模型,個性化參數以後,雲、端等可以結合起來。

三是算力是門檻。“你需要非常強大的算力,千卡、萬卡都是錢堆出來的。”沈向洋表示,“現在講的最多的是Scaling Laws(尺度定律)。隨着參數的增加,你對算力的需求幾乎是平方的關係,隨着參數的增加,數據量也在增加。如果幹GPT 3.5的話,可能要一萬張卡;幹GPT 4的話,可能要兩萬五千張卡;幹GPT 4.5的話,可能要五六萬張卡;大家弄GPT 5的話,可能要十萬張卡。”

四是AI的社會衝擊。它有對民衆的衝擊、公司的衝擊、政府監管的衝擊和社會發展的衝擊。

五是智能的本質。雖然通用人工智能蓬勃發展,但大家對智能的本質沒有一個清晰認識,深度學習理論非常欠缺。沈向洋表示,“很多人相信尺度定律,但今天的深度學習,理論非常欠缺。從宇宙到量子,物理學有一套大一統的理論統一起來,叫作Theory of Everything。今天深度學習沒有這樣的理論,所以叫作Theory of Anything。”

商湯科技:AI模型有知識、推理、執行三大能力層

“最近大家在討論一個熱詞——新質生產力。對於開發者來說,生成式AI是帶來生產力工具、生產力突破的最好行業。”徐立表示。徐立帶來了商湯科技對於AI 2.0時代的新質生產力工具的理解。

徐立把作爲生產力工具的AI模型分成能力圈的三層。這三層之間互有依賴,但又不完全是相關的。

第一層是知識層。世界的知識被灌輸到大模型能力中。今天很多生產力工具、代碼解決的是知識層的問題。“你提出問題或者你需要它補全,需要它解決一些問題,背後的道理是世界上沒有新鮮事,你做過的事情前人做過,所以你可以完成任務。”徐立說。

第二層是推理(演繹)。有了世界知識之後,從一個起點再往前演進。“你可以通過AI的過程,逐步把這個事實推理出來,給出更多的可能性。知識和演繹構造出來的兩層,是作爲生產力工具的大模型最重要的兩層。”他表示,但從推理層面來說,目前成長還相對有限,這也是後面要集中突破的能力之一。

第三層是執行,即如何跟這個世界互動、反饋。

“這三層可以組成一個完備的、對世界提供生產力工具的大模型。”徐立表示,映射到大模型的代碼上,知識是世界知識的全面灌注,中間的推理是用更高階的思維邏輯導出一些知識所不具備的。最後是執行,某種意義上是具身智能的大腦,在執行上會有很大的突破。

責編:嶽亞楠

" Type="normal"@@-->

校對:王蔚

" Type="normal"@@-->