2024中國國際數字經濟博覽會:林詠華談大模型

希望大模型在更多行業發揮作用

——訪北京智源人工智能研究院副院長兼總工程師林詠華

在2024中國國際數字經濟博覽會上,北京智源人工智能研究院發佈了“行業數據集—場景應用創新計劃”第一期成果。10月24日,就大模型促進行業發展等話題,本報記者採訪了北京智源人工智能研究院副院長兼總工程師林詠華。

記者:“行業數據集—場景應用創新計劃”成果頗受關注,這個創新計劃發起的背景是什麼?

林詠華:我們知道,數據決定了大模型的智力邊界。當前,在通用領域,大模型初步呈現了一定的場景應用能力,然而,在醫療健康、教育等垂直領域,大模型所展現的能力尚不足以支持專業應用,其主要原因在於模型訓練缺乏高質量可用的行業數據集。

爲解決大模型垂直領域訓練數據稀缺與質量問題,推動大模型在千行百業的應用創新與發展,中國互聯網協會、中國人工智能產業發展聯盟數據委員會、北京智源人工智能研究院於今年6月正式發起了“行業數據集—場景應用創新計劃”第一期。

創新計劃第一期歷時3個月,近百家企業報名,覆蓋醫療、教育、金融、旅遊、法律、醫療等10個行業。

記者:“行業數據集—場景應用創新計劃”第一期的成果及落地情況如何?

林詠華:以醫療行業爲例,據測算,經過訓練後,行業大模型的能力提升了20%。

通過與多家企業和機構的緊密合作,北京智源人工智能研究院成功推動了一系列行業解決方案的落地應用,這些方案涵蓋金融財稅、農產品價格監測及優化、汽車行業智能客服及維修檢測輔助、智能簡報與輔助撰寫、合同審查及風險評估、法律問答、教學教輔等多個行業的不同應用場景。

我們當初發起“行業數據集—場景應用創新計劃”第一期的目的是希望大模型在更多行業發揮作用,現在看來,這個目的在一些行業實現了。

記者:我們注意到,京冀等地企業在解決方案落地過程中表現亮眼,請介紹一下相關情況和以後的打算。

林詠華:解決方案落地過程中,京冀等地4家企業表現良好,獲評“技術創新先鋒企業”,河北的長城汽車股份有限公司入選。長城汽車股份有限公司深耕智能化領域,在智能駕駛、智能座艙、智慧底盤等方面進行全產業鏈佈局,在售後智能技術支持等方面實現了技術突破。近年來,河北企業在數字經濟新賽道上越跑越快。

吸收“行業數據集—場景應用創新計劃”第一期的成果,9月25日,北京智源人工智能研究院正式發佈了全新升級的智源行業數據集2.0版。智源行業數據集2.0版包括了覆蓋30個行業的分類預訓練數據集,新增了行業指令數據集,全面提升了數據的行業覆蓋、質量和種類。

依託該數據集,下一步,北京智源人工智能研究院將與魔搭社區、中國互聯網協會人工智能工委會、中國人工智能產業發展聯盟數據委員會共同發起“行業數據集—場景應用創新計劃2.0暨行業數據應用大賽”。我們將提供算力、技術方面的輔導和支持,歡迎更多的河北人工智能企業和開發者參加這個活動,我們將幫助他們更加高效地利用大模型技術賦能生產力。(河北日報記者 曹 智)