尋找“性價比” 行業大模型瞄準場景落地與商業化

本報記者 李暉 北京報道

巨大技術投入的盡頭仍是如何創造商業價值。

隨着大模型進入規模化落地應用階段,近期,一波行業大模型密集扎堆發佈。2024年12月底,百川智能推出全鏈路領域增強金融大模型Baichuan4-Finance,同期,中關村科金推出的助大模型平臺2.0,更早前,奇富科技披露已將大模型引入小微金融場景……

相比巨頭在通用大模型領域的算力與技術廝殺,特定場景的行業大模型無疑“更接地氣”。

“2024年有很多雲廠商來找到我們。因爲我們在一線,有業務場景,可以直接去構建大模型產品得到用戶反饋。”一位金融科技公司高管向《中國經營報》記者透露。

中國工程院院士、清華大學計算機科學與技術系教授鄭緯民近期在接受記者採訪時就表示,通用大模型不需要太多,我認爲全國有三四個就夠了。大模型下一步發展還是如何有更好的應用,並構建更好的軟件生態。

技術大投入難持續

算力、算法、數據是大模型發展的關鍵三要素。其中,算力和數據被行業普遍認爲是現階段企業間的最大壁壘。行業大模型追求落地效果的呼聲漸盛,首先來自算力和數據的高投入。

在算力上,隨着大語言模型規模越來越大,參數甚至高達萬億級別,動用一次訓練所需要的資金、人力和穩定性能源愈發昂貴。

鄭緯民在接受記者採訪時表示,基礎大模型需要極大的計算量,需要很大規模的顯卡,需要計算也需要存儲,而具體場景上的行業模型則不需要這樣的計算量。

他以一家知名大模型創業公司爲例透露:該公司產品邏輯在於數據更多、模型更大、更長的上下文窗口,帶來更好的輸出效果。但更高的推理負載意味着更多的推理卡,卡多了存儲器超負荷,使用流量一旦激增,就有可能帶來宕機風險。據其透露:這家大模型公司此前連續買了五次算力卡都沒有解決這個問題。

這一成本顯然絕大多數機構“燒不起”。據記者向業內瞭解,大模型的環節分爲訓練和推理,如果是從訓練開始,整個成本確實很大。也有機構人士向記者透露,推理成本上2023年仍然較高,但隨着技術迭代,2024年推理的成本其實已經無限低了。

數據問題則是另一大瓶頸。根據Epoch AI Research研究預測,到2026年,現存的用於AI模型訓練的高質量語言數據將耗盡。信息技術分析公司Gartner的一份研究報告也提到,到2030年合成數據(即製造數據),將成爲AI模型的主要訓練數據來源。

市場共識在於,大模型行業的發展已不再是狂飆狀態,而是真正進入精細化落地的進程中。

鄭緯民認爲,人工智能進入大模型時代的兩大特點是AI基礎大模型從單模態向多模態發展,以及大模型加速行業智能化升級。在他看來,大模型時代有三類企業將會脫穎而出:研發大模型的企業、推動大模型應用落地的企業,以及支持大模型計算系統的企業。

其中,行業大模型公司則屬於第二類。

中關村科金總裁喻友平在接受記者採訪時表示,市場真正需要的是能夠迴歸商業本質的實用工具。行業大模型必須提供端到端的解決方案,能夠幫助企業解決實際問題,並具備全鏈條的服務能力。

場景應用呼喚商業價值

2024年11月,央行、國家發展改革委等聯合印發《推動數字金融高質量發展行動方案》,既提到“強化數字技術支撐能力”以助力金融業數字化轉型,也突出要“運用數字技術提升重點領域金融服務質效”。這也使金融機構在推動AI落地上有了強烈動力。

從領域來看,金融無疑當前大模型落地的一個重要領域。恆生研究院市場調研數據顯示,2024年前三季度,我國公開披露的大模型項目中標總額達到20.75億元,較2023年全年增長163%。金融行業的大模型中標項目數量爲66個,項目金額達1億元,佔比4.9%。2024年1月至11月,金融行業的大模型中標項目數量達到103個,項目金額增至2億元。

雖然從絕對佔比來看,金融行業在全行業並不算高。但由於金融較之其他行業對於技術和安全的標準更高,因此能夠在金融領域應用的大模型能力,往往具備向其他領域遷移的條件,即“向下兼容”。

前述金融科技公司高管就透露:2023年制定OKR時,公司管理層明確指出要找到大模型在金融科技領域最佳的應用。

企業側對於場景的價值已有相當共識。奇富科技首席算法科學家費浩峻就表示,如果技術對於大模型的權重是40%,對於業務場景的理解和深耕則要達到60%。應用場景、數據飛輪、智能體是大模型產品三個必要條件。

在喻友平看來,“平臺+應用+服務”的模式是企業大模型落地的最佳路徑。他指出,大模型平臺之間的差異主要體現在三個方面:算力的大小、模型的響應速度,以及以智能體爲代表的應用構建能力。在智能體應用構建中,場景模板是最關鍵的因素之一。

怎麼理解這種場景價值?喻友平告訴記者,對於場景價值和知識能力的理解,雖然方法論是通用的,但數據和行業場景並不通用。例如,保險銷售和財富產品銷售的外呼場景就不能通用,因爲它們的流程不同,即使是營銷外呼也可以衍生出多種場景,每個行業的需求也各不相同。

在一定條件下,這種場景能力有可能實現遷移,尤其是在營銷獲客方面。喻友平舉例說,只要將某個行業的垂直場景數據和知識提取出來,並注入相關行業大模型中,一旦模型訓練完成,就可以在另一個領域繼續使用,從而實現標準化。這種能力遷移和標準化的可能性,爲大模型在不同行業中的應用提供了廣闊的前景。

目前來看,大模型在金融行業實際生產中的主要用途爲內部賦能以及客服、外呼、獲客等業務環節。據喻友平透露,以智能營銷場景的大模型外呼爲例,公司在某家裝平臺活動營銷轉化率達到了3.5%,對比傳統AI外呼大幅提升130%,與人工座席相比僅有17%的差距;在智能運營環節在金融場景業務中,可以實現綜合線索留資率提升19.8%……

如何從降本增效逐步升級到高效提升業務核心收益是關鍵。費浩峻也透露:目前已經將AI能力和金融大模型集成到新的信貸業務系統Focuspro2.0當中,既可以支持消費貸業務,也可以支持小微金融的業務,做到較好識別欺詐風險。

不過也有業內人士透露,一些大模型在金融業務裡使用後剛開始的效果還是不錯的,但是隨着整個迭代變多以後效果出現了不穩定。就要深入一線和業務團隊不斷溝通,這些都是需要持續強化的領域。

(編輯:李暉 審覈:何莎莎 校對:翟軍)