爲什麼在探索大模型之餘,百融雲創還要將小模型做精?

最近AI產業出現了新的風向標:小模型正在積極爆發。

在ChatGPT橫空出世後的一段時間內,業內嚴格遵循Scaling Law(規律定律),即更大參數、更大數據和更強算力才能夠收穫更好的模型智能。

但最近“大力出奇跡”的理念正在轉變,海外巨頭例如Mistral、Deepseek、微軟、Meta、Google爭相推出了一系列小巧但功能強大的小模型,甚至連Scaling Law的提出者OpenAI都殺入小模型賽場,發佈了輕量版GPT-4o mini。

種種跡象顯示,AI賽道的競爭格局正在重塑,那就是大模型不再是唯一,而只是AI產業的組成部分,越來越多的小模型、專用模型以及行業定製模型正在嶄露頭角,它們將與大模型互補結合,對外輸出更加智能化的解決方案。

輕量版模型風起時

小模型集體涌現的一大背景是海內外市場競相掀起的模型價格戰,甚至將API調用的價格卷至“白菜價”。激烈的商業競爭下,模型在性能提升之餘,需要更加考慮性價比、更加側重輕巧化落地,從這個角度來說,針對不同的應用場景,將模型參數做小、做精幾乎是種必然。

“大模型競爭會加劇‘倒退’至小尺寸,一些非常小的模型思考能力也會非常好且可靠。”曾參與創辦OpenAI的AI大牛Andrej Karpathy如此表示。

國內市場也不乏輕量版模型佈局者,比如阿里、商湯、科大訊飛、百融雲創等等。作爲一站式服務的AI科技領航者,百融雲創(百融雲-W,6608.HK)在百模大戰交鋒正酣之時便提出重要的是尋求算力參數、用戶意圖與實時反饋之間的平衡,需要警惕陷入“博算力”的誤區。

同時,百融雲創也是爲數不多的堅定推進“模型應用一體化”佈局的AI科技公司。2023年,該公司將AI軟件棧與開發工具棧進行深度整合,搭建形成的AI大模型全棧開發體系覆蓋從模型預訓練、微調、對齊到部署工程優化等環節,極大地壓縮了模型的訓練、迭代和推理成本。

在這一全棧開發體系下,百融雲創搭建了大模型(BR-LLMs)的應用一站式開發平臺——Cybertron(賽博坦),並將大模型與RAG(檢索增強生成)等技術相結合,對外以Agent、Copilot形式落地到金融、出行、租賃、物流等多個垂直場景中。

百融雲創AI創新負責人認爲,並不是所有的應用場景都需要非常強大的模型,某些特定場景比如綠色項目鑑定、智能單據識別等情形,並不依賴龐大複雜的模型結構,更加需要的是藉助大模型幫助實現精準化文本解析、信息抽取和語義匹配,由此可以藉助Cybertron平臺的“知識庫”來優化模型,從而求取模型性能與成本效益之間的最優性價比。

除了成本平衡約束,小模型的崛起還與大模型端側化落地趨勢相關,因小模型可以更好適配終端算力受限的場景。比如微軟把Phi-3系列模型中的3.8B mini版直接裝進了蘋果A16芯片的手機裡,使其可以在Phone 15上運行。另外,Google Gemini系列中的Nano已經在Pixel 8 Pro和三星Galaxy S24上實現部署。機構推測,OpenAI未來推出的GPT-5極有可能是端側的小參數模型版本。

基於端雲協同戰略方向,百融雲創也在發力將智能語音、多模態等技術集成到端側,除了在佈局參數量較大的2D與3D數字人Avatar之外,也在開發高效、低能耗的端側小模型,以應用於手機、車載等智能終端。

未來是混合AI的時代

從技術上來說,輕量級模型參數雖小,但要實現有限算力下的超強性能門檻並不低,需要大量的訓練數據投入、模型優化及對於硬件的有效利用等等。

以百融雲創的智能語音機器人(Voice-GPT)來說,該產品基於Transformer架構,內置了FreeSWITCH(軟交換)、ASR(自動語音識別)、TTS(文字轉語音)、NLP(自然語言處理)等技術,自2018年推出以來持續賦能商業機構存量煥活、新客運營等。目前其在音色、情感、語速、對話層面百融雲創能夠提供“真人級”的互動體驗,同時對客戶語音識別的準確率能達到99%以上。

上述性能的實現除因百融雲創在語音識別、語音理解等通用技術領域的沉澱之外,還得益於其自主研發的一種語音質檢分析方法及系統。該質檢系統在精確捕捉客戶意向、交互情緒之後,會自動反饋生成可視化報告,“反哺”模型優化升級。以百融雲創與某國有銀行合作爲例,通過將Voice-GPT嵌入銀行的零售業務線,相比人工工況,可節省約90%的運營成本。

值得注意的是,百融雲創還借勢決策式AI的力量來增益大模型性能。財報顯示,在2023年,該公司共上線了300餘個小模型,其中針對用戶畫像分析、個性化推薦等蘊含決策式AI技術的小模型可以增強模型間的互補性,提高對於不同應用場景的適配度。

在百融雲創看來,單一模型無法解決垂直行業的所有問題,需要的是多模型、多元化的AI技術組合拳。以大模型爲基座,將其與成熟的小模型結合,再加上充分的行業Know-How,可以提升整個數智系統的成熟度和性價比,從而跑通大模型應用的PMF,構築起更加堅固的護城河。

以百融雲創幫助金融機構搭建的“一站式綠色金融解決方案”爲例,該方案的底層技術包含機器學習、深度學習、OCR、模糊匹配等,在此基礎上搭建的工具層中,既包含模型套件,還有流程引擎、報表工具等,大模型只是其中一個組成模塊,通過模型間的互補增強,整個AI解決方案打開的是包括綠色項目識別認定、環境效益測算、綠色客戶管理等十餘個應用場景。

“未來,模型應用的發展趨勢將呈現大模型與小模型相結合的特點,同時,機器學習平臺將致力於開發更多的大模型組件、工具鏈,構建開閉源模型生態,並與底層算力資源進行緊密綁定。”艾瑞諮詢在報告中如此表示。

本文源自:金融界資訊