百度沈抖:AI應用在B端率先爆發
(原標題:百度沈抖:AI應用在B端率先爆發)
11月12日,以“應用來了"爲主題的百度世界2024在上海召開。會上,百度集團執行副總裁、百度智能雲事業羣總裁沈抖分享了百度智能雲在大模型產業落地方面的最新進展,並在企業級AI原生應用開發、大模型開發調優等方面發佈一系列全新功能。
目前,百度智能雲擁有中國最大的大模型產業落地規模。超過六成的央企和大量的民營企業,正在聯合百度智能雲進行AI創新。百度智能雲千帆大模型平臺已經幫助客戶精調了3.3萬個模型、開發了77萬個企業應用、文心大模型日均調用量超過15億次。
沈抖表示,AI應用正率先在B端爆發。由企業級大模型工程平臺、異構算力平臺組成的新型AI基礎設施,將替代傳統雲計算,爲大模型應用在企業生產力場景中的規模落地提供關鍵支撐。
(百度集團執行副總裁、百度智能雲事業羣總裁沈抖)
AI應用率先在B端爆發
60%央企使用百度雲AI服務
2024年,大模型產業落地顯著提速,在行業場景覆蓋廣度、落地深度等方面都有顯著提升。目前,百度智能雲已經在能源、電力、製造、金融、交通、政務、互聯網、教育、電商等數十個行業、幾百個場景中落地大模型應用。
在能源電力行業,國家電網正在圍繞文心大模型、千帆平臺,結合電力行業高質量數據,聯合百度共創電力行業大模型基礎底座,並在調度、設備、營銷等六大專業領域深入探索。目前,已經在電力設備運檢、供電服務等電力行業核心場景成功完成應用落地。
在餐飲行業,中國最大的餐飲公司百勝中國,基於文心大模型打造了AI智能客服系統,爲旗下包括肯德基在內的多個品牌提供服務。百勝中國CTO張雷表示,目前,AI客服每天能夠爲百勝中國處理超過15萬次消費者溝通,問題解決率高達90%;在輔助人工方面,AI客服能夠快速歸納、總結消費者訴求,輔助客服更快速、更精準地回覆,整體效率提高10%!此外,大模型還能夠實時評估客服服務質量,幫助百勝中國進一步提升服務水平。
(百勝中國CTO張雷)
目前,百度智能雲已經擁有中國最大的大模型產業落地規模。已有超過六成的央企和大量的民營企業,正在聯合百度智能雲進行AI創新,文心大模型日均調用量超過15億次。
沈抖認爲,AI應用正率先在B端爆發,而“企業級”AI應用大量涌現的背後,是產品服務形態的突破性變革與能力的大幅拉昇。
以百度智能雲“曦靈”數字人平臺爲例,全新升級的“文生3D數字人視頻”功能,能夠大幅提升電商、教育、文旅等行業的內容創作、營銷推廣效率,大幅降低成本支出。
比如,在電商領域,過去拍攝製作真人產品推廣短視頻需要專業團隊花費幾天時間才能完成。而“文生3D數字人視頻”只需一句話,就能生成符合不同行業場景特色的3D數字人形象和專業靈動的視頻,成本僅有傳統方式的1%,工作效率提升超過1倍!
沈抖表示,無數的AI應用,正在重新定義人與數字世界、物理世界之間的交互方式。現在,這些應用已經深入到企業“研產供銷服”的各個環節,併成爲企業提升競爭力的關鍵要素。
模型精調需求大增
千帆平臺發佈工作流Agent、模型蒸餾兩大開發功能
傳統的企業業務中,複雜的工作和任務往往過度依賴專家經驗和固有流程,即工作流;即便在數字化系統中,傳統工作流配置依舊是沒有“大腦”的機械執行,難有實質性的突破。
大模型具備強大的意圖理解和泛化能力,能夠充分理解工作流的目的與內涵,相當於一顆會思考的“大腦”;通過與企業工作流相結合,又可以有效解決大模型“幻覺”問題,增強大模型“控場能力”,保障複雜任務的決策與執行準確。二者結合,構成了智能時代企業真正需要的“數字員工”。
本次大會,百度智能雲千帆大模型平臺正式發佈“工作流Agent”功能,旨在幫助企業快速開發出面向複雜對話場景的AI應用,快速擁有專業水平的“數字員工”。通過學習各種企業流程與規範,工作流Agent能夠適應不同崗位職責,快速規模化複製,大幅提升企業運轉效率。
以保險行業爲例,目前百度智能雲正在基於工作流Agent探索、落地車險續保售前數字員工。過去,車險續保的工作指導包含大量流程、子流程、文檔等內容,優秀銷售人員稀缺,且培養週期往往長達一到兩年。基於工作流Agent開發金牌銷售數字員工,則最快可以在1小時內完成、上線,大幅提升了企業車險業務的核心生產力。這樣的工作流Agent可以快速集成到百度搜索、微信公衆號、企業官網等業務系統中,便利觸達用戶。
目前,由工作流Agent開發的“續保金牌銷售”,已在百度智能雲智能客服平臺“客悅”開放體驗。(https://keyue.cloud.baidu.com/unit/world-conference)
“我們在實踐中發現,行業應用要達到更專業的效果,需要深入模型層面進行定製開發或精調。精調模型的數量一定程度上反映了大模型與產業結合的深度。這個數量今年增長地特別快,在千帆大模型平臺上,每天有超過一半的調用量是來自精調後的模型。”沈抖說。
在醫療行業,杭州全診醫學基於千帆平臺和文心大模型打造了AI醫療助理應用,能夠在導診、預診、診間、入院、手術、隨訪等全階段服務醫生患者。以輔助醫生撰寫病歷爲例,全診醫學通過使用20萬份精標病歷數據對大模型進行精調,使AI醫療助理的醫學用語更準確、更規範,大幅提升病歷內容質量。病歷生成的準確度提升了45%,病歷書寫時間減少75%,醫生的接診量提高了20%,造福更多病患。
而針對數據積累不足,難以承擔人工精標數據成本的企業,千帆平臺全新推出模型蒸餾解決方案,幫助企業利用文心旗艦級大模型生成專業數據,完成全流程的數據準備工作,加速啓動模型精調工作。
以百度電商數字人直播平臺“慧播星”爲例,通過使用文心旗艦模型ERNIE 4.0 Turbo萃取訓練數據,生成模型精調數據集,對輕量級大模型ERNIE Lite進行精調,精調後的模型在特定場景中的效果與旗艦模型基本持平,並擁有更快的推理速度,成本大幅下降90%。模型上線以後,數字人直播間的互動率大幅提升11%,帶貨轉化率也實現了極大提升。
大算力管理依然是最大難題
百舸4.0升級十萬卡集羣跨地域部署能力
大算力是大模型落地的基礎條件。爲了滿足企業落地大模型從集羣創建、開發實驗,到模型訓練、模型推理的全旅程算力需求,百度智能雲推出百舸AI異構計算平臺4.0,服務了中國石化、中海石油、長安汽車、上海交通大學、地平線等行業龍頭企業和機構,目前已具備了成熟的10萬卡集羣部署和管理能力。
沈抖表示,爲了支撐大模型的進一步高速發展,百度智能雲提前佈局,是行業內最早打磨10萬卡集羣能力的廠商之一,並通過技術創新解決了集羣算力供給、跨地域部署兩大核心難題。
首先,在算力供給方面,百舸平臺兼容崑崙芯、昇騰、海光DCU、英偉達、英特爾等國內外主流AI芯片,支持同一智算集羣中混合使用同一廠商不同代際芯片、不同廠商芯片,最大程度上屏蔽硬件之間差異,幫助中國企業擺脫單一芯片帶來的高溢價和供應鏈風險。
目前,在萬卡規模集羣上,百舸能夠將兩種芯片混合訓練大模型的效率折損控制在5%以內,達到業界最領先的水平。未來,“一雲多芯”將成爲中國企業的必然選擇。
另一方面,10萬卡規模超大集羣需要佔據大概10萬平方米空間,相當於13個標準足球場;每天則要消耗大約300萬千瓦時的電力,相當於北京市東城區一天的居民用電量。這種對於空間和能源的巨大需求,遠超傳統機房部署的承載能力,而跨地域機房部署又會給網絡通信帶來巨大挑戰。
通過設計高效的網絡拓撲結構,結合模型切分優化和跨地域無擁塞高性能網絡方案,百舸能夠在橫跨幾十公里的多機房組成的萬卡規模的集羣上,將單一模型訓練任務的性能折損控制在4%以內,達到業界最領先水平。