模型推理成本下降最高99%!百川智能發佈一站式大模型商業化解決方案|鈦媒體AGI

百川智能創始人、CEO王小川

10月31日消息,鈦媒體App獲悉,王小川創立的通用 AI 公司百川智能今天發佈包括Baichuan4-Turbo、Baichuan4-Air兩款模型在內的一站式大模型商業化解決方案,即1+3產品矩陣(全鏈路優質通用訓練數據,Baichuan4-Turbo、Baichuan4-Air兩款模型和全鏈路領域增強工具鏈)。

百川智能表示,相比Baichuan4,Baichuan4 Turbo模型效果提升50%,推理成本下降85%,首Token速度提升51%,Token流速度提升73%;Baichuan4 Air是首創PRI(金字塔、殘差、區間)、MoE(混合專家)架構模型,效果持平下推理成本下降99%,首Token速度提升77%,Token流速度提升93%。同時,企業可以將兩款模型進行調優和增強,百川智能1+3產品矩陣將模型多場景可用率提升到96%。

百川智能創立於2023年4月10日,由搜狗公司創始人、前CEO王小川創立,旨在打造中國版的OpenAI,構建中國最好的大模型底座,幫助大衆輕鬆、普惠地獲取世界知識和專業服務,並在醫療與行業領域應用落地。

公司成立以來,百川智能以月度爲單位相繼推出14款大模型,包括Baichuan-7B/13B、Baichuan2-7B/13B、Baichuan3系列、Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2-Turbo、Baichuan-NPC等,涵蓋開源、閉源、學術科研、國產算力等多個維度。

當前,百川智能業務方向主要是“超級智能+超級應用”雙輪驅動,發力領域(AI顧問)和醫療大模型(AI醫生)。

模型領域,今年5月,百川智能發佈多模態能力的Baichuan 4模型,通用能力提升超過10%,數學和代碼能力分別提升14%和9%,基準評測中,模型能力位列國內第一。同時,百川已經推出首款AI助手“百小應”,不僅支持多步搜索、智能定向搜索等能力,而且希望讓 AI 從工具變爲夥伴,逐步具備完整能力。

醫療領域,今年7月,百川智能首次對外展示To B 端 AI 健康顧問,基於自研的通用醫療增強大模型產品。

融資方面,截至目前,百川智能已公佈以200億估值開啓B輪融資,公開融資總額已超過50億元人民幣,投資方包括阿里、騰訊、小米、深創投、基石資本等機構,已躋身於大模型獨角獸行列。

具體到此次產品上,由於Baichuan4-Turbo、Baichuan4-Air均爲百川智能自研,所以這些優質通用訓練數據與兩者的數據分佈高度一致,結合超參動態搜索和自適應配比等算法,與企業私有數據混合微調,顯著提升了兩個模型多場景下的可用率,在金融、教育、醫療等場景下的專業細分任務平均可用率高達96%,位居行業首位。

硬件層面,百川智能通過大量適配工作解決了不同硬件的適配問題,目前能夠高效適配英偉達4090/A/H系列、華爲昇騰、寒武紀、高通、MTK、天數(智芯)等企業的多種主流AI芯片。

商業化層面,目前百川智能已經服務了數千家客戶,包括北電數智、完美世界遊戲、愛奇藝、360集團、生學教育、愛學堂等,並且與信雅達、用友、軟通動力、新致軟件、達觀數據、華勝天成等多家行業生態夥伴,以及華爲、中科曙光等硬件廠商,中國移動、中國電信、中國聯通等運營商達成合作,構建百川大模型生態。

百川智能強調,全新的一站式解決方案,能夠幫助企業以最低成本實現效果最佳的私有化部署,並支持企業將專有數據與百川智能自用的全鏈路優質訓練數據混合,實現行業更高的多場景可用率。

(本文首發於鈦媒體App,作者|林志佳,編輯|胡潤峰)