全國首個!上海發佈《金融大模型應用評測指南》,深化金融垂類應用
作爲金融大模型領域全國首個以金融業務能力爲核心的團體標準,《金融大模型應用評測指南》今天在滬發佈,這也是深化金融垂類應用,規範和引導金融領域用好模型的關鍵一步。
在市委金融辦、市經信委的指導下,《金融大模型應用評測指南》由市人工智能行業協會和上海金融業聯合會聯合發佈。該指南以金融業務爲核心,以金融機構模型應用爲導向,從模型基礎、金融安全與價值對齊、金融風險控制、金融專業認知、金融業務輔助拓展等5個維度185項指標要求,構建了金融領域大模型的能力測評框架。
模型基礎能力方面,圍繞模型基礎理解和推演功能,指南定義了包括文本分類、信息抽取等在內的11項單模態、圖文檢索、視頻問答等在內的6項多模態指標要求。金融安全與價值對齊能力方面,圍繞模型的可靠性、可解釋性以及隱私保護,指南設計了內容合規、文化價值、倫理價值等在內的9項指標要求。金融風險控制能力方面,圍繞模型在實際應用中的風險防範與控制,指南則提出利率風險、匯率風險、輿情風險等在內的19項指標要求。金融專業認知能力方面,圍繞模型的金融基礎知識和信息解讀,指南歸納了會計覈算、財務報表編制與分析等在內的23項指標要求。金融業務輔助拓展能力方面,圍繞銀行、基金、保險、證券、信託等5個領域,指南提煉了28項業務場景,包括存貸款業務、量化交易等在內的117項指標要求。
與此同時,上海庫帕思科技有限公司也發佈了多維度金融大模型評測數據集(2024版),比照最高水平、最好標準,具有規模大、結構優、價值對齊等特點,符合金融領域對知識鮮活度、多樣性和高密度的整體要求。金融機構比照《金融大模型應用評測指南》能力測評框架,共設計評測數據44000餘句對。聚焦"模型基礎能力",圍繞計算能力、邏輯推理等6個維度,設計評測數據22000餘句對。聚焦"金融安全與價值對齊能力",圍繞信息內容、社會秩序等13個維度,設計評測數據2000餘句對。聚焦"金融風險控制能力",圍繞合規、市場、操作等5類金融風險,設計評測數據1000餘句對。聚焦"金融業務輔助拓展能力",圍繞輿情分析、智能投研等3項業務場景,設計評測數據12000餘句對。聚焦"金融專業認知能力",圍繞金融專業知識、IPO圖表等6種知識類型,設計評測數據7000餘句對。後續,金融評測數據集將定期更新,樣例集已在Open Data Lab和開放原子社區發佈。
當下,上海正在推進人工智能"模塑申城"工程建設,而《金融大模型應用評測指南》及金融大模型評測數據集(2024版)的發佈則能更好推動金融垂類應用,相關評測報告也將在近期發佈。
作者:唐瑋婕
文:唐瑋婕 圖:採訪對象提供 編輯:商慧 責任編輯:戎兵
轉載此文請註明出處。