☰

全國首個！上海發佈《金融大模型應用評測指南》，深化金融垂類應用

作爲金融大模型領域全國首個以金融業務能力爲核心的團體標準，《金融大模型應用評測指南》今天在滬發佈，這也是深化金融垂類應用，規範和引導金融領域用好模型的關鍵一步。

在市委金融辦、市經信委的指導下，《金融大模型應用評測指南》由市人工智能行業協會和上海金融業聯合會聯合發佈。該指南以金融業務爲核心，以金融機構模型應用爲導向，從模型基礎、金融安全與價值對齊、金融風險控制、金融專業認知、金融業務輔助拓展等5個維度185項指標要求，構建了金融領域大模型的能力測評框架。

模型基礎能力方面，圍繞模型基礎理解和推演功能，指南定義了包括文本分類、信息抽取等在內的11項單模態、圖文檢索、視頻問答等在內的6項多模態指標要求。金融安全與價值對齊能力方面，圍繞模型的可靠性、可解釋性以及隱私保護，指南設計了內容合規、文化價值、倫理價值等在內的9項指標要求。金融風險控制能力方面，圍繞模型在實際應用中的風險防範與控制，指南則提出利率風險、匯率風險、輿情風險等在內的19項指標要求。金融專業認知能力方面，圍繞模型的金融基礎知識和信息解讀，指南歸納了會計覈算、財務報表編制與分析等在內的23項指標要求。金融業務輔助拓展能力方面，圍繞銀行、基金、保險、證券、信託等5個領域，指南提煉了28項業務場景，包括存貸款業務、量化交易等在內的117項指標要求。

與此同時，上海庫帕思科技有限公司也發佈了多維度金融大模型評測數據集（2024版），比照最高水平、最好標準，具有規模大、結構優、價值對齊等特點，符合金融領域對知識鮮活度、多樣性和高密度的整體要求。金融機構比照《金融大模型應用評測指南》能力測評框架，共設計評測數據44000餘句對。聚焦"模型基礎能力"，圍繞計算能力、邏輯推理等6個維度，設計評測數據22000餘句對。聚焦"金融安全與價值對齊能力"，圍繞信息內容、社會秩序等13個維度，設計評測數據2000餘句對。聚焦"金融風險控制能力"，圍繞合規、市場、操作等5類金融風險，設計評測數據1000餘句對。聚焦"金融業務輔助拓展能力"，圍繞輿情分析、智能投研等3項業務場景，設計評測數據12000餘句對。聚焦"金融專業認知能力"，圍繞金融專業知識、IPO圖表等6種知識類型，設計評測數據7000餘句對。後續，金融評測數據集將定期更新，樣例集已在Open Data Lab和開放原子社區發佈。

當下，上海正在推進人工智能"模塑申城"工程建設，而《金融大模型應用評測指南》及金融大模型評測數據集（2024版）的發佈則能更好推動金融垂類應用，相關評測報告也將在近期發佈。

作者：唐瑋婕

文：唐瑋婕圖：採訪對象提供編輯：商慧責任編輯：戎兵

轉載此文請註明出處。

全國首個！上海發佈《金融大模型應用評測指南》，深化金融垂類應用

相關資訊