樓航:科技賦能金融數據融合應用——湖南省金融大數據中心創新實踐

爲切實提升湖南省金融服務實體經濟能力,有效防範化解金融風險,人民銀行湖南省分行以“服務社會發展、服務金融機構、服務央行履職、服務黨委政府決策”爲核心理念,建成湖南省金融大數據中心(以下簡稱大數據中心)。組織全省金融機構以“共建、共享、共用”的原則合力打造多項大數據中心示範應用場景,有效發揮金融數據要素價值倍增效應,有力推動了湖南省經濟金融高質量發展。

中國人民銀行湖南省分行 副行長 樓航

人民銀行湖南省分行以集約化建設爲原則,充分利舊原有硬件資源,新增部分海光C86芯片服務器及配套存儲、網絡設備,迭代建設完成具有1PB裸容量的新一代大數據平臺,爲金融數據統一歸集、統一治理、統一分析、統一應用提供基礎平臺支撐。配套建設大數據中心數據交換管理平臺(以下簡稱數據交換平臺),形成互聯省內各金融機構和大數據中心的數據“高速公路”,實現跨機構、跨系統的數據安全應用。目前轄內17家商業銀行已完成數據交換平臺接入,其中國有大行和省內法人銀行全量接入。

1.建設科學、安全、高效的數據交換平臺

數據交換平臺是大數據中心的數據總閘口,在系統規劃設計階段就將科學、安全和高效列爲其主要特性和目標。數據交換平臺以人民銀行湖南省級數據中心爲中心節點,各商業銀行、銀聯、徵信機構等金融機構爲外聯接入節點,形成星型拓撲結構(見圖1)。所有數據交換過程必經由中心節點處理,每一筆業務均由數據交換平臺監測控制,技術上實現了數據交換過程的集中管控和高併發下端到端的秒級響應。

圖1 數據交換平臺“專屬通道”“數據總線”接入架構

2.發佈統一標準的數據應用報文規範

數據交換平臺以業務需求爲出發點,配套制定《湖南省金融大數據中心數據交換管理平臺接口報文規範》(以下簡稱《規範》),圍繞數據報送、數據查詢、業務鑑權等方面設計實現9類18種實時和非實時接口報文,定義了6種數據聯機交易模式,支持報文數據交換和文件傳輸,在數據報送、業務查詢等場景具有較強的通用性。

爲保障每筆數據交換業務的數據完整性和行爲抗抵賴性,《規範》按照中國人民銀行CA體系標準,在數據交換報文中加載國密數字簽名。在報文攜帶文件傳輸的情形,通過在報文中設置文件名和文件內容HASH值來實現報文傳遞和文件傳遞的強一致性關聯,保障了數據文件在多方聯機交易過程中的不可篡改性以及事後審計覈查的有效性,充分滿足授權書備案、票據影像傳輸等特殊場景下的抗抵賴要求。

人民銀行湖南省分行將“共建、共享、共用”的原則貫穿於大數據中心及其規模化應用的建設全過程,統一歸集全省金融數據充分授權的情況下由全省所有機構共同使用,切實提升整體金融數據應用的質量和效率。

1.建立常態化可持續的數據報送機制

依託大數據中心的數據算存能力,湖南省分行建立了湖南省金融機構金融數據報送機制,內容包括存貸款賬戶數據、交易流水數據、投資理財、信貸合同借據、質押擔保等。以線上自動報送爲主,組織商業銀行報送2020年1月以來存量數據,並按月報送增量數據。大數據中心已統一歸集29家商業銀行近4年超過1000億條的金融數據。

2.共建共享真實有效的基礎研究數據

湖南省分行組織轄內商業銀行共享對公客戶信貸風控數據,建立具有14萬家企業數據的金融風控建模樣本庫。樣本庫在設計上囊括了樣本企業貸前、貸中、貸後的信貸風險發生情況以及相關聯的資金交易流水、存貸款、擔保關係等信息,同時從數據安全和隱私保護的角度進行了企業和銀行主體信息的去標識化處理。因其數據廣度遠大於單家銀行的樣本量,在支持金融風險規律研究和商業銀行信貸風控產品研發等方面更具價值。

3.統一規範安全開放的建模機制

爲充分發揮海量金融數據的應用價值,切實解決銀企信息不對稱、商業銀行精準風控難等問題,湖南省分行在保障數據安全的基礎上,貫徹開放的新發展理念,建立了商業銀行駐場建模的工作機制。商業銀行在規定的權限範圍內,短期派遣技術和業務人員於人民銀行湖南省分行辦公場所,利用樣本庫設計研究符合各行自身需要的專屬風控模型,在人民銀行、商業銀行、徵信公司多方共同協作的方式下研發特色信貸產品。該機制成功推動了多家商業銀行基於數據增信的“流水貸”產品投產上線,兩個月總體授信規模突破百億並持續增長,加權平均利率低於其他信用貸款75個基點,有效緩解了中小微企業“融資難、融資貴”的問題。

數據安全是整個大數據中心建設的工作底線,湖南省分行以制度保障爲基礎,統籌傳輸安全、供應鏈安全、內容安全、物理安全四個方面,爲金融數據規模化應用構築堅實的安全防線。

1.建立聯機授權機制,保護敏感業務數據

針對企業信用信息查詢這類數據敏感業務,數據交換平臺根據業務特點,按照按需共享、授權前置、最小必要的原則提供服務(見圖2)。目前由湖南省級徵信平臺依託企業收支流水提供數據服務,銀行機構在查詢前,必須獲得具有法律效力的企業正式授權。通過數據交換平臺接口實時調取企業信貸客戶的收支流水徵信報告及附屬模型數據。

圖2 企業授權書線上備案流程

2.規範銀行建模流程,明確數據安全邊界

爲規範化商業銀行專項模型研發,推動“流水貸”產品有序落地,湖南省分行明確了商業銀行的准入、駐場管理、建模應用、系統上線等過程的審批流程和管理制度。申請駐場建模的商業銀行分別書面簽訂單位保密承諾和操作人員保密承諾,各機構人員在指定的辦公區域使用專機統一實施,參考《中國人民銀行信息科技外包風險管理辦法》開展人員信息報備和現場管理,嚴防數據應用領域的人員風險。同時,湖南省分行組織編制了金融數據資源目錄,商業銀行駐場建模的書面申請中需按照數據資源目錄選擇申請使用數據資源,且目前僅開放建模樣本庫的數據使用,以此明確數據安全邊界。

3.實行網絡分區分域,嚴格數據安全管理

湖南省分行鍼對監管數據建立全生命週期安全管理機制,對金融數據的安全應用進行嚴格管理。一是建立多級的網絡防護措施,建立大數據中心原始數據網絡專區、數據應用網絡專區、數據研究網絡專區等各級網絡區域,各區域間實行白名單放行策略,且均與互聯網實行物理隔離。二是依託金融城域網對外提供數據服務,由數據交換平臺作爲唯一渠道進行集中管控,做到事前授權、逐筆覈驗。三是對隱私數據、敏感數據進行脫敏、加密、去標識化處理,切實保障重要數據的安全、合規應用。

大數據中心從啓動項目建設到成功上線僅用了半年時間,隨着多個業務條線相關應用的不斷深化,大數據中心在賦能社會經濟發展、支撐業務創新等方面已展現出強勁的動能。

1.湖南省企業收支流水徵信平臺

湖南省企業收支流水徵信平臺(以下簡稱收支流水平臺)作爲大數據中心的首個規模化應用,其核心服務是提供企業收支流水徵信報告和建模數據,作爲人民銀行企業徵信報告的補充。各銀行依據各自行內內控要求建立模型,涵蓋了企業基本信息、交易規模趨勢、上下游企業、水電氣等經營性支出、異常資金特徵等方面600多個指標數據,有效體現企業生產經營徵信狀況。商業銀行在獲得企業授權的前提下,可實時線上查詢該企業收支流水徵信報告並用於企業授信及貸前、貸中、貸後信用狀況跟蹤,有效拓展企業融資渠道、降低融資門檻、提速融資效率。其中多家銀行開展了純線上純信用的流水貸產品,客戶通過互聯網幾分鐘內就可以完成貸款申請。自平臺上線以來,收支流水平臺共提供徵信報告查詢5萬餘次,服務企業近4萬家。

湖南省企業收支流水徵信平臺試運行情況通報會

2.“匯眼”外匯非現場監管應用

湖南省分行運用大數據中心基礎金融數據,開展企業出口騙稅型地下錢莊可疑線索分析,共設置退稅特徵、主體特徵、本外幣資金流向特徵、空殼企業特徵等4個維度共50個指標,創新提出“匯眼”系統方案,初步實現“通聯本幣外幣、貫通內外數據、暢通行際省際”的非現場分析功能。國家外匯管理局湖南省分局依託大數據中心“匯眼”系統挖掘可疑線索,多次向相關部門通報移送可疑騙稅企業。

3.貨幣信貸再貼現、再貸款信息覈驗

湖南省分行將自建的貨幣信貸管理系統接入大數據中心,依託大數據中心的信貸合同、信貸借據、票據貼現、金融客戶基礎信息等數據,對支農支小貸款和票據貼現業務的金額、利率、時間、劃型等信息開展真實性覈驗。利用大數據中心數據治理平臺的數據自動化處理功能,將貨幣信貸管理系統待覈查數據與大數據中心數據庫開展匹配覈對,以T+1的模式實現跨系統全自動數據聯動。工作人員可在貨幣信貸管理系統中直接查看覈驗結果,有效提高全省再貸款、再貼現業務的辦理效率,提升貨幣政策工具傳導速率。

爲積極做好大數據中心成果轉化,持續釋放海量金融數據的業務支撐能力,湖南省分行研究和制定了未來三年發展建設規劃,立足全省金融數字化轉型,聚焦基層央行履職中存在的痛點難點,統籌提出多項重點任務,內容涵蓋基礎平臺建設、配套制度完善和業務應用拓展。力求在2025年底建成架構先進、應用豐富、算力充分、制度完善、運行高效的大數據中心,進一步激發經濟新動能,有效支撐培育新型經濟業態,服務全省實體經濟高質量發展。

(此文刊發於《金融電子化》2024年3月下半月刊)