多源建築地址數據標準化建設與應用——以南昌市爲例
江西地名研究
關注我們,獲取更多地名資訊
摘要:地名地址數據是新型智慧城市時空基礎設施之一,其成果作爲城市政務信息共享交換的重要載體,在政府各行業專題地理信息應用建設中發揮着關鍵的紐帶作用。本文在調查分析的基礎上,提出地名地址數據建設方法,並以南昌市爲例,介紹城市建築地址生產、多源地址數據標準化、建立地址數據庫、地址數據管理與更新機制。最終建成統一標準、覆蓋全面、現勢性良好的地名地址數據,並通過對外提供地址數據接入,在全市各委辦局和相關部門進行推廣應用,實現城市精細化管理,提升南昌市地理信息公共服務能力和水平。
關鍵詞:標準建築地址;智慧城市;地名地址;地理信息
0
引言
在中國,隨着智慧城市建設的快速發展,政府各部門相繼對地址數據建設管理工作做出部署。爲此,國家自然資源部要求開展地名地址數據建設,爲智慧城市建設提供數據基礎。地名地址數據被廣泛用於房屋管理、公共安全管理、地理信息管理、配送物流管理等諸多領域。各相關行業積累了大量地址數據,並建立了滿足各自業務需求的地址庫。但是,現有的地址信息在描述規則、存儲格式、數據質量及現勢性等方面各不相同,導致資源難以共享。因此,有必要建設統一標準的地名地址庫,將各部門地址數據進行關聯,降低數據冗餘,實現信息共享和業務協同,提升管理效率。針對地名地址數據存在的問題,很多學者開展了關於地名地址數據建設的研究,當前的研究主要集中在地址編碼、標準地址庫建設、地址解析和匹配、地址服務應用等方面,對於數據更新的研究相對不足。
地名地址庫首次建設固然重要,但要想長期發揮作用,還須建立有效且便於實施的信息化管理應用服務平臺和更新維護管理制度。本文主要研究建築地址標準化、數據採集建庫流程、管理應用平臺及數據更新維護辦法等內容,並以南昌市爲例,通過實踐驗證其建設思路的可行性,爲類似項目的生產、建設、管理與應用提供一定參考。
1
現狀分析
地名地址是自然、人文地理位置的結構化描述,是城市管理中最直接、可形象化感知的一類數據,其與民政、公安、房管、自然資源管理等工作密不可分。民政部門是標準地名管理單位,負責區域內地名的命名、更名的審覈、報批、發佈工作,南昌市第二次全國地名普查成果約3萬條,數據空間位置精度較好,可用於地名的核驗。公安部門負責沿街門牌發放和戶籍登記管理工作,全市警用地址530萬餘條,數據空間位置精度較低,存在命名不規範等問題,但由於其數據量大,可作爲地名地址庫建設的主要來源。房管部門在房屋權屬管理和測繪量算過程中會對房屋的樓棟號、單元號、房號等信息進行採集錄入,其樓棟單元房號信息較完備和準確,能精準快速地定位到一個顆粒度更細的地址。自然資源部門在不動產業務辦理中需實現房屋落宗落幢,其空間位置精度最準確,但目前覆蓋面積較小。
總體而言,南昌市地址數據在建設管理過程中存在以下問題:①部門間存在信息共享壁壘,各部門都積累了滿足自身業務需求的地名地址數據;②數據標準不統一,各部門間地址格式與命名方式各不相同,同一個地理位置上的地址表述千差萬別,給數據應用推廣帶來不利影響;③地名地址管理“九龍治水”,民政管理行政區劃、道路、小區等地名,公安管理門牌號,房管管理樓棟房號,造成了誰都能管、誰都難管的尷尬局面;④更新週期較長,無法滿足各部門對地址數據時效性的要求;⑤未建立地址數據與建築地理實體間的關聯,無法充分發揮地址數據在政務信息融合中的作用。
2
標準地址數據建設
2.1建設思路
在對地名地址現狀分析的基礎上,基於民政、公安、自然資源等部門需求制定統一的地名地址數據標準,對各部門存量地名地址數據進行匯聚和標準化治理,形成初始庫。爲保證數據的準確與時效性,本文提出採用外業地址調查覈實手段,對治理的初始庫進行外調覈實,清理無效地名地址;將地址與建築地理實體關聯,實現“有房就有址”的目標;通過建立全市統一的建築地址庫,保證全市使用同一套標準的地名地址數據,從源頭上破解涉房、涉址信息共享難、管理難的問題。同時,爲實現第一時間發現變化的地名地址信息,通過建立地名地址數據協同更新機制,實現對地名地址數據主動式更新,基於統一地址數據服務支撐平臺驅動,實現對地址數據的全生命週期閉環式管理。本文地址數據建設應用路線如圖1所示。
2.2關鍵技術
2.2.1 基於多級地址模型技術實現標準地址數據管理
本文采用多層級地址模型,旨在儘可能完整地把人類在生產、生活中對於空間位置的描述語言轉換成結構化、規範化語言,並實現地理定位。多層級地址模型通過地理實體、地址要素、地址三個層次來表達,使得地址要素在標準地址規範的約束下,按照特定規則和次序排列,按需組合形成最終的標準地址。
2.2.2 利用多源異構數據融合技術實現統一標準地址庫的建立
基於地址模型和地名地址數據規範對不同來源的地址數據進行匯聚、清洗與融合。利用Python腳本、地址規則對地址文本結構的完整性、冗餘性、規範性進行分析,對問題地址進行自動化識別,通過預處理、標準化處理、數據審覈等內業工藝流程,對錯、漏、重地址數據進行統一治理。通過對多源異構存量地址數據的融合,實現全市統一地址庫的建立。
2.2.3 利用大數據挖掘分析技術實現數據質量與工效的提升
通過大數據匹配算法對大量不同來源地址數據進行數據挖掘分析,可實現自動化篩選和獲取更精準的門樓址信息,以AOI(興趣面)爲例,通過對AOI進行聚類、AOI區域篩選,低精樓棟聚類、樓棟二次聚類排序、樓棟座標異常剔除等過程,可獲取高精樓棟座標和門樓址信息,通過新技術的引入降低大量人工外業覈實工作量,提升了整體工效。
2.3地址數據標準化
爲做好地名地址數據採集、處理、建庫、更新和共享交換工作,在遵循國家、行業和地方頒佈的標準的基礎上,充分結合實際使用需求,提出標準地名地址數據建設模型。
2.3.1 地址要素分類
地址要素是構成地址最小語義單元,通常也是某個地理實體的名稱。根據實際需要,地址要素層級分類基本涉及八類:行政區、街路巷、社區(或行政村、工業園)、住宅小區(或自然村、標識性地物名)、門址、樓名、單元、戶室。另外,根據南昌市地名特點,地址要素還可包含開發管理區,如高新區、經開區和灣裡管理局等。
2.3.2 地址分級與構成
地址是由一組非空的地址要素組成,可採用巴科斯範式定義爲:
建築地址∶∶=<行政區域><基本區域><局部點位置>,其中:
行政區域∶∶=<省><市><縣><鄉>
基本區域∶∶=[開發管理區][社區]<{[街路巷][住宅小區]|[自然村]|[標識性地物名]}>
局部點位置∶∶=[門址][樓名][單元號][戶室號]
其中,∶∶=表示“被定義爲”;<>代表必選項;[]內爲可選項;|代表或者,表示符號左右元素二選一;{}爲集合符號。
通過對地址要素間邏輯關係的梳理與標準化,有助於數據採集部門和應用部門間開展地名地址信息交換與共享。
2.3.3 地址編碼
建築地址編碼方式設計爲:
標準地址編碼=行政區劃碼+開發管理區碼+街路巷碼+住宅小區碼+門址碼+門址通名+樓址碼+樓址通名+單元碼+單元通名+室號碼+室號通名。
(1)行政區劃碼:採用省、市、縣、鄉四級行政區域名稱代碼,共9位數字唯一指代;
(2)開發管理區碼:按流水號編碼,代碼長度設爲1,無開發區補0表示;
(3)街路巷碼:最小政區內街路巷順序碼,代碼長度設爲3,從01~999。該編碼方式體現了基本區域地址要素與行政區域地址要素的關聯,建立了不同層級地址的約束;
(4)住宅小區碼:小區、自然村或標識性地物,可以被“街路巷碼+門址號+門址通名”唯一指代,以降低數據冗餘。例如,“紅谷中大道1568號”代表名爲“紅谷凱旋”的小區;
(5)局部點位碼:採用“樓址碼+樓址通名+單元碼+單元通名+室號碼+室號通名”編碼。
將標準地址按上述方式編碼,可獲得唯一標識地址編碼,以便地址管理與地址匹配。
2.3.4 標準地址表設計
地名地址數據庫表是存儲按照一定規則進行結構化表述的規範地址,數據表字段可包括地址標識碼、地址編碼、地址名稱、地名別名、採集時間、啓用時間、停用時間、所屬建築編碼、數據來源、座標位置等。
2.4標準地址庫建設
標準地址庫建設經歷以下四個階段:
(1)準備階段:包括人員及設備調配、數據資料收集與分析、方案編寫與評審、人員培訓等各項準備工作;
(2)數據匯聚治理:包括收集各部門現有地名地址數據,利用數據清洗軟件對數據進行組織重構、去重與分類,通過標準化治理步驟,形成統一的地址內業初始庫;
(3)外業調查採集:包括調查底圖製作、外業實地調查覈實、座標與屬性信息採集、外業照片拍攝等。採集內容與深度因需求有所不同,居住區採集到戶室號,同時對門址缺失的進行預編門牌號,強制採集門牌號和街路巷名,棟號或樓名;
(4)內業整理入庫:包括屬性錄入、內業檢查、對象化構建、入庫檢查、數據導入、建築物地理實體掛接等工作。
2.5應用平臺建設
依託治理後的標準地名地址數據,建設統一的地址應用平臺,改變業務登記地址信息由“填”爲“選”的方式,通過“選擇”讓業務地址登記具有規範化地址描述,從源頭解決地址信息輸入不規範的問題。通過平臺提供地址數據的接入、地址數據的處理、地址實時服務接口以及數據管理維護功能,實現城市精細化管理與綜合服務能力的提升。
目前,南昌市主要在市場監管、公安、不動產登記中心等部門進行了地址應用服務,將市場監管局約16萬條法人地址坐落信息等非空間化的文本信息通過該平臺進行匹配,實現企業法人在地圖上的顯示與管理,同時將地址數據與不動產關聯,推進了信息協同,有效提升了業務處置能力,取得了良好的應用成效。
3
業務協同更新機制建設
地名地址數據服務的時效性一直是用戶關注的重點,持續提升數據更新效率、加快數據更新速度對於更好地滿足各類應用需求至關重要。目前地名地址數據更新採用的方法主要有外業調繪採集法、移動GIS採集法、泛在更新法、地址匹配更新法等,這些方法都存在投入高、現勢性差等問題。通過對地名地址數據建設管理現狀的分析與梳理,可從地名地址數據日常業務管理入手,從源頭上解決地名地址數據更新問題。
本文提出“業務協同更新”+“年度更新”相結合的更新模式。其中“業務協同更新”指的是通過地名地址申請單位在地名報批、門牌號申領、不動產產權辦理流程中,觸發地名地址相關業務辦理,從而實現對現有標準地名地址數據的更新,並由不動產落幢落宗過程獲取標準地址對應的空間位置座標信息,從而實現基於業務協同辦理對地址庫主動式更新。“年度更新”則採用外業配合多源數據融合方式,對發展變化快的區域進行一年一度的整體更新。
4
結束語
地名地址數據作爲重要的基礎地理信息數據資源,是最常用的社會公共信息之一,與人們的日常生活出行息息相關,在城市社會治理、公衆信息服務等衆多領域發揮着日益重要的作用。通過對地名地址數據建設管理的研究,按照“統一標準——數據建設——平臺應用——機制保障”的基本思路,總結出了城市建築地址數據建設管理的完整解決方案,可爲城市社會治理和新型智慧城市建設提供技術支持。
作者:馮金福
來源:《工程勘察》2022年第8期
選稿:宋柄燃
編輯:劉 言
校對:杜佳玲
審訂:王玉風
責編:杜佳玲
(由於版面有限,文章註釋內容請參照原文)
往期精彩推送
微信掃碼加入
中國地名研究交流羣
QQ掃碼加入
江西地名研究交流羣
歡迎來稿!歡迎交流!
轉載請註明來源:“江西地名研究”微信公衆號