中國科學院地化所發佈月球專業大模型 歐陽自遠:要發揮AI優勢

新京報貝殼財經訊(記者羅亦丹)8月29日,在2024數博會上,中國科學院地球化學研究所與阿里雲聯合發佈國際首個“月球科學多模態專業大模型”(簡稱“月球專業大模型”)。該大模型以視覺、多模態及自然語言等通義系列模型爲基模,結合RAG檢索增強等技術,目前在月球撞擊坑年代和形態判別上,月球專業大模型的準確率已達到80%以上。

中國科學院院士、中國月球探測工程首任首席科學家歐陽自遠表示,隨着人類深空探測活動的快速推進,探測數據呈井噴式增長。科學大數據已然成爲推動科技創新的強大引擎。目前在數據管理方面,我國已經取得先發優勢。在數據應用方面,我國必須充分發揮現有的人工智能技術優勢,月球專業大模型將大大加速海量數據的處理,幫助科研工作者挖掘新的科學發現。

據介紹,目前月球專業大模型的最佳落地場景是月球撞擊坑識別。人類對月球地質演化的研究除了探測返回的樣品,主要依靠撞擊坑識別等月球地質對象的研究。撞擊坑的大小、深淺、形狀等特徵,是研究月球地質演化的重要依據。據統計,目前月球上直徑一公里以上的月球撞擊坑數量已超100萬個,直徑一公里以下的撞擊坑數量至今無法確定。如果完全依賴人工,完成所有月球撞擊坑的識別是“幾乎無法實現的”。

月球專業大模型於阿里雲百鍊專屬版進行微調及訓練,科研工作者只需輸入月球撞擊坑圖像和相關問題,月球專業大模型即可調用通義視覺、多模態模型,從17種多模態數據中(包括光譜、高程、重力等數據)判定該圖像對應的模態類型;通過檢索知識庫、調用通義語言模型,月球專業大模型可回答該撞擊坑的形態、大小、年代等相關問題,並給出推理過程。

中國科學院地化所研究員劉建忠介紹,在月球撞擊坑識別上,月球專業大模型的準確率已達到80%以上。“通過對海量數據的準確把握,大模型不僅可以對撞擊坑進行分類,還可以解決一些目前仍未解決的科學問題。”

接下來,月球專業大模型將嵌入“數字月球雲平臺”,推動“月球雲平臺”智慧化升級。“數字月球雲平臺”由中國科學院地化所牽頭建設完成,是國際上月球探測數據最全,集科學研究、工程應用以及科普教育爲一體的雲平臺,它將與FAST等大科學裝置一同成爲科研基礎設施的重要組成部分,助力我國月球與行星科研創新加速。

編輯 嶽彩周

校對 柳寶慶