全球AI頂會 NeurIPS 2024溫哥華開幕,中國校企上百篇論文被收錄

當地時間12月10日- 15日,全球AI頂級會議NeurIPS(神經信息處理系統大會)在加拿大溫哥華舉辦,這一頂會涵蓋了機器學習、深度學習、神經網絡等多個研究方向。

官方數據顯示,NeurIPS 2024共收到15671篇有效論文投稿。投稿量創下新高,論文錄取率爲25.8%,相比去年略有下降,來自中國的被收錄的論文則很可觀。公開數據顯示,中國人民大學、字節跳動、螞蟻集團、騰訊等中國高校和互聯網企業均分別有數十篇論文被NeurIPS 2024收錄。

螞蟻集團被NeurIPS 2024收錄了20篇論文,其中有一篇爲Spotlight(特別關注)。按往年數據估算,NeurIPS的Spotlight論文錄取率約爲3%。

被Spotlight的論文《MKGL:掌握一門三元組構成的語言》,引入一個叫KGL的新知識圖譜語言,以探究大語言模型(LLM)和知識圖譜(KG)的融合。KGL這一新語言能夠讓一個句子精確地由一個實體名詞開始、一個關係動詞連接,再以另一個實體名詞結尾。實驗結果顯示,LLM通過利用實時知識圖譜上下文檢索和文本嵌入增強,高效提升其對KGL詞彙的理解,已經做到能夠熟練掌握KGL,在知識圖譜補全等任務上相較於傳統方法有顯著提升。

根據論文摘要顯示,螞蟻集團20篇論文的研究領域主要集中在提升AI的經濟性、可信性和效率上,這也是該企業重投AI的重點攻堅方向。

比如論文《重新審視顯存和通信成本對大語言模型高效數據並行訓練的影響》針對大語言模型(LLM)分佈式訓練的速度與效率問題,提出了一組新的基礎策略,一個名爲PaRO的部分冗餘優化器,通過更精細的分片策略以適配不同的訓練場景,加速LLM的訓練。實驗結果表明,PaRO在LLM的一些訓練場景下速度比ZeRO-3最快提高到266 %。此外,PaRO-CC也可以單獨使用在模型並行策略中,且獲得了17%的訓練速度提升。

在NeurIPS 2024上,螞蟻集團還受邀舉辦一場研討會,圍繞“強化學習優化、可信模型構建及視覺語言模型應用探索”等議題,深入研討知識增強的大語言模型在行業垂直領域的前沿技術與發展趨勢。來自清華大學、香港浸會大學、墨爾本大學、螞蟻技術研究院的學者和研究員將在研討會上進行主題報告分享。

據瞭解,加速AI在行業垂直領域的落地應用,亦是螞蟻集團重投AI的重點攻堅方向,或者說,聚焦提升AI的經濟性、可信性和效率,就是爲了加速AI在行業垂直領域,尤其在金融、醫療、遙感等嚴謹產業中的落地應用。

2024•Inclusion外灘大會發布的《AI產業實踐六大趨勢》指出,大模型在醫療、金融等專業領域應用涌現,能促進垂直行業生產力提升、數據價值釋放,同時也成爲大模型技術加速發展的“探照燈”。

值得注意的是,在NeurIPS這一級別的國際頂級學術會議上,來自國內高校、科技企業、互聯網公司的論文不但在數量上持續突破,在質量上也有飛躍式進展,被收錄爲Spotlight、Oral、Highlight、Best Paper提名的論文越來越多。期待中國的產學界繼續發力與合力,勇登這波AI浪潮之巔。