微軟亞洲研究院副院長邱鋰力:無線通信和感知與AI大模型正雙向賦能

提到大模型,人們已經不再陌生,多模態的大模型從吟詩作畫擴展到提升娛樂體驗和工作效率。但在微軟亞洲研究院副院長、微軟亞洲研究院(上海)負責人邱鋰力看來,大模型還可以做得更多。

增加大模型可理解的模態種類

“AI技術已經能處理不同的數據模態,如文本、圖片、視頻和語音。然而,要支持醫療等不同行業的特定應用,我們還需處理更多如生理信號、無線感知技術,包括WiFi、毫米波和激光雷達等不同於傳統模態的數據。我們致力於更好地支持這些新模態,並探索如何將它們與傳統模態結合,這一領域有巨大的發展潛力。”在提到大模型的相關應用時,邱鋰力關注的是先讓更多模態的數據可以被大模型理解。

作爲無線通信領域的專家,她和團隊在無線技術領域的研究主要是增強信號、提高速率,並開發傳輸和感知的算法。

她給第一財經在內的媒體記者展示了幾塊不到A4紙大小的輕薄板子,還有幾塊像樂高堆疊而成的塑料板。這些就是頗爲神奇的“超表面”——這是一種具有人工設計結構的二維材料,通過設計每個超表面的單元,能精準修改射波的波前、相位和振幅,從而擁有波束轉向、聚焦、偏振轉換等等的強大能力。通過對聲音信號或電磁波做精準的建模和優化,超表面能實現用普通的聲波成像以及增加無線信號的通訊距離和速率。這些被動超表面低成本、無需供電、容易部署,是有效提升無線性能和功能的技術。

舉個例子,超表面能爲智能音箱帶來“視覺”。智能音箱只有很少幾個揚聲器和麥克風,但可以通過超表面蒐集物體發出不同方向的波,根據人在房間裡的位置變化帶來反射信號的變化不僅能定位人的位置,而且能感知距離的變化從而探測呼吸,也能在不侵犯隱私的情況下了解空間內的信息。

超聲波成像很普遍,但超表面讓技術實現的門檻顯著下降,可以使智能音箱這樣的設備成像。超聲成像的優勢之一是它能相對保護隱私,同時能透射。超聲波帶寬有幾兆Hz, 還需有專業的帶有幾百個收發器的探頭。而智能音箱只有幾千Hz的帶寬,2-4 個揚聲器和麥克風。帶寬和收發器都大大受限。“在類似普通智能音箱上做成像,我們是第一次達到這種效果。”邱鋰力介紹。

邱鋰力的團隊不僅開發超表面來提高無線感知的精度,同時也結合了機器學習。無線信號傳入時,通過信號處理,可以確定一些基本信息,比如信號的角度和距離,從而實現2D定位。但在實際應用中,由於信號強度可能不足,或者目標物體移動速度較快,通常的信號處理方法無法準確捕捉目標位置,就常會出現異常情況。這時,結合使用機器學習模型進行分析就顯得尤爲重要,這種結合信號處理和機器學習的方法,能更有效地解決問題。

機器學習對不同模態信號的分析可以應用在諸多系統的開發上,比如智能語音早篩系統。“語音是一個非常有用的信號,一方面它比視頻能更好地保護隱私,同時它也包含了很多豐富的信息,包括人的生理健康信息,比如我們的發音反映了發音器官的健康程度,發音也能反映出頭腦的健康程度還有情緒。所以,我們團隊基於這些開發出了語音‘治療師’用於高鼻音患者,也開發了阿爾茨海默症的早篩系統,相關項目我們正在與醫院合作,希望能推動技術落地。此外,我們也正在探索通過語音來感知情緒。”她說。

邱鋰力表示,團隊也在探索通過視頻做無監督的異常檢測,比如自閉症患者有一些異常的刻板行爲,“我們通過建模,抽取2D、3D的關鍵點信息,並利用刻板行爲的一些特徵,實現無監督異常行爲監測”。

這些都是未來的應用方向之一。

大模型與無線通信的雙向賦能

大模型的不斷髮展也在與無線通信雙向賦能。

“AI能夠提高數據的壓縮率,許多內容可以在接收端直接生成,從而減少傳輸量,大大減輕網絡壓力。如果丟包,我們也能通過AI技術自動修復。使用AI技術傳輸數據,也促使微軟去開發一些新技術,比如在邊緣設備上運用AI,避免所有數據都上傳到雲端,這樣既減少了傳輸需求,也更好地保護了隱私。像微軟近期發佈的Phi-3-mini就可以更好地保護隱私,不用傳到雲端。”她表示,這是大模型在無線通信數據傳輸時可以發揮的作用。

4月末,微軟在官網推出了小語言模型(SLMs)——Phi-3-mini。作爲微軟Phi系列的第四代產品之一,Phi-3-mini有38億參數和3.3T tokens的龐大訓練數據量,有4k和128k tokens兩個上下文長度變體,經過預訓練和指令調整,可以更好地理解人類的語言、表達、邏輯並執行不同類型的指令。

“我們需要結合通信算法和應用需求,瞭解數據傳輸的具體需求,以便更好地進行數據壓縮和復原,從而降低傳輸成本。每一個模態都有它自己的特性。”她說。

因此,如今的無線通信網絡是一個包含了多種人工智能算法的複雜領域。

“AI技術影響着無線通信的各個層面,從物理層、網絡層到應用層。在物理層,最基本的任務是解碼無線信號,即確定傳輸的是1還是0。通常,這一任務依賴於信號處理技術,但在很多天線陣列的情況下,傳統的信號處理方法並非最優。因此,採用AI技術可能會提高處理效果,目前許多公司正在推動這方面的發展。”邱鋰力告訴第一財經,大模型在網絡層出現異常時進行診斷和修復也有巨大的應用潛力,“因爲這些模型擁有龐大的知識庫,能夠進行有效診斷。它們不一定需要依賴現成的案例,通過分析網絡協議便可以預測可能的故障原因。”這使大模型可以在網絡異常診斷時發揮作用。

在未來,隨着AI技術的不斷進步,可以預見的是大模型在無線通信領域的應用將越發廣泛,而無線通信的發展也將爲大模型的應用帶來更多可能。