瑞萊智慧CEO田天:產業落地是發展AI的終極路徑

作爲引領第四次科技革命的戰略性技術人工智能給社會建設和經濟發展帶來了重大而深遠的影響;但數據隱私、算法偏見、技術濫用等安全問題也正給社會公共治理與產業智能化轉型帶來嚴峻挑戰。

那麼,如何在推動未來人工智能創新發展的同時兼顧安全可控?這一議題的重要性正日益提升。在此背景下,智源大會“AI安全與產業治理”論壇近日召開,瑞萊智慧CEO田天接受了媒體專訪。

田天表示,我們要發展第三代更加安全、可靠、可信、可擴展的人工智能,首先是安全,現在隨着人工智能的大規模應用我們發現存在很多新的安全隱患和新的漏洞,這跟網絡時代一樣會有黑客或者黑產利用系統漏洞來形成一些惡意損失,這是第三代人工智能解決的第一個問題。第二是可靠,安全是AI受到惡意攻擊的表現,可靠是AI正常情況下怎麼避免出現意外。其三是可解釋性,第二代人工智能深度神經網絡黑盒,人是沒有辦法理解它到底怎麼做決策的,但其實這個又跟現在很多場景的應用相悖,比如金融或者醫療。第四是可擴展性,我們現在能夠做的AI場景有限,將來還有很多新場景會出現,需要我們把AI推到各個行業去應用。

“圍繞這幾個目標我們有一系列具體的技術實現,首先結合第一代知識驅動的AI和第二代數據驅動的AI,提出新的人工智能的知識理論框架,通過多元融合,結合數據和共同驅動AI來實現剛纔的這幾個目標,包括深度學習、人工智能,這是一套完整的體系。”田天系統性的闡述了什麼是第三代人工智能。

談及背景,他進一步解釋道:“學術領域是2014、2015開始關注這個方向的,最早谷歌包括高校開始做,我們團隊也是2014年左右正式提出做這個方向。到2017、2018年左右,一方面有些技術慢慢開始成形,另外實際的案例爆發式的出現,從出現第一起到出現很多,然後大家廣泛認識,也是這個中間發生的事情。2018年一方面產業界有自己的反思,我們是不是提高人工智能發展的質量關注它的可靠性安全性,另外監管角度,國家開始從法規制度標準層面對安全性可靠性、自主可控提出更高的要求。”

田天指出,現在基本已經形成行業內的共識,做AI的時候必須考慮安全性、可靠性、合規治理、倫理,這已經成爲一個必備的選項

與此同時,他告訴記者,人臉識別是一個典型的場景特點,滿足人臉識別的精度這個問題上,通過第二代深度神經網絡基本可以達到,但是有兩個本質問題,一是安全性不足,人臉識別99%的準確度都是沒有惡意破壞情況下能夠達到,但是不做專門的防護一旦受到攻擊,出錯的機率是百分百,所以需要通過第三代人工智能技術增強安全性。另外是人臉識別的可解釋性,人臉識別到底是怎麼識別的?我們需要補充信息。人臉識別還有一個新問題,就是對人臉技術的濫用,比如製作虛擬視頻惡意傳播,這也是第三代人工智能這個大範疇之內需要解決的問題。

以下爲採訪精選摘要:

問:第三代人工智能和第一第二代有什麼本質的區別?

田天:其實第三代人工智能主要強調幾個不同的維度,我們要發展第三代更加安全、可靠、可信、可擴展的人工智能,這幾個關鍵詞其實強調不同的點,比如安全前面介紹的比較多,主要是針對算法安全。其實現在隨着人工智能的大規模應用我們發現存在很多新的安全隱患和新的漏洞,這跟網絡時代一樣會有黑客或者黑產利用系統漏洞來形成一些惡意損失,在AI時代因爲算法是一類全新的系統和軟件,就會存在新的漏洞,這是第三代人工智能解決的第一個問題,怎樣讓AI形成的算法更加安全。

可靠,剛纔說安全是AI受到惡意攻擊的表現,可靠是AI正常情況下怎麼避免出現意外。比如自動駕駛汽車,其實在路上碰到白色的大貨車經常看不見,這很明顯就是算法不可靠,就是出現一些特定的情況就會出問題,這是第二代人工智能所帶來的缺陷,需要第三代的人工智能方法來彌補。

可解釋性,現在因爲AI其實特別是第二代人工智能深度神經網絡都是黑盒,人是沒有辦法理解它到底怎麼做決策的,但其實這個又跟現在很多場景的應用相悖,比如金融或者醫療,如果沒有辦法給預測結果一個合理的解釋,或者讓人看明白的解釋,其實大家沒有辦法利用。不管是AI還是人總會在一些場景上犯錯誤,這個時候如果AI缺乏可解釋性沒有辦法在這些場景中發揮作用

可擴展性,我們現在能夠做的AI場景有限,將來還有很多新場景會出現,這些場景我們怎麼基於已經獲得的知識或者模型,在新的場景上發揮作用?這塊也需要我們把AI推到各個行業去應用。

所以這三代有什麼區別?這四個方面我們都要進行突破。圍繞這幾個目標我們有一系列具體的技術實現,怎麼解決這三代人工智能,這塊首先結合第一代知識驅動的AI和第二代數據驅動的AI,提出新的人工智能的知識理論和框架,通過多元融合,結合數據和共同驅動AI來實現剛纔的這幾個目標,包括深度學習、人工智能,這是一套完整的體系。

問:剛纔提到的案例比較集中在人臉識別,它主要是在哪個維度?

田天:人臉識別,這是大家能夠感受AI最頂層的應用,它的應用最廣,但是其他的問題在其他的AI也會出現。比如人臉識別一個典型的特點,在滿足人臉識別的精度這個問題上,我們通過第二代的深度神經網絡基本可以達到,你在訓練集測試集分析,通過神經網絡可以做得非常高。但是有兩個本質問題,一個是安全性不足,人臉識別99%的準確度都是沒有惡意破壞情況下能夠達到,但是不做專門的防護一旦受到攻擊,出錯的機率是百分百;所以這是通過第三代人工智能技術我們首先增強人臉識別的安全性,讓它受到攻擊的情況下仍然有比較好的表現。另外是人臉識別的可解釋性領域,特別是關鍵領域,人臉識別到底怎麼識別的?我們需要補充信息。人臉識別還有一個新問題,就是對人臉技術的濫用,去製作虛擬視頻惡意傳播,可能在經濟或者社會輿論產生很大的惡意影響。這塊怎樣檢測人臉有沒有被濫用?有沒有被用在內容生產方面?這也是第三代人工智能這個大範疇之內需要解決的問題,就是針對AI被濫用怎樣用技術的手段來進行解決。

問:你覺得在未來的時代,安全防控的風險在體現在什麼地方?

田天:安全是非常非常基礎的問題,但是要說最重要的可能也不準確,其實還有不同層面的問題,當然安全如果做不到其他都是零。對於這塊是起一個基礎性的作用,說到安全到底怎麼解決?其實我們強調幾個不同的角度,算法本身的安全,剛纔說對抗樣本攻擊做相應的防禦,所以有專門的對抗樣本防火牆——AI防火牆,還有專門的檢測工具,類似AI的殺毒軟件。還有一個維度是數據安全,其實AI應用還是需要大量數據做基礎支撐,但是數據用在AI上要做隱私保護還有應用的價值管控,包括可用可見。這是第三代人工智能核心的一部分,只有保證數據在合法合規的情況下用AI,纔有可能持續不斷的提升AI性能。所以我們有專門的隱私保護機器學習平臺,把隱私保護的能力,數據流通能力和AI做深度整合,基於我們的平臺就可以實現,你不用擔心數據隱私泄露以及實現不同的數據融合,這也是很重要的一塊。

剛纔提到AI的合規管控,這也是安全的一個維度,這屬於AI發展的過快應用在不合法的領域,這需要制度手段包括技術手段進行管控,還有算法公平性的問題,之前提到的大數據殺熟,或者國外比較多的人臉識別,識別白人的準確率比黑人高很多,這也是AI在下一步發展過程中,特別是社會基礎層面的應用場景,這是大家考慮的問題,就是AI的合規可控方面。

問:現在有很多人工智能獨角獸雖然沒賺錢,但是融資的金額很大,如何理解?

田天:AI不管是技術還是產業都在快速發展,現在我們所在的AI已經實現了應用,包括產業化的市場規模,相比五年以後十年以後,一定還是非常小的一塊,因爲現在可以看到商業社會的方方面面,各個行業都涉及到智能模塊,只不過很多場景都需要人實現,人做分析決策,其實就像之前一樣的體力勞動慢慢被機器取代,其實人現在智力活動包括決策,一定也會被AI逐步完整的,至少是輔助人工,很多場景甚至實現替代人工。所以未來一段時間AI產業規模還是會持續快速增長的階段,對於AI企業,一方面眼下需要賺錢,不是說聚焦一門心思做基礎研究,但是更大需要看到AI未來的市場空間,怎樣通過產品和模式層面不斷的創新,把現有產品推到新領域,進一步擴大市場,這個我覺得這是AI企業下一步實現快速增長的一個關鍵要素。

問:當時爲什麼創業

田天:總得有人來做產業落地的事情,如果大家都做研究,確實也很重要,但是真正用起來產生價值纔是我們做AI的終極目標。其實AI本質上相當於是在計算機這個大領域成長起來的分支,其實計算機本身就是距離產業非常近的學科,跟大家做數學物理還是不一樣的。發展AI跟產業結合,肯定是一個終極目標、終極路徑,所以當時在技術這個已經實現了很好的積累,之前在學校裡做了很多年,不只是我這塊,技術積累非常多了,2018年公司成立的時候,要把技術真正的推向市場,那時候幹這個事情相比聚焦研究領域,價值會更大。

問:從畢業到創業有沒有遇到比較大的困難?

田天:困難非常多,但是這事兒我覺得倒還好,我覺得我們相對來說比較順利。首先這個領域我們選擇的比較正確,首先在AI這個大的行業,雖然現在一些人對其他AI公司的發展有一些不同觀點,但是對於AI產業快速爆發,基本沒有人否認,所以這個行業是一個欣欣向榮的行業。我們做的第三代人工智能,安全可靠可信的人工智能,在整個AI產業從2018年開始這是大家所關注的新領域。因爲確實碰到一些新問題,所以結合這些市場情況我們是比較好的時間,開始真正把這塊推向產業化,所以各個方面還是比較順利的。

問:你們在服務金融方面有什麼核心競爭力

田天:核心競爭力是我們的AI能力。比如說銀行數據雖然很多,但是數據質量包括AI強調的樣本的多樣性等方面,其實還是存在一些問題,引用標準的算法沒有辦法得到很好的效果。比如說銀行碰到數據不足,金融數據都是非常敏感的,怎樣做隱私保護,這方面也存在痛點,包括AI上去了是不是足夠安全?其實金融領域都能夠找到落地的這些點,都是因爲技術不足導致的,要不效果上不去或者很多場景沒有辦法用AI,我們剛好圍繞已有的場景加上先進的AI技術,幫助金融客戶一方面在業務上獲得更高的收益,另一方面是節約成本方面,效果還是非常明顯的。

問:人工智能安全性和可靠性在前兩年沒有被大家特別廣泛的關注,現在它說怎麼從小火苗變成大家共識的?

田天:其實從公衆的層面確實這兩年能夠看到,但是學術領域是2014、2015開始關注這個方向,最早美國谷歌包括高校開始做,我們團隊也是2014年左右正式提出來做這個方向。到2017、2018年左右,一方面有些技術慢慢開始成形,另外實際的案例也是爆發式的出現,從出現第一起到出現很多,然後大家廣泛認識,也是這個中間發生的事情。這個背景下2018年一方面產業界有自己的反思,我們是不是提高人工智能發展的質量關注它的可靠性和安全性,另外監管角度,國家的主管部門開始從法規制度標準層面對安全性可靠性、自主可控提出更高的要求。從行業內部加上外部,2018年以後我們看到爆發式增長的這麼一個趨勢,現在基本上已經形成行業內的基本共識,我們做AI的時候必須考慮安全性、可靠性、合規治理、倫理,這已經成爲一個必備的選項。

問:儘快把卡脖子的技術搞清楚是這一代技術人的目標,您認爲卡脖子的技術有哪些?

田天:在人工智能方面,我們感覺中國和歐美屬於同一起跑線,也參與到它的發展和推動過程中,但是也存在一些問題。比如說現在大家提到的機器學習框架,基本還是用國外的開源框架,這些可能會存在一些問題。如果我們將來不想被國外卡脖子,我們希望將更多目光投在人工智能基礎理論包括基礎體系本身,發展我們自己原創的自主可控的AI理論平臺,這樣纔可以確保我們在AI行業,或者未來不再重蹈其他領域的覆轍。

問:目前我們的人才梯隊建設在迎頭趕上,但也存在一些問題,你認爲我們應該如何解決這些問題?

田天:現在國內在AI方面的人才可以說越來越多,因爲現在國內關於人工智能的高校、研究機構實力在快速增強,不斷有高水平人才的輸出,其實這幾年因爲種種原因,海外迴流的現象比較明顯,有一些迴流到高校。一方面是中美關係的影響,一方面是國內自身環境,包括對於科研人員的待遇提升。這幾年來看,AI人才是可以更好的融入到業務中的,是真正的可以去爲所在的企業帶來更多的業務價值,這也是一個積極的變化。