李飛飛、吳恩達開年對話:AI 寒冬、2024新突破、智能體、企業AI

機器之心報道

機器之心編輯部

在人工智能發展史上,2023 已經成爲非常值得紀念的一年。在這一年,OpenAI 引領的 AI 大模型浪潮席捲了整個科技領域,把實用的 AI 工具送到了每個人手裡。但與此同時,人工智能的發展也引起了廣泛的討論和爭議,尤其在其商業應用和未來發展前景方面。

著名 AI 專家 Rodney Brooks 在 2024 年初發文預言,認爲 AI 可能即將進入一個新的寒冬,隨着泡沫的破裂,行業可能面臨嚴峻的挑戰。他的這一言論引發了業界的廣泛討論:新的一年,AI 領域將會迎來更多的炒作,還是進入低谷?與此同時,還有不少人擔心,AI 是不是會取代更多人的工作?

在前不久的國際消費類電子產品展覽會(CES)上,兩位著名 AI 科學家、斯坦福大學教授李飛飛和吳恩達以此爲契機展開了討論。此外,他們還討論了:新的一年,哪些 AI 技術將迎來新的突破?AI 智能體的崛起意味着什麼?對生成式 AI 準確性存在顧慮的企業要怎麼用好這項技術?

以下是本次討論的視頻內容:

原視頻鏈接:https://videos.ces.tech/detail/video/6344567556112/great-minds-bold-visions:-what% E2%80%99s-next-for-ai

爲了方便大家收藏具體內容,機器之心還將視頻整理成了文字版:

主持人:首先我們來討論一下第一個問題,這個問題與人工智能的當前狀態有關。去年無疑是人工智能炒作非常瘋狂的一年。

我們的好朋友 Rodney Brooks 在 1 月 1 日發推說:「現在該穿厚衣服了,可能又一個人工智能寒冬即將來臨,而且會非常寒冷。」那麼,在新的一年,AI 領域會迎來更多的炒作,還是低谷呢?

吳恩達:我認爲媒體會按照它們的方式去做事。但我們並不會進入寒冬,因爲人工智能的商業基礎比以往任何時候都要堅實,甚至在生成式 AI 浪潮來臨之前就已經如此。去年,人工智能真正起飛了。它可能推動了數千億,甚至數萬億美元的市場,這點我不確定。至少對像谷歌這樣的公司來說是數千億美元,因爲展示更相關的廣告可以帶來大量的收入。所以AI 的商業基礎是存在的。

其實,關於人工智能,最難理解的一點是,它是一種通用技術。這意味着它不僅僅對一件事有用。它有點像電力這樣的通用技術,如果我問你電力有什麼用,你會覺得很難回答,因爲它的用途太廣了。人工智能也是如此。就我們今天所處的階段來說,即使人工智能無法取得任何技術核心進展,當然它肯定會取得進展。即使沒有,世界各地都有很多用例等待被發現和構建。所以我非常有信心,它的商業基礎將繼續壯大。

李飛飛:是的,我大體上同意 Andrew(吳恩達)的觀點。我們看到的是人工智能的另一個拐點,這個拐點始於大型語言模型的發展,特別是 ChatGPT 的首次推出以及後續模型的推進。

我認同 Andrew 的看法,AI 是一種深化的橫向技術。作爲一種深化的橫向技術,它正成爲下一次數字革命或工業革命的重要推動力。公共媒體的報道,會呈現波動,但這不是最關鍵的。重要的是,這項技術已經根植於我們的生活。它正在深入到所有垂直行業和消費者體驗中,逐漸改變我們的社會、經濟和政治結構。這是不爭的事實。而且這種改變正在變得越來越明顯。

主持人:讓我們跳到你們對 2024 年重大突破的預測。你們認爲今年 AI 的最大突破會是什麼?

李飛飛:預測未來總是非常危險的,因爲我說錯的話會被引用。從計算機視覺和所謂的以像素爲中心的 AI 領域來說,我確實認爲我們正處於非常激動人心的技術進步的邊緣。我們一直在關注生成式 AI,我們一直在研究擴散模型,有人可能聽說過 Gaussian splatting 或這方面的內容。我認爲目前的技術浪潮中,有許多成果幾乎就要實現突破了。我不確定它是否會像一年多以前的大型語言模型那樣成熟,但我越來越多地看到這一點。我對此非常興奮。

主持人:Andrew,你怎麼看?

吳恩達:是的,我也有幾個預測。首先,我們看到了大型語言模型的突破。我同意飛飛關於圖像的看法。所以我看到的是,從大型語言模型到大型視覺模型的轉變。很多進步不僅僅在於圖像生成,圖像分析也在進步,它能提高計算機的視覺能力,這對自動駕駛汽車等領域有很大的影響,比如任何帶有攝像頭的地方。這是第一點。

第二點我想說,你向 ChatGPT 提問,它會立即作出迴應。但我更感興趣的是自動化智能體的崛起。當你給 AI 系統一個指令,比如說「親愛的 AI 系統,幫我做市場調研,對這個公司進行競爭分析。」智能體不會立即給出迴應,而是規劃一系列動作,比如進行網絡搜索、下載網頁、總結信息。它會去做半小時、一小時或一天的工作,然後帶着答案回來。自動化智能體能夠規劃和執行一系列動作。它們現在剛剛起步,但在研究和商業化方面有很多進展。我期待在接下來的幾個月裡,會有新的突破。

最後一點,可能也適用於 CS 領域,我對邊緣 AI 非常感興趣。我經常在我的筆記本電腦上,運行大型語言模型。我經常用 GPT-4,也經常用 Bard。但很多人不知道的是,在你的筆記本電腦上運行大型語言模型實際上已經相當可行。雖然這些模型不像 GPT-4 那麼大,但也夠用了。我認爲這件事意義深遠。所有的 PC 製造商,難道不會想要銷售給消費者一個更強大的 PC,讓他們使用最新的 AI 技術嗎?顯卡通常是人們升級電腦的一個動因。我認爲在你的筆記本電腦、PC 或你的工業 PC 上運行的邊緣 AI,它的能力實際上比大多數人認爲的要好得多。對 CS 領域來說,我認爲這將推動很多設備的銷售。

李飛飛:我有一點點不同的意見。你提到了「自主智能體」,但我更傾向於將其稱作「輔助智能體」。我們在當前的大型語言模型和這些龐大的基礎模型中觀察到,處理長尾問題依然是個挑戰,無論是在幻覺現象還是其他方面。在很多工作環境中,爲了提供高品質的服務和產品,關注長尾分佈非常重要。因此,我認爲更可能出現的是人機交互式協作。在這種模式下,輔助智能體既包含了自主工作的部分,也包含了與人類的協作部分。這比完全自動化更有可能成爲現實。

吳恩達:確實如此(擊掌)。我其實在一定程度上同意你的看法。我想分享我的經歷。「自主智能體」這個詞可能有些問題,但我在商業領域看到的是,大多數人更願意讓 AI 輔助人類,而不是替代人類,尤其是考慮到失業的問題,這是一個現實挑戰。我不想忽視那些失業者的苦難。

我觀察到的是,決定是否使用 AI 來自動化或取代人力,通常更多是基於商業經濟來考慮,而不是基於倫理。或許這應該是一個倫理決策,但誠實地說,當我與企業合作建立聊天機器人時,我看到大多數企業都會進行非常理性的經濟評估。人類能夠帶來這些價值,人工智能能夠帶來那些價值,他們關心的是怎麼做是最佳的經濟決策,畢竟競爭者也在做相同的事情。我希望我們能說「不要取代人類的工作」,但不幸的是……

主持人:關於這種類型的 AI 智能體,我想引用 Mira Murati 的一句話。她說,「AI 智能體的概念並不新鮮,但現在我們正在向未來迭代,發展出具有智能和常識的智能體,它們理解我們爲什麼要做某些事情。」

李飛飛:好的,我想補充一點,也對那個觀點發表評論。我認爲我們需要謹慎區分取代「工作」和取代「任務」。我相信,你我都看過相同的報告。報告表明,人類的每項工作實際上都是由多個任務組成的。我花了很多時間研究醫療保健。一名護士在值班的 8 小時裡要完成數百項任務。AI 智能體確實在許多任務中發揮輔助和增強的作用,但我們需要慎用「工作」這個詞。我確實認爲,經濟商業決策與倫理社會決策並不是互斥的。這是一個更深入的討論,我知道你和我意見是一致的。

回到你關於這些智能體有理解能力的問題。我認爲這是一個非常微妙的術語,僅關注商業方面。什麼是理解?有對數據中存在的模式的理解,有對你所做決策的理解,還有對任何人類任務意圖的理解。所以,實際上,我不會簡單地用一個籠統的「理解」這個詞來描述今天的 AI 智能體。

主持人:你認爲 AI 智能體會在何時達到什麼程度?

李飛飛:我認爲我們目前做得最好的是理解數據中的模式,尤其是當我們有大量的訓練數據時,我們做得非常好。我指的是大型語言模型,使用基於序列到序列的基於 transformer 的算法,我們真的做得很好,從數據中提取模式,以創造強大的預測模型。所以我認爲,這可能是最前沿的。再次強調,我認爲「理解」要微妙得多。你們都來自商業領域,知道其中的細微差別,我認爲還有更多工作要做。至於意圖理解,我認爲我們只是觸及了表面。

吳恩達:我想回到任務的話題,因爲我認爲這很重要。我的團隊爲很多企業工作,偶爾我會接到首席執行官的電話。他們說:「嘿,Andrew,我讀了關於 AI 智能體的文章,我該怎麼做?」結果表明,有一種方法,它能幫助企業確定哪些任務應嘗試用 AI 增強或自動化。正如飛飛所說,大多數工作由許多不同的任務組成。以放射科醫師爲例,放射科醫師閱讀 X 射線影像,他們需要獲取病人的病史,操作機器、維護機器、指導年輕醫生等等。所以放射科是一個例子,涉及許多不同的任務。我所見過的企業做法是觀察你的團隊,瞭解你所有員工實際上在做什麼任務,並且不是在職位層面,而是在任務層面分析。這項任務在多大程度上適合用 AI 去增強或自動化以及業務投資回報率如何。每次我和企業一起做這個工作時,我們總是能想出很多點子,但我們沒有時間去實施。所以 AI 的增強或自動化有很多機會

我學到的第二點是投資回報率最高的任務,往往不是人們最初所想到的那個。以放射科醫師爲例,人們通常會想到,哦,放射科醫師就是看 X 光片的。這是你的腦海中關於這個職業的定位畫面。但當我們去分解這項工作時,我們會發現有很多其他任務,比如收集病人病史之類的。這些任務可能更容易實現,而且投資回報率更高。所以我發現,系統地進行這個練習,通常有助於企業識別有價值的機會,然後進行構建與購買的決策,執行 AI 項目。

主持人這正是我想談的下一個話題。讓我們討論一些更加實際的問題,在與財富 500 強公司的合作中,你有沒有發現,那些有着清晰的、可證明的、可實現的投資回報率的應用都有哪些共性?比如,你覺得這個房間裡的大多數人應該專注於哪些應用?

吳恩達:如果我們廣泛觀察財富 500 強公司,我認爲常見的應用是客戶運營或客戶支持。有很多公司試圖增強或自動化客戶支持。我認爲軟件工程也在轉變。我們對軟件工程師的支持遠遠超出了 Github Copilot。Github Copilot 是一個不錯的工具,但我們能做的遠不止這些。我認爲銷售運營也受到了很大影響。但對於特定企業而言,幾乎每家公司都在做客戶運營,所以你也應該認真考慮這個方面。但更激動人心的事情是,我和一家非常大的農業公司談過,我們確定了一些任務。這不是你想到的那種收割任務,而是一些奇怪的任務。我們認爲或許可以使用 AI,來大大節省他們的時間。所以,適合你的業務和行業特色的小衆領域,我認爲通常更引人入勝。它們不僅有趣,還能創造出特定於行業的防禦性飛輪效應。因爲每個人最終可能都會購買一些通用的銷售運營工具等,但那些特定於你業務的東西,你應該在內部構建,我覺得這些事情非常令人興奮。

李飛飛:現在確實有各種各樣的客戶支持或運營解決方案。但我想補充的一點是,我們還可以在當前技術中尋找共同的機會。我認爲有個結論今天依然成立,那就是,在數據最豐富的地方,你可以從中識別出可重複或有效的模式,無論是人類語言模式、結構化數據模式還是圖像數據模式。數據所在的地方,以及數據模式被證明在你的業務中有價值且可操作的地方,就是你應該關注的地方。

主持人:讓我們談談財富 500 強 CEO 可能面臨的障礙。我們上週日舉行了醫療保健峰會,會上有幾位醫療保健 CEO 出席。我們問其中一位,你對數字創新最感興趣的是什麼?他說人工智能。然後我問他,作爲 CEO,你最擔心什麼?他說,不準確性。

李飛飛:這是最難的行業之一。

主持人:你想對那些將不準確性上升爲 CEO 級別關切的 CEO 說些什麼?在你看來,還有哪些問題可以上升到這個級別?

李飛飛:就像我之前所說的,這取決於你的產品、你的服務以及結果的利害程度。在醫療保健、金融預測等許多行業中,長尾精確性非常重要。你不能承受人命損失或人身傷害,你不能承受銀行出錯。所以你需要了解你的行業,瞭解你的解決方案和服務,看看 AI 可以在哪裡發揮真正的作用。這就關係到你說的炒作。當我與商業高管交談時,我們應該摒棄炒作,理解這項技術能做什麼,避免投資於那些 AI 還不擅長的方向。

主持人:那麼飛飛,類似醫療保健這種涉及生死和高度監管的行業,他們想用生成式 AI,但又擔心準確性問題,你想對他們說些什麼?

李飛飛:Andrew 和我都在醫療保健領域工作了很久。實際上,醫療保健中有大量的 AI 應用,從非常上游的藥物發現開始,我們可以做很多事情。

主持人:我想說的是生成式 AI

李飛飛:這是一個信息過載的詞。今天,每種 AI 都被稱爲生成式 AI。在 Andrew 和我的早期研究中,我們有非常具體的數學定義來定義生成式 AI。但現在,我們……

吳恩達:我們之前管它叫機器學習,但機器學習……

李飛飛:我們還曾經區分生成式 AI 和判別式 AI。如今,這種數學嚴謹性已經消失了。

吳恩達:是的,我覺得大衆媒體已經接管了技術術語。技術界也只是跟着適應。

李飛飛:確實如此。所以,當你說生成式 AI 時,我假設你指的是那種大數據驅動的有預訓練階段的模型。有些人可能會將 transformer 和預測模型納入其中,但我不確定是不是總是這樣。但無論如何,我認爲如果真的存在準確性問題,我們應該檢查幾個方面,比如這是模型的問題,還是數據質量的問題?是因爲把 AI 引入流程纔有了這個問題嗎?導致結果不準確的商業問題有很多。你要弄清楚這些問題,並嘗試解決它們。有時候,例如在某些醫療診斷和治療層面,你確實需要認識到限制的存在,如果風險太高,我們不能過度推進。

吳恩達:我補充一點,雖然我們使用 “生成式” 這個術語。但 AI 往往用於分析。我的團隊已經做了很多項目,比如使用這些大型語言模型來閱讀電子健康記錄,試圖得出結論,而不是撰寫文本。即使你在寫文本,如果你小心使用總結軟件,也能得到不錯的結果。它可能還會有一些錯誤,我認爲在醫療保健環境中,如果某個場景風險不那麼高,還是有很多部署這些技術的機會的。

就診斷來說,如果你弄錯了一些東西,那結果是很糟的。但我們部署了一個系統,目前仍在一家醫院運行。該系統用於篩選患者、閱讀電子健康記錄,判斷誰的死亡風險更高,並推薦他們考慮接受臨終關懷。但我們無法信任系統做出的決定。所以我們把它送給醫生,讓醫生複查我們展示的病例,並做出最終決定。

實際上,我新加坡的一個朋友正在使用新加坡國立大學的一個系統,查看病人的電子健康記錄,嘗試估計病人將在醫院待多久。有時醫生會認爲這是個簡單的病例,三天內就會出院,但 AI 說不,需要 5 天。這就引發了進一步的討論。這就是新加坡正在發生的事情。醫生說,「哦,也許我需要再仔細看看這個病人。也許我漏掉了 AI 發現的東西」所以,這些東西實際上正在部署。但根據系統的能力,我們通常可以設計安全措施,確保以負責任的方式部署 AI。

在醫療保健運營中,如果你使用 AI 來安排核磁共振機的試用,即使你犯了錯誤,導致核磁共振機使用效率降低,這雖然很糟,但也許並不像弄錯關鍵診斷那麼糟糕。所以實際上,AI 在醫療保健領域有很多部署機會,我認爲幾乎所有行業都是如此。

主持人:那麼,我們接下來討論基礎模型。這個問題的靈感來自我在科技網站上讀到的一篇文章。如果說 2023 年是 OpenAI 高光之年。那麼,在基礎模型的領導者中,2024 年的主角將是哪個公司?蘋果會推出 Ajax 大模型嗎?我們對 Gemini 的關注會多於 GPT 嗎?

吳恩達:事實證明,每當出現一波技術創新時,媒體都喜歡談論技術層面。所以媒體會關注 OpenAI、谷歌、AWS、微軟、Meta、英偉達、AMD 等公司。這沒什麼問題。但事實證明,要讓技術基礎設施層成功,我們還需要成就另一個領域,那就是建立在這些技術提供商之上的應用層。坦白說,我們需要基於這些工具構建的應用來產生更多收入,以便它們能夠爲這些工具構建者買單。一篇很好的文章顯示了 GPU 的資本投資。作爲一個羣體,我們需要創造一些應用,來填補這數百億美元的空白,這是我們現在已經進行的資本投資,特別是在 GPU 方面。

所以,我不知道媒體會做什麼,他們有自己的炒作週期。但我認爲大量的實際工作,不僅僅存在於基礎模型那裡,而是在醫療保健、金融服務、教育、電子商務等所有這些領域,去識別和執行項目。