☰

李飛飛、吳恩達開年對話：AI 寒冬、2024新突破、智能體、企業AI

機器之心報道

機器之心編輯部

在人工智能發展史上，2023 已經成爲非常值得紀念的一年。在這一年，OpenAI 引領的 AI 大模型浪潮席捲了整個科技領域，把實用的 AI 工具送到了每個人手裡。但與此同時，人工智能的發展也引起了廣泛的討論和爭議，尤其在其商業應用和未來發展前景方面。

著名 AI 專家 Rodney Brooks 在 2024 年初發文預言，認爲 AI 可能即將進入一個新的寒冬，隨着泡沫的破裂，行業可能面臨嚴峻的挑戰。他的這一言論引發了業界的廣泛討論：新的一年，AI 領域將會迎來更多的炒作，還是進入低谷？與此同時，還有不少人擔心，AI 是不是會取代更多人的工作？

在前不久的國際消費類電子產品展覽會（CES）上，兩位著名 AI 科學家、斯坦福大學教授李飛飛和吳恩達以此爲契機展開了討論。此外，他們還討論了：新的一年，哪些 AI 技術將迎來新的突破？AI 智能體的崛起意味着什麼？對生成式 AI 準確性存在顧慮的企業要怎麼用好這項技術？

以下是本次討論的視頻內容：

原視頻鏈接：https://videos.ces.tech/detail/video/6344567556112/great-minds-bold-visions:-what% E2%80%99s-next-for-ai

爲了方便大家收藏具體內容，機器之心還將視頻整理成了文字版：

主持人：首先我們來討論一下第一個問題，這個問題與人工智能的當前狀態有關。去年無疑是人工智能炒作非常瘋狂的一年。

我們的好朋友 Rodney Brooks 在 1 月 1 日發推說：「現在該穿厚衣服了，可能又一個人工智能寒冬即將來臨，而且會非常寒冷。」那麼，在新的一年，AI 領域會迎來更多的炒作，還是低谷呢？

吳恩達：我認爲媒體會按照它們的方式去做事。但我們並不會進入寒冬，因爲人工智能的商業基礎比以往任何時候都要堅實，甚至在生成式 AI 浪潮來臨之前就已經如此。去年，人工智能真正起飛了。它可能推動了數千億，甚至數萬億美元的市場，這點我不確定。至少對像谷歌這樣的公司來說是數千億美元，因爲展示更相關的廣告可以帶來大量的收入。所以AI 的商業基礎是存在的。

其實，關於人工智能，最難理解的一點是，它是一種通用技術。這意味着它不僅僅對一件事有用。它有點像電力這樣的通用技術，如果我問你電力有什麼用，你會覺得很難回答，因爲它的用途太廣了。人工智能也是如此。就我們今天所處的階段來說，即使人工智能無法取得任何技術核心進展，當然它肯定會取得進展。即使沒有，世界各地都有很多用例等待被發現和構建。所以我非常有信心，它的商業基礎將繼續壯大。

李飛飛：是的，我大體上同意 Andrew（吳恩達）的觀點。我們看到的是人工智能的另一個拐點，這個拐點始於大型語言模型的發展，特別是 ChatGPT 的首次推出以及後續模型的推進。

我認同 Andrew 的看法，AI 是一種深化的橫向技術。作爲一種深化的橫向技術，它正成爲下一次數字革命或工業革命的重要推動力。公共媒體的報道，會呈現波動，但這不是最關鍵的。重要的是，這項技術已經根植於我們的生活。它正在深入到所有垂直行業和消費者體驗中，逐漸改變我們的社會、經濟和政治結構。這是不爭的事實。而且這種改變正在變得越來越明顯。

主持人：讓我們跳到你們對 2024 年重大突破的預測。你們認爲今年 AI 的最大突破會是什麼？

李飛飛：預測未來總是非常危險的，因爲我說錯的話會被引用。從計算機視覺和所謂的以像素爲中心的 AI 領域來說，我確實認爲我們正處於非常激動人心的技術進步的邊緣。我們一直在關注生成式 AI，我們一直在研究擴散模型，有人可能聽說過 Gaussian splatting 或這方面的內容。我認爲目前的技術浪潮中，有許多成果幾乎就要實現突破了。我不確定它是否會像一年多以前的大型語言模型那樣成熟，但我越來越多地看到這一點。我對此非常興奮。

主持人：Andrew，你怎麼看？

吳恩達：是的，我也有幾個預測。首先，我們看到了大型語言模型的突破。我同意飛飛關於圖像的看法。所以我看到的是，從大型語言模型到大型視覺模型的轉變。很多進步不僅僅在於圖像生成，圖像分析也在進步，它能提高計算機的視覺能力，這對自動駕駛汽車等領域有很大的影響，比如任何帶有攝像頭的地方。這是第一點。

第二點我想說，你向 ChatGPT 提問，它會立即作出迴應。但我更感興趣的是自動化智能體的崛起。當你給 AI 系統一個指令，比如說「親愛的 AI 系統，幫我做市場調研，對這個公司進行競爭分析。」智能體不會立即給出迴應，而是規劃一系列動作，比如進行網絡搜索、下載網頁、總結信息。它會去做半小時、一小時或一天的工作，然後帶着答案回來。自動化智能體能夠規劃和執行一系列動作。它們現在剛剛起步，但在研究和商業化方面有很多進展。我期待在接下來的幾個月裡，會有新的突破。

最後一點，可能也適用於 CS 領域，我對邊緣 AI 非常感興趣。我經常在我的筆記本電腦上，運行大型語言模型。我經常用 GPT-4，也經常用 Bard。但很多人不知道的是，在你的筆記本電腦上運行大型語言模型實際上已經相當可行。雖然這些模型不像 GPT-4 那麼大，但也夠用了。我認爲這件事意義深遠。所有的 PC 製造商，難道不會想要銷售給消費者一個更強大的 PC，讓他們使用最新的 AI 技術嗎？顯卡通常是人們升級電腦的一個動因。我認爲在你的筆記本電腦、PC 或你的工業 PC 上運行的邊緣 AI，它的能力實際上比大多數人認爲的要好得多。對 CS 領域來說，我認爲這將推動很多設備的銷售。

李飛飛：我有一點點不同的意見。你提到了「自主智能體」，但我更傾向於將其稱作「輔助智能體」。我們在當前的大型語言模型和這些龐大的基礎模型中觀察到，處理長尾問題依然是個挑戰，無論是在幻覺現象還是其他方面。在很多工作環境中，爲了提供高品質的服務和產品，關注長尾分佈非常重要。因此，我認爲更可能出現的是人機交互式協作。在這種模式下，輔助智能體既包含了自主工作的部分，也包含了與人類的協作部分。這比完全自動化更有可能成爲現實。

吳恩達：確實如此（擊掌）。我其實在一定程度上同意你的看法。我想分享我的經歷。「自主智能體」這個詞可能有些問題，但我在商業領域看到的是，大多數人更願意讓 AI 輔助人類，而不是替代人類，尤其是考慮到失業的問題，這是一個現實挑戰。我不想忽視那些失業者的苦難。

我觀察到的是，決定是否使用 AI 來自動化或取代人力，通常更多是基於商業經濟來考慮，而不是基於倫理。或許這應該是一個倫理決策，但誠實地說，當我與企業合作建立聊天機器人時，我看到大多數企業都會進行非常理性的經濟評估。人類能夠帶來這些價值，人工智能能夠帶來那些價值，他們關心的是怎麼做是最佳的經濟決策，畢竟競爭者也在做相同的事情。我希望我們能說「不要取代人類的工作」，但不幸的是……

主持人：關於這種類型的 AI 智能體，我想引用 Mira Murati 的一句話。她說，「AI 智能體的概念並不新鮮，但現在我們正在向未來迭代，發展出具有智能和常識的智能體，它們理解我們爲什麼要做某些事情。」

李飛飛：好的，我想補充一點，也對那個觀點發表評論。我認爲我們需要謹慎區分取代「工作」和取代「任務」。我相信，你我都看過相同的報告。報告表明，人類的每項工作實際上都是由多個任務組成的。我花了很多時間研究醫療保健。一名護士在值班的 8 小時裡要完成數百項任務。AI 智能體確實在許多任務中發揮輔助和增強的作用，但我們需要慎用「工作」這個詞。我確實認爲，經濟商業決策與倫理社會決策並不是互斥的。這是一個更深入的討論，我知道你和我意見是一致的。

回到你關於這些智能體有理解能力的問題。我認爲這是一個非常微妙的術語，僅關注商業方面。什麼是理解？有對數據中存在的模式的理解，有對你所做決策的理解，還有對任何人類任務意圖的理解。所以，實際上，我不會簡單地用一個籠統的「理解」這個詞來描述今天的 AI 智能體。

主持人：你認爲 AI 智能體會在何時達到什麼程度？

李飛飛：我認爲我們目前做得最好的是理解數據中的模式，尤其是當我們有大量的訓練數據時，我們做得非常好。我指的是大型語言模型，使用基於序列到序列的基於 transformer 的算法，我們真的做得很好，從數據中提取模式，以創造強大的預測模型。所以我認爲，這可能是最前沿的。再次強調，我認爲「理解」要微妙得多。你們都來自商業領域，知道其中的細微差別，我認爲還有更多工作要做。至於意圖理解，我認爲我們只是觸及了表面。

吳恩達：我想回到任務的話題，因爲我認爲這很重要。我的團隊爲很多企業工作，偶爾我會接到首席執行官的電話。他們說：「嘿，Andrew，我讀了關於 AI 智能體的文章，我該怎麼做？」結果表明，有一種方法，它能幫助企業確定哪些任務應嘗試用 AI 增強或自動化。正如飛飛所說，大多數工作由許多不同的任務組成。以放射科醫師爲例，放射科醫師閱讀 X 射線影像，他們需要獲取病人的病史，操作機器、維護機器、指導年輕醫生等等。所以放射科是一個例子，涉及許多不同的任務。我所見過的企業做法是觀察你的團隊，瞭解你所有員工實際上在做什麼任務，並且不是在職位層面，而是在任務層面分析。這項任務在多大程度上適合用 AI 去增強或自動化以及業務投資回報率如何。每次我和企業一起做這個工作時，我們總是能想出很多點子，但我們沒有時間去實施。所以 AI 的增強或自動化有很多機會

我學到的第二點是投資回報率最高的任務，往往不是人們最初所想到的那個。以放射科醫師爲例，人們通常會想到，哦，放射科醫師就是看 X 光片的。這是你的腦海中關於這個職業的定位畫面。但當我們去分解這項工作時，我們會發現有很多其他任務，比如收集病人病史之類的。這些任務可能更容易實現，而且投資回報率更高。所以我發現，系統地進行這個練習，通常有助於企業識別有價值的機會，然後進行構建與購買的決策，執行 AI 項目。

主持人這正是我想談的下一個話題。讓我們討論一些更加實際的問題，在與財富 500 強公司的合作中，你有沒有發現，那些有着清晰的、可證明的、可實現的投資回報率的應用都有哪些共性？比如，你覺得這個房間裡的大多數人應該專注於哪些應用？

吳恩達：如果我們廣泛觀察財富 500 強公司，我認爲常見的應用是客戶運營或客戶支持。有很多公司試圖增強或自動化客戶支持。我認爲軟件工程也在轉變。我們對軟件工程師的支持遠遠超出了 Github Copilot。Github Copilot 是一個不錯的工具，但我們能做的遠不止這些。我認爲銷售運營也受到了很大影響。但對於特定企業而言，幾乎每家公司都在做客戶運營，所以你也應該認真考慮這個方面。但更激動人心的事情是，我和一家非常大的農業公司談過，我們確定了一些任務。這不是你想到的那種收割任務，而是一些奇怪的任務。我們認爲或許可以使用 AI，來大大節省他們的時間。所以，適合你的業務和行業特色的小衆領域，我認爲通常更引人入勝。它們不僅有趣，還能創造出特定於行業的防禦性飛輪效應。因爲每個人最終可能都會購買一些通用的銷售運營工具等，但那些特定於你業務的東西，你應該在內部構建，我覺得這些事情非常令人興奮。

李飛飛：現在確實有各種各樣的客戶支持或運營解決方案。但我想補充的一點是，我們還可以在當前技術中尋找共同的機會。我認爲有個結論今天依然成立，那就是，在數據最豐富的地方，你可以從中識別出可重複或有效的模式，無論是人類語言模式、結構化數據模式還是圖像數據模式。數據所在的地方，以及數據模式被證明在你的業務中有價值且可操作的地方，就是你應該關注的地方。

主持人：讓我們談談財富 500 強 CEO 可能面臨的障礙。我們上週日舉行了醫療保健峰會，會上有幾位醫療保健 CEO 出席。我們問其中一位，你對數字創新最感興趣的是什麼？他說人工智能。然後我問他，作爲 CEO，你最擔心什麼？他說，不準確性。

李飛飛：這是最難的行業之一。

主持人：你想對那些將不準確性上升爲 CEO 級別關切的 CEO 說些什麼？在你看來，還有哪些問題可以上升到這個級別？

李飛飛：就像我之前所說的，這取決於你的產品、你的服務以及結果的利害程度。在醫療保健、金融預測等許多行業中，長尾精確性非常重要。你不能承受人命損失或人身傷害，你不能承受銀行出錯。所以你需要了解你的行業，瞭解你的解決方案和服務，看看 AI 可以在哪裡發揮真正的作用。這就關係到你說的炒作。當我與商業高管交談時，我們應該摒棄炒作，理解這項技術能做什麼，避免投資於那些 AI 還不擅長的方向。

主持人：那麼飛飛，類似醫療保健這種涉及生死和高度監管的行業，他們想用生成式 AI，但又擔心準確性問題，你想對他們說些什麼？

李飛飛：Andrew 和我都在醫療保健領域工作了很久。實際上，醫療保健中有大量的 AI 應用，從非常上游的藥物發現開始，我們可以做很多事情。

主持人：我想說的是生成式 AI

李飛飛：這是一個信息過載的詞。今天，每種 AI 都被稱爲生成式 AI。在 Andrew 和我的早期研究中，我們有非常具體的數學定義來定義生成式 AI。但現在，我們……

吳恩達：我們之前管它叫機器學習，但機器學習……

李飛飛：我們還曾經區分生成式 AI 和判別式 AI。如今，這種數學嚴謹性已經消失了。

吳恩達：是的，我覺得大衆媒體已經接管了技術術語。技術界也只是跟着適應。

李飛飛：確實如此。所以，當你說生成式 AI 時，我假設你指的是那種大數據驅動的有預訓練階段的模型。有些人可能會將 transformer 和預測模型納入其中，但我不確定是不是總是這樣。但無論如何，我認爲如果真的存在準確性問題，我們應該檢查幾個方面，比如這是模型的問題，還是數據質量的問題？是因爲把 AI 引入流程纔有了這個問題嗎？導致結果不準確的商業問題有很多。你要弄清楚這些問題，並嘗試解決它們。有時候，例如在某些醫療診斷和治療層面，你確實需要認識到限制的存在，如果風險太高，我們不能過度推進。

吳恩達：我補充一點，雖然我們使用 “生成式” 這個術語。但 AI 往往用於分析。我的團隊已經做了很多項目，比如使用這些大型語言模型來閱讀電子健康記錄，試圖得出結論，而不是撰寫文本。即使你在寫文本，如果你小心使用總結軟件，也能得到不錯的結果。它可能還會有一些錯誤，我認爲在醫療保健環境中，如果某個場景風險不那麼高，還是有很多部署這些技術的機會的。

就診斷來說，如果你弄錯了一些東西，那結果是很糟的。但我們部署了一個系統，目前仍在一家醫院運行。該系統用於篩選患者、閱讀電子健康記錄，判斷誰的死亡風險更高，並推薦他們考慮接受臨終關懷。但我們無法信任系統做出的決定。所以我們把它送給醫生，讓醫生複查我們展示的病例，並做出最終決定。

實際上，我新加坡的一個朋友正在使用新加坡國立大學的一個系統，查看病人的電子健康記錄，嘗試估計病人將在醫院待多久。有時醫生會認爲這是個簡單的病例，三天內就會出院，但 AI 說不，需要 5 天。這就引發了進一步的討論。這就是新加坡正在發生的事情。醫生說，「哦，也許我需要再仔細看看這個病人。也許我漏掉了 AI 發現的東西」所以，這些東西實際上正在部署。但根據系統的能力，我們通常可以設計安全措施，確保以負責任的方式部署 AI。

在醫療保健運營中，如果你使用 AI 來安排核磁共振機的試用，即使你犯了錯誤，導致核磁共振機使用效率降低，這雖然很糟，但也許並不像弄錯關鍵診斷那麼糟糕。所以實際上，AI 在醫療保健領域有很多部署機會，我認爲幾乎所有行業都是如此。

主持人：那麼，我們接下來討論基礎模型。這個問題的靈感來自我在科技網站上讀到的一篇文章。如果說 2023 年是 OpenAI 高光之年。那麼，在基礎模型的領導者中，2024 年的主角將是哪個公司？蘋果會推出 Ajax 大模型嗎？我們對 Gemini 的關注會多於 GPT 嗎？

吳恩達：事實證明，每當出現一波技術創新時，媒體都喜歡談論技術層面。所以媒體會關注 OpenAI、谷歌、AWS、微軟、Meta、英偉達、AMD 等公司。這沒什麼問題。但事實證明，要讓技術基礎設施層成功，我們還需要成就另一個領域，那就是建立在這些技術提供商之上的應用層。坦白說，我們需要基於這些工具構建的應用來產生更多收入，以便它們能夠爲這些工具構建者買單。一篇很好的文章顯示了 GPU 的資本投資。作爲一個羣體，我們需要創造一些應用，來填補這數百億美元的空白，這是我們現在已經進行的資本投資，特別是在 GPU 方面。

所以，我不知道媒體會做什麼，他們有自己的炒作週期。但我認爲大量的實際工作，不僅僅存在於基礎模型那裡，而是在醫療保健、金融服務、教育、電子商務等所有這些領域，去識別和執行項目。

李飛飛、吳恩達開年對話：AI 寒冬、2024新突破、智能體、企業AI

相關資訊