谷歌大腦DeepMind「婚後」貌合神離,Hassabis怨氣沖天!1+1<1
新智元報道
編輯:flynne
【新智元導讀】谷歌與DeepMind合併後,內部貌似仍存在不和,創始人Hassabis疑似對公司AI發展感到不滿,並面臨挑戰如何平衡深度研究與爲谷歌產品提供支持的任務。
誰能想到,谷歌大腦和DeepMind的「聯姻」,內裡竟然千瘡百孔、同牀異夢?
去年此時,被OpenAI壓在地上打的谷歌乾脆破釜沉舟,把兩大最強機構谷歌大腦和DeepMind正式合併。
如今一年過去了,理想中的最強合體不僅沒實現「1+1>OpenAI」的效果,反而愈加貌合神離,員工抱怨重重。
Hassabis深感不滿,怨氣沖天
三月初,谷歌頂級人工智能執行官Demis Hassabis在經歷了幾周的挫折之後,試圖重新振作團隊的精氣神。
當時,谷歌剛剛發佈了一款聊天機器人Gemini,由Hassabis團隊爲其提供技術支撐。
原本以爲這是谷歌向公衆展示自己可以趕超OpenAI風頭正勁的ChatGPT的絕佳機會。
然而,Gemini的表現卻不那麼給力,因其對用戶的提問做出包含種族主義的回答而招致公衆的嘲笑。
這讓本就處於水深火熱的谷歌,更加處於輿論的漩渦。
谷歌內部「積怨」久矣
據知情人士透露,在一次會議上,Hassabis表示後續對於此類問題的解決,谷歌的員工需要做好內部溝通的配合。
早在之前就有報道稱DeepMind拒絕與谷歌大腦分享代碼,並且兩個部門雖然合併爲Google DeepMind,但是各自的負責人也是互不隸屬,互不干涉。
由此看來谷歌內部的不和諧由來已久。
(正所謂冰凍三尺,非一日之寒)
商業化壓力與人才競爭
Hassabis在擁有18.2萬人的谷歌也難以適應新的環境。
DeepMind曾經在谷歌內部具有非同尋常的獨立性,因此這也可以讓他一心一意地從事人工智能研究,而不必考慮其研究成果的商業化問題。
但是現在,Hassabis卻頂着巨大壓力,因爲他必須與其他領導者更密切地合作,把DeepMind的技術轉化爲商業產品。
與此同時,OpenAI繼續不斷地從谷歌挖走人工智能研究的關鍵員工。
據相關人士透露,Hassabis曾抱怨谷歌的薪酬制度很難阻止研究人員因OpenAI優厚的薪酬待遇而離職。
DeepMind後面採用一種特殊的股票池的方式提高研究人員的薪酬,然而能否較好解決人才流失問題,目前還未可知。
下表顯示了直接負責Gemini開發的36人,這也反映了自去年8月The Information公佈項目負責人名單以來的許多離職情況。
包括Ioannis Antonglou和Amelia Glaese在內的許多高層人員最近都加入了OpenAI或自己創辦公司。
此外,Hassabis還因媒體對一些重大離職事件的大量報道而心生不滿。
谷歌人工智能團隊的挑戰
2022年11月,發佈ChatGPT時的轟動震驚了谷歌。
多年來,谷歌一直運營着世界上最重要的兩個機器學習團隊。
谷歌大腦(Google Brain)是構建語言模型的先驅,它提出的Transformer,是OpenAI用來創建ChatGPT的技術。
同時,DeepMind打造的人工智能也在國際象棋和圍棋等遊戲中大顯身手。
但是,這兩個團隊經常在共享代碼和計算資源等方面發生衝突。
古人云:「人心齊,泰山移」,那人心如果不齊,自然就無法達到想要的結果。
因此這兩個團隊都沒有產生像ChatGPT一樣讓互聯網炸開鍋的產品。
在OpenAI聊天機器人發佈幾周後,谷歌首席執行官Sundar Pichai指示谷歌大腦和DeepMind的管理者,不能再像之前一樣各自爲戰,而要合作開發一個人工智能模型,並將其命名爲Gemini。
與此同時,Pichai開始準備邁出更大的一步:合併人工智能部門。
但當時Hassabis似乎對這樣的合併並不感到興奮。
他表示,不確定自己是否願意領導合併後的部門,並且他還考慮過離開谷歌,籌集數十億美元再成立一個新的研究實驗室。
因爲這樣會給他一個全新的開始,讓他擺脫日益耗費他時間的組織政治。(Carl否認Hassabis曾考慮離職)。
但是,當Pichai在2023年4月下令合併成立Google Deep Mind時,Hassabis反而成了該部門的新領導。
在當月的一次會議上,他向員工介紹了要合併的事,並強調了合併之後DeepMind員工可以獲得更多的服務器資源和兩個團隊研究人員合作的機會。
不過,據參加會議的人士稱,他在會議上的平淡表達還是給其他人留下了他對合並並不熱衷的印象。
據說,讓許多谷歌研究人員感到震驚的是,就在幾個月前,Hassabis還試圖將DeepMind和谷歌大腦之間的合作限制在Gemini項目上。
合併並沒有讓谷歌的人工智能團隊變得跟預想的那樣和諧起來,有時仍會因資源問題發生衝突。
谷歌將員工從對人工智能的探索性研究轉移到了Gemini項目上,使該項目的員工規模增長到了約1000人。
與此同時還關閉了一些其他的人工智能項目。
這就導致了組織內部幻滅感的產生。
恨鐵不成鋼
從理論上來說,Hassabis擁有擊敗OpenAI所需的一切要素。
儘管OpenAI和其他公司試圖挖走他的團隊,但他麾下仍有許多世界頂尖的機器學習研究人員,並且他還負責監督一支團隊將DeepMind的科學進展整合到Gemini中。
DeepMind還擁有龐大的谷歌數據中心網絡和數十億谷歌產品用戶,可以向他們推廣其新的人工智能產品。
有報道稱如果谷歌與蘋果公司就Siri等iPhone功能的合作達成了協議,那麼就能讓其產品接觸到更多的用戶。
但是,迫於展示人工智能進步的壓力,導致Hassabis和他的同事們誇大了他們工作的能力。
在去年十二月,谷歌期待已久的Gemini發佈後,批評者稱其視頻演示具有誤導性,從而影響了大家對該技術的讚譽。
這段視頻裡聲稱該模型能做到實時響應語音提示,但現實卻是,它是在延遲狀態下運行的,而且生成響應的提示語也與視頻中所展示的不盡相同。
Hassabis曾表示,他希望這次演示是「有抱負的」,能展示出這項技術最終實現的具體目標。
而結果卻並不如人願。
另一項研究突破AlphaGeometry也招致了類似的批評。
今年1月,DeepMind在一篇博文中稱,該人工智能系統可以解決「接近人類奧林匹克金牌得主水平的複雜幾何問題」。
但研究自動推理的紐約大學教授Ernest Davis表示,這篇博文並沒有提到它的所存在的重大侷限。
例如,DeepMind的人工智能只能處理二維幾何圖形,無法理解面積。
DeepMind最早的投資人之一Frank Meehan認爲,這些爭議一直在分散Hassabis對AGI研究的注意力。
並且OpenAI已經開始「根據文本提示生成令人難以置信的視頻,而谷歌卻還在一些圖像問題上兜圈子」。
這情況很可能是「持續挫敗感的來源」。
強化研究主導,追求純粹AI影響力
不過最近,Hassabis進行了一些組織變革,以恢復谷歌內部純粹人工智能研究的影響力。
今年3月,Hassabis調整了他的管理團隊,讓更多的研究主管可以直接向他彙報。
Pushmeet Kohli、Raia Hadsell和Zoubin Ghahramanan都是谷歌負責人工智能不同研究領域的高管。
現在他們都直接向Hassabis彙報工作,而不是向Koray Kavukcuoglu彙報工作(Koray是負責管理Gemini項目的Google DeepMind首席技術官)。
在一份聲明中,DeepMind發言人Amanda Carl表示,谷歌大腦和DeepMind的合併進展順利,它們的重組更有助於提高效率。
並且說明,Hassabis在全體員工會議上發表的評論的目的是在於澄清DeepMind在開發過程中所參與的工作,而不是指責。
同時,Carl還否認Hassabis對新的工作方式感到不滿。
谷歌的新思考:如何邁向下一波人工智能產品
Gemini項目現在有一個專門負責代理的團隊,即可以自動執行計算機任務的軟件。
據一位參與該項目的人士稱,該團隊包括Adept的聯合創始人Anmol Gulati(Adept是一家開發人工智能代理的著名初創公司)。
但由於競爭對手的搶人,DeepMind也失去了一些在該領域工作的干將員工。
Daan Wierstra是DeepMind的一名高級計算機科學家,在谷歌收購DeepMind之前就加入了DeepMind。
然而今年早些時候,他離開了DeepMind,加入了Holistic,這是一家由前DeepMind研究人員創辦的一家代理初創公司。
在技術方面,DeepMind雖然縮小了與OpenAI的差距,但這種差距卻並沒有消除。
從某些指標來看,Gemini的表現要好於OpenAI的GPT-4,但OpenAI的模型早在幾個月前就已問世,這讓它搶佔了先機,得以收集更多的數據,創建更好的模型。
目前,OpenAI的人工智能生成視頻服務Sora也令業界驚歎不已,Hassabis認爲谷歌要想在這個領域趕超競爭對手可不是那麼容易的。
靜觀其變,AGI或指日可待
一位曾經參與Gemini研究的人員表示,爲了更好地衡量實現其長期目標情況,DeepMind的研究人員正在開發專門針對AGI的新基準。
另一位研究人員說,除了爲谷歌產品提供助力外,他們還希望Gemini能幫助他們完成另一項任務:提出新的方法和算法,以改進他們的研究。
紐約大學心理學和神經科學教授Gary Marcus曾將一家人工智能初創公司出售給Uber。
他相信,Hassabis能夠在DeepMind的研究方向和其爲谷歌產品提供動力的新任務之間取得平衡。
參考資料:
https://www.theinformation.com/articles/googles-demis-hassabis-chafes-under-new-ai-push?rc=epv9gi