獨家|騰訊傑出科學家、混元大模型技術負責人之一劉威離職
編輯 | 褚杏娟、蔡芳芳
AI 前線獨家獲悉,騰訊傑出科學家、騰訊混元大模型技術負責人之一劉威,目前已經從騰訊離職。
今年 5 月,劉威以混元大模型技術負責人之一的身份,出席 InfoQ 舉辦的 並發表了《騰訊混元大模型技術和應用實踐》的主題演講。今年 9 月,他還在 2024 外灘新媒體年會上發表了題爲《生成式 AI 的發展與騰訊混元大模型的實踐》的主旨演講。
劉威於 2012 年獲得美國哥倫比亞大學計算機科學與電子工程博士學位,曾任 IBM 沃森研究中心研究科學家。劉威博士長期從事計算機視覺、機器學習、數據挖掘、信息檢索等領域的基礎研究和產品開發,迄今發表和錄用論文 100+ 篇,總引用次數爲 3600+ 次。
劉威曾先後獲得 2011 年底 Facebook 博士研究生獎學金、2013 年度哥倫比亞大學優秀博士論文獎、2014 年度計算機視覺與模式識別國際會議 (CVPR) 青年研究者獎、2016 年度國際信息檢索大會 (SIGIR) 最優論文榮譽獎。
劉威多次擔任國際權威期刊的客座編委與審稿人,自 2007 年起一直擔任國際頂級會議 NIPS、CVPR、ICCV 等的程序委員成員,擔任第四屆自然語言處理與漢語計算會議 NLPCC 2015 的領域主席,並自 2014 年起擔任美國自然科學基金信息與智能系統分部 (NSF IIS Division) 的研究項目評審。
2017 年 3 月,劉威從 NSF IIS Division 離職,加盟騰訊 AI Lab,擔任 AI Lab 計算機視覺中心總監、廣告多媒體 AI 中心總監,負責圖像視頻數據相關的 AI 研究。
2022 年 11 月,劉威入選 2023 IEEE Fellow,入選理由是對大規模機器學習和智能多媒體的貢獻。IEEE Fellow 是 IEEE 授予成員的最高榮譽,每年由同行專家在做出突出貢獻的會員中評選出,當選人數不超過 IEEE 會員總人數的 0.1%。
劉威曾對外介紹,騰訊混元大模型名稱的由來,表示“混元”在古代漢語中意味着從無序到有序、從混亂到規律的過程,這也正是生成模型的使命。
去年 9 月,騰訊混元大模型上線,之後騰訊又發佈了混元大模型 MoE,目前已經涵蓋了輕量版到中版,並且輕量版在騰訊雲上完全免費。今年 5 月,騰訊混元文生圖大模型發佈,並宣佈開源;到了 9 月,騰訊宣佈推出新一代大模型“混元 Turbo”。
騰訊混元積累了大量自研技術,包括創新的專家路由 Routing 算法、獨創的 MoE Scaling Law 機制以及合成數據技術,實現模型總體性能相比上一代 Dense 模型提升 50%,在文生圖方面,混元實現了基於 LLM + DiT 的生成能力;視頻生成上,騰訊混元擁有文生視頻、圖生視頻、圖文生視頻、視頻生視頻等多種能力,支持 1k~4k 的分辨率。
“有人問騰訊爲何如此擁抱生成式 AI?我認爲軟件的未來就是生成式 AI。”劉威曾在公開演講中表示。據悉,目前混元大模型已接入騰訊內部 700 多個司內業務應用及場景,有很多是輕量模型,如微信輸入法、微信“搜一搜”、騰訊新聞、騰訊會議、企業微信等。
在推理方面,劉威認爲,如果一個 AI 無法推理,人類可以寫一個很長的 Prompt 告訴它如何推理,但幾年後 ChatBot 可能就不再有用了。因此,AI 的推理能力必須從被動推理變爲主動推理。
在劉威看來,大模型越來越大的原因是人們希望無論是多模態、單模態、聽說讀寫還是具身智能,它做越來越多的任務。由於整個方法論範式的改變,從單任務變成了多任務、從單模態變成多模態,多網絡變成了一個大網絡,這便是系統性的革新。生成式 AI 的系統性變革至少包含三個維度,即方法論的變革、運算模式的變革和算力的變革。
會議推薦
就在 12 月 13 日 -14 日,AICon 將匯聚 70+ 位 AI 及技術領域的專家,深入探討大模型與推理、AI Agent、多模態、具身智能等前沿話題。此外,還有豐富的圓桌論壇、以及展區活動,滿足你對大模型實踐的好奇與想象。現在正值 9 折倒計時,名額有限,快掃碼諮詢瞭解詳情,別錯過這次絕佳的學習與交流機會!
今日薦文
你也「在看」嗎?