智能週報|Sora終於上線;字節提升即夢業務優先級;小米也要做增程車……
撰文 | 新皮層小組
編輯 | 王傑夫
OpenAI遙遙領先的無敵神話或許該破滅了。
自美國時間12月5日OpenAI首席執行官Sam Altman宣佈開啓連續12個工作日的新品發佈計劃伊始,就有業內人士判斷這不過是Altman又一次揮灑他的營銷天賦以掩蓋OpenAI要「沒活了」的事實。
結果看來確實沒有什麼亮點,所謂連續12天的發佈,其實不過是每天定點放出一條一刻鐘左右的短視頻,要麼是宣佈某一個功能推出了強化版本,要麼就是另一個功能終於開放給更多用戶。當然,其中最值得一提的是年初火遍全球,被稱作下一個ChatGPT的Sora終於上線了。
不過,這場距離首次亮相足足299天的正式登場着實有點拉跨,當被短暫擠爆的服務器逐步恢復後,衆多實測對比視頻紛至杳來,對比來看Sora不僅沒能很好地實現生成視頻中所謂的3D連續性、長距離關聯性和物體永存性,甚至有些視頻的連貫性和可控性都不如國產的可靈、即夢、海螺這些視頻生成產品。
拿掉對Sora的「視頻模型開拓者」的濾鏡後,OpenAI如今還處在絕對領先地位的或許只有GPT-4o與o1這兩款語言模型了,而在圖像模型、3D模型、音樂模型等領域,其實都有各自不同的領先模型。
本週Google發佈了旗艦模型Gemini的2.0版本,據稱在編碼和圖像理解領域進步明顯,並且還一併發佈了包括可以操控瀏覽器在內的多款智能體產品——而傳言OpenAI的類似智能體發佈計劃將放在明年初。國內這邊,今年AI浪潮中最活躍的字節跳動,在近期提升了即夢產品的優先級,據稱公司內部判斷AI對話類產品(如ChatGPT和豆包)可能只是AI產品的「中間態」。
在2025年的AI故事裡,OpenAI還會是當仁不讓的主角嗎?
以下內容由「新皮層」團隊製作,歡迎關注。
Key Points
新模型與產品
OpenAI Sora終於上線;
Google發佈Gemini 2.0系列人工智能模型;
蘋果可能推出蜂窩版Mac;
蘋果新版本iOS系統正式集成ChatGPT;
三星計劃2025年1月發佈AR眼鏡,之後還將推出VR設備;
OpenAI宣佈Canvas功能全面開放至所有ChatGPT用戶;
科技公司動向
字節提升剪映即夢業務優先級;
小米第二款車YU7將於明年六七月上市;
Google發佈突破性量子計算芯片Willow;
英偉達面臨中國反壟斷調查;
通用汽車計劃關閉自動駕駛項目Cruise;
新模型與產品
OpenAI Sora終於上線
12月9日,OpenAI在12天系列發佈會的第三場,發佈了視頻模型Sora Turbo和對應的產品Sora(單獨的網站:sora.com)。OpenAI在今年2月發佈了Sora的demo版本,Sora Turbo是升級後的高端加速版。模型部分訓練數據來自美國影音素材公司Shutterstock和Pond5(已被Shutterstock收購)。
Sora支持文生視頻、圖生視頻、視頻生視頻,生成視頻的分辨率包括480p、720p、1080p,視頻時長5秒至20秒。值得一提的是,2月時OpenAI宣稱Sora生成的視頻時長可達1分鐘。另外,Sora提供視頻編輯功能,例如精確指定任意幀的輸入,針對任意幀前後延伸劇情,將兩個視頻場景合併成一個新的場景等。
目前,20美元/月的ChatGPT Plus會員和200美元/月的ChatGPT Pro會員可以直接使用Sora。Plus會員每月可生成50個視頻(最大分辨率720p,最長5秒),Pro會員每月可生成500個視頻(快速生成,最大分辨率1080p,最長20秒)。
Google發佈Gemini 2.0系列人工智能模型
12月11日,Google正式發佈Gemini 2.0的首個版本——Gemini 2.0 Flash。這款新模型不僅在全球範圍內以聊天機器人的形式向用戶開放,還面向開發者推出了具有試驗性質的多模態版本,具備文本轉語音和圖像生成功能。
Google CEO桑達爾·皮查伊(Sundar Pichai)在聲明中表示:「如果說Gemini 1.0的重點在於組織和理解信息,那麼Gemini 2.0的目標就是讓信息更加實用化。」相比前代模型,Gemini 2.0在大多數用戶需求領域的表現均有顯著提升,包括代碼生成和提供事實性正確回答的能力。不過在處理更長上下文的情況下,其性能略遜於Gemini 1.5 Pro。
用戶可以通過桌面端和移動網頁的模型下拉菜單選擇聊天優化版本的Gemini 2.0 Flash。Google表示,這一版本將在不久後通過Gemini移動應用上線。而多模態版本將通過Google AI Studio和Vertex AI開發平臺提供,計劃於2025年1月實現全面推廣,屆時還會推出更多尺寸的Gemini 2.0模型。
蘋果自研5G芯片有望明年初亮相,後續可能推出蜂窩版Mac
12月7日有消息稱,蘋果正在探索首次爲其Mac電腦和耳機引入蜂窩網絡連接功能。
報道稱蘋果計劃於2025年春季首次亮相其開發的5G通信芯片,首發將搭載於入門級手機產品iPhone SE以及低配版的iPhone和iPad上。該芯片預計於2026年推出高端版本,到2027年則會推出性能更優的第三代版本。目前蘋果使用的5G芯片由高通公司供應,預計明年推出的蘋果初代5G芯片的性能仍不如高通,但蘋果計劃到第三代時在性能上超越高通。而搭載新5G芯片的Mac電腦則可能最早在2028年面世。
早在2008年時蘋果就考慮過在筆記本電腦MacBook Air上搭載蜂窩網絡通信芯片,但因該芯片當時較佔體積而作罷。
蘋果新版本iOS系統正式集成ChatGPT
12月11日,蘋果公司推出新版本系統iOS 18.2更新,新版本系統中,蘋果旗下語音助理Siri正式集成OpenAI旗下ChatGPT,底層模型使用的是OpenAI旗下的GPT-4o模型。用戶可以通過Siri集成的ChatGPT處理更復雜的任務,包括生成文本、創建圖像和提供摘要等。
新版系統中Siri集成的ChatGPT默認不開啓,用戶需要在設置中啓用。隨後,當用戶向Siri提出Siri本身無法回答的問題,或者主動要求Siri調用ChatGPT回答問題時,Siri纔會提議使用集成的ChatGPT。當Siri集成的ChatGPT回答問題時,屏幕也會顯示ChatGPT的圖標。免費用戶存在使用量的限制,付費用戶可以通過登錄ChatGPT賬號獲取更多使用量。
中國市場的iPhone用戶暫時還無法在新版本iOS 18.2體驗到集成ChatGPT的新版Siri。未來,蘋果在中國市場可能把百度文心一言集成到Siri中,但蘋果和百度的合作目前進展受阻。目前,蘋果和百度工程師們正在共同改進文心大模型,使其更適合iPhone用戶,但該模型在理解提示詞和常見場景的響應準確性上仍然存在困難。
三星計劃2025年1月發佈AR眼鏡,之後還將推出VR設備
近日有消息稱,三星計劃在明年1月的Galaxy S25活動上發佈其AR眼鏡。據悉這款眼鏡外觀與普通眼鏡類似,重量約爲50g。功能方面,具備支付、手勢識別及面部識別能力。這款眼鏡由三星和Google、高通共同開發,預計將配備高通的芯片和Google的操作系統。
同樣在今天,Google也宣佈推出全新操作系統Android XR,而首款搭載該系統的設備是三星Project Moohan頭顯,這是一款搭載了Gemini模型的VR設備,用戶可以通過手勢和Gemini語音命令操控。在發佈會上,Google放出了用戶使用這款設備觀看YouTube以及在Google地圖中探索城市等用例。
OpenAI宣佈Canvas功能全面開放至所有ChatGPT用戶
12月13日,OpenAI宣佈將其Canvas畫布功能開放給所有ChatGPT用戶,此次更新將Canvas集成至GPT-4o,用戶無需切換模型即可使用。這是其「OpenAI 12天」直播活動中的第四項發佈。
Canvas最初於今年10月推出,僅面向ChatGPT Plus、Teams、Edu和Enterprise訂閱用戶。該功能將ChatGPT對話界面分爲左右兩邊,左側邊欄負責與ChatGPT對話,右側則展示實時的結果。例如你需要ChatGPT寫一段小說後,右側就會像「畫布」一樣展示這篇創作出來的小說,同時,你還可以選取小說的每個詞、每句話,讓ChatGPT爲你修改表達。當然一個更適合Canvas的應用場景是編程,其內置了Python模擬器,用戶可以直接在Canvas中運行代碼,查看輸出結果,並與ChatGPT協作調試。
科技公司動向
字節提升剪映即夢業務優先級
12月11日有消息稱,字節已經提升了剪映即夢業務的產品優先級,計劃後續把更多資源向更多模態的產品形態轉移到該業務中。字節內部判斷,AI對話類產品(如ChatGPT和豆包)可能只是AI產品的「中間態」,而非更長期更理想的產品形式。
從月活數據來看,剪映在2024年10月的全球AI產品月活榜月活達1.7億,僅次於ChatGPT的2.5億。而豆包雖然在過去幾個月內用戶規模有所增長,但目前對話輪次、時長等關鍵指標仍然不夠理想。具體來看,用戶每週僅活躍2到3天,輪次僅爲5到6輪,用戶的人均使用市場僅爲10分鐘左右。
即夢是抖音集團原CEO張楠在剪映任職後推出的AI創作工具和社區,其作爲視頻創作工具,在圖片、視頻編輯等功能上已經落地了大量AI技術,例如圖片生成、視頻生成和圖片理解等。
小米第二款車YU7將於明年六七月上市
12月9日,小米公佈了繼SU7之後的第二款車YU7,這將是一款純電SUV,定價預計與已發佈的小米SU7相當,在20萬至25萬元區間。在SU7對標特斯拉Model 3之後,這次小米又準備與Model Y競爭。
工信部官網信息顯示,該車型爲純電動多用途乘用車,外形尺寸爲長5米,寬2米,高1.6米。最高車速253km/h。該車電池爲三元鋰離子電池,電池單體生產企業是江蘇時代新能源科技有限公司,總成生產企業是中州時代新能源科技有限公司。
此外,小米第三款車型也流出了更多信息,區別於小米汽車前兩款純電動產品,將是一款增程式SUV,預計2026年上市銷售。該產品目前被稱爲「N3」,項目代號「崑崙」,價格定位在15萬元左右,將由武漢東風汽車工廠代工(小米可能收購併改造東風現有工廠)。
Google發佈量子計算芯片Willow,錯誤率顯著降低
2024年12月9日,Google量子計算實驗室宣佈推出全新量子計算芯片「Willow」。據Google介紹,Willow能夠在不到5分鐘內完成一項傳統超級計算機需要耗時10澤年(1澤年等於10²¹年)的任務,這一時間遠超宇宙的年齡。
與2019年Google首次展示量子芯片時相比,Willow的性能實現了飛躍,同時在降低量子計算錯誤率上也取得了顯著進展。量子計算採用量子位(qubit)代替傳統的二進制位,能夠同時存在於多個狀態,但容易受環境干擾產生錯誤。Google通過引入更多量子位並實時糾正錯誤,成功降低誤差,其研究成果已經發表在《Nature》雜誌上。
英偉達面臨中國反壟斷調查
12月9日,國家市場監督管理總局發佈消息稱,因英偉達公司涉嫌違反《中華人民共和國反壟斷法》及《市場監管總局關於附加限制性條件批准英偉達公司收購邁絡思科技有限公司股權案反壟斷審查決定的公告》(市場監管總局公告〔2020〕第16號),市場監管總局依法對英偉達公司開展立案調查。
據稱,本次調查主要針對的是英偉達對於以色列芯片廠商邁絡思(Mellanox)的收購事項。2019年3月,英偉達宣佈完成了邁絡思的收購,成交價爲69億美元。該交易是英偉達歷史以來最大的一筆收購,也是美國半導體公司截至目前最大一筆的收購案。在隨後的一年裡,這筆交易先後經過了美國、歐盟、墨西哥等地監管機構的批准,並在2020年得到了中國國家市場監督管理總局的批准。
報道稱,英偉達沒有在收購完成後履行批准的附加條件,是本次立案調查的主要原因。批准要求,英偉達在向中國市場銷售GPU加速器與邁絡思高速網絡互聯設備時,不得強制搭售、不得限制或阻礙購買,也不得在產品上歧視單獨購買上述產品的客戶。
此外,12月5日,英偉達CEO黃仁勳訪問越南,並在越南總理範明政的共同見證下,英偉達同越南政府簽署協議,將在該國建設AI研發中心和AI數據中心。黃仁勳表示,英偉達已經在越南投資了超過2.5億美元。
通用汽車計劃關閉自動駕駛項目Cruise
12月10日,通用汽車宣佈,計劃暫停向自動駕駛子公司Cruise提供資金,同時合併Cruise團隊和通用旗下技術團隊,優先開發駕駛員輔助系統。通用汽車預計,重組Cruise業務計劃預計2025年上半年完成。通用汽車預計,重組Cruise業務可以幫助公司每年減少支出超過10億美元。目前,通用汽車擁有子公司Cruise大約90%的股份,計劃通過收購其他股東股份,把持股比例提升至97%以上。
這意味着,通用汽車徹底擱置了對於自動駕駛車隊項目的長期投資。2021年,通用汽車提出新的營收目標規劃,預計通用汽車投資的Cruise自動駕駛叫車服務能夠在2030年實現500億美元的營收,同時實現業務盈利。但Cruise的業務發展不如預期,盈利遙遙無期。自通用汽車2016年收購Cruise以來,Cruise項目每年都造成鉅額虧損,2023年虧損就達到了34.8億美元。今年以來,通用汽車繼續注資的同時,也通過大幅裁員、暫停擴張等方式削減Cruise業務的成本。