國內首份“空間計算硬件”的答卷,是怎麼交出來的?

當兩個惺惺相惜的男人相互吹捧起來有多肉麻?

“N+1=Misa” 谷歌安卓大屏業務亞太區負責人Dan把這個公式打在了大屏上,Misa是和他一樣長着一臉大鬍子,Rokid創始人兼CEO,據說倆人第一次見面,花了很長時間聊如何打理鬍子。

“這裡的N有無數種可能,1是代碼。”不久前,在他牽頭下,Rokid Station(全球版)通過了谷歌的認證,成爲全球首款AR版便攜式Android TV™設備。

在Dan上臺前,Misa引用了蘋果創始人喬布斯曾經引用過的一句名言:“真正在乎軟件的人,應該打造自己的硬件。”這話的原始版權屬於圖靈獎得主Alan Kay。2007年,這句話爲世界帶來了iPhone。

數月前,打磨了8年的蘋果頭顯Vision Pro面世。蟄伏許久的XR行業突然進入了一個嶄新的“空間計算時代”。

被谷歌種草到日活三萬

Rokid Jungle是Rokid每年一度最重要的發佈會。Jungle有叢林的意思,Misa(祝銘明)喜歡稱呼自己和手下是猴子。2013年,這隻“猴子”受邀去硅谷參加Google的發佈會,看着一羣瘋子戴着Google Glass,坐着降落傘來到現場。

體驗完後,他迫不及待地在朋友圈寫下感受,一是非常棒的創新,二是我們可以做得更好。“當時主要覺得Google Glass太工程師範兒了,是當玩具而不是產品來設計的。”祝銘明說。

後來的市場反饋也證明了這個判斷是對的。不過,祝銘明確實是動心了。回國後,他辭去阿里M工作室負責人的職務,創立了Rokid。Rokid=Robot+Kid,這是他對“技術普惠所有人”的美好願望。

但帶領Rokid最先進入大衆視野的並不是AR眼鏡,而是智能音響。直到5年前的2018 Rokid Jungle,他們的第一款AR眼鏡,已經量產的Rokid Glass才作爲One more thing登場,卻很快逆襲成爲“主角”。

這款眼鏡很長時間面向的是B端市場,目前開枝散葉最廣的,是需要可視化的博物館場景。之後因爲疫情,搭載遠距離紅外測溫和安防功能的Rokid Glass 2意外成了功臣——這是差點被祝銘明砍掉的一代產品,理由是“測溫?太無聊了。”

誰也沒想到,二代產品發佈後5天,新冠來襲。

再後來,就是2021年消費級AR眼鏡Rokid Air的故事了,中間那個Glass被悄悄拿掉,因爲Rokid就是做AR眼鏡的。

從2013年被谷歌種草,到今年剛好是10年,在發佈會上,祝銘明公佈了一系列最新數據,只爲證明AR眼鏡不是工程師的玩具,對普通人也是“有用的”:每天,有超過3萬人使用Rokid的AR眼鏡;Rokid AR眼鏡用戶最高月活躍度達到40%;Rokid AR眼鏡用戶的單日使用時長,已經超過一個小時……

死磕0.2克重量

除了放自己和Misa的自拍照,Dan還貢獻出了女兒的兩張照片。一張戴着Meta的Oculus,一張戴着Rokid Max。

他說自己爲了體驗VR眼鏡,很早就在辦公室設立了獨立區域,第一次戴上頭顯的女兒特別興奮,但VR頭顯的重量讓小姑娘很難長時間佩戴,直到Rokid Max的出現。“現在她是Rokid的重度發燒友。”Dan說。

祝銘明也曾曬過兩歲半兒子佩戴Rokid的照片,用來說明佩戴的舒適度和操作的友好。多年前,他曾抱着一個神秘的箱子拜訪facebook,當着扎克伯格的面打開,裡面是尚未量產的Rokid Glass,“當時剛好和他們的CTO是朋友,主要聊了下投資和XR方向的討論。”

雙方一致認爲,XR會是未來發展的方向,但對於AR還是VR,產生了路線分歧。在祝銘明看來,需要佩戴厚重頭顯的VR有更強的沉浸感,卻是反人性的,“不會有那麼多人喜歡生活在一個罩子裡”——去年,一個行業的新銳創業者也發表了類似的觀點,強調自己一定要做AR,“扎克伯格定義的VR元宇宙,我猜他自己也不相信。”

這個人叫羅永浩。

一個不可否認的事實是,自VR頭顯誕生以來,都在死磕重量這件事。採用頭顯外型的Apple Vision Pro使用了鎂鋁合金,重量控制在了380克,超過了市面上絕大多數VR眼鏡,但佩戴上去依然有明顯的負重感。

初代Rokid Air的重量只有85克,今年發佈的Rokid Max只有75克,全新的,帶上一顆攝像頭的Rokid Max Pro也只有76克。而一副普通眼鏡的重量,通常不超過20克。

“我們內部是以0.2克爲基本單位,每次變動超過這個數字,就要向我彙報。”祝銘明說。再考慮到消費者對價格的接受程度,意味着Rokid很難走“堆料”這條路,儘可能用最小的重量辦最大的事。

於是,業界廣泛認爲需要兩顆攝像頭才能實現的SLAM及3D裸手交互,被壓縮到了一顆,背後靠的還是對算法的優化。

兩塊磨刀石:AR和AI

做AR眼鏡前,Rokid就明確了“AR+AI”雙輪驅動的開發模式。“其實我們在2016年就開始了手勢識別技術和單攝像頭解決方案的摸索。”祝銘明說。

那一年,他們搶在谷歌前,發佈了首款智能音響,搭載1300萬像素攝像頭的Alien,用戶能夠通過手勢和它產生交互。

回過頭去看,作爲一家初創公司發佈的首款產品,Alien的技術完成度是驚人的。以它爲參考系,不僅能看到Rokid的技術演進,也能看到產品理念的延續。

比如,和現在死磕0.2克的重量一樣,爲了讓語音控制更方便,他們自研了雙音節喚醒技術,用兩個詞“若琪”而不是“小愛同學”“天貓精靈”來喚醒機器。

以它爲代表的語音識別技術和對雜音的過濾技術後來被用在了Rokid Glass上,即使在嘈雜的生產車間,也能精準識別相關指令。

Alien還內置了定製的DLP (數位光處理)模組,打造了立體準全息投影,說明在那會兒Rokid就開始積累和打磨光學技術。

2018年,Rokid成立了北京實驗室A-lab,主要負責語音交互系統開發,所有成員都是博士;在此之前,他們在硅谷有個R-lab,負責AR、應用等開發。對應的是祝銘明所說的:“Rokid成立第一天,就是AI和AR並行的。”

“不過音響模式是比較快成熟,可以進行產品化驗證的東西。”他補充道。

這就不難理解,他在發佈會上的動情。對他們來說,消費級個人空間計算平臺Rokid AR Studio是名副其實的“十年磨一劍”,不僅有Rokid自研的全空間化AR操作系統YodaOS-Master,還基於單攝像頭實現了SLAM、微手勢交互、第一視角分享、視覺定位VPS能力等。

隨之而來的是交互方式上的變革:這款產品不依賴手柄或遙控器,而是用眼睛、手勢和聲音實現實時操控。

AR眼鏡有什麼用?

Dan在演講裡提到的另一個男人,是原研哉。老爺子講過一句話,科技越是進化就越接近生命的形態。還有一句和它相似的話,來自於麥克盧漢:“一切技術都是肉體和神經系統增加力量和速度的延伸。”

具體到AR眼鏡,理想狀態下,它增強的是包括眼睛在內的人類整個感知系統,幫助大腦理解世界,並且與之產生交互、協同。

解放雙眼,打破信息交互和顯示的物理侷限,也是Rokid AR眼鏡一直以來的賣點。

在推廣Rokid Air時,他們主打“換一種姿勢看世界”,將手機內容投射到眼鏡端,不用低頭接收信息。

到了Rokid Max,他們強調在超寬屏模式下,呈現出相當於6米外215英寸超高清大屏的效果。

這次的Rokid AR Studio,他們和蘋果一樣,將自身定位爲“空間計算設備”。主推的“空間搜索”,直接打破了之前搜索信息的陳列方式,搜索結果直接呈現在三維空間中,根據結果的相關性從近到遠排列,用戶可以動態挑選所需的內容。

不過,雙方的技術路徑並不相通。蘋果採用的是《頭號玩家》裡視頻透視VST(Video See Through)方案,“用戶看到的真實世界是用攝像頭拍到的”,而Rokid選擇的是《失控玩家》裡的OST(Optical See Through)光學透視方案方案,“用戶看到的世界就是真實世界”。

在影響體驗的一些關鍵指標上,Rokid也做到了和蘋果一致,像是90HZ無屏閃的高刷,解決了拖影和閃屏的問題。

即便如此,祝銘明也只給新品打了一個及格分。其中,交互能力做到了滿意,空間計算的真正剛需場景還沒完全摸索到,定價還不夠親民,革命性變化還不夠。

“對於C端用戶,哪些會受益於空間計算,我自己也沒答案。”他說,“但我很享受在超寬屏模式下做code review。”

他們確實非常期待,並且在極力探索AR眼鏡作爲生產力工具,而不是此前影音娛樂設備的可能。唯有這樣,AR眼鏡才能從其他屏幕那裡分割用戶時間。

引領者的角色

在進入成立的第10個年頭,Rokid的Slogan悄悄變成了“AR時代引領者”。而且祝銘明強調,引領者前面沒有“中國”二字。

如何來定義“引領者”的角色?從技術和產品來說,Rokid確實在行業內率先提供了一系列解決方案,包括一套Station的外接設備,直接讓AR眼鏡擺脫手機的束縛,獨立成爲一個移動終端。

就融資而言,整個2022年,在資本市場不那麼景氣的情況下,Rokid獲得了超10億元融資。

令祝銘明壓力最大的,是來自老家江西鷹潭餘江的一筆投資。當時他的父母特別嚴肅地問他:“這錢是不是非拿不可?能不能不拿?”

鷹潭素有“眼鏡之鄉”的美譽,投資“未來的眼鏡”倒也在情理之中。“拿這筆投資,主要也是找到了和家鄉眼鏡產業的結合點,比如銷售渠道,所以還比較踏實。”祝銘明表示。

若論生態,娛樂方面,Rokid已經覆蓋了國內主流視頻平臺,可以玩steam上的遊戲,圍繞手勢操作也已經有釣魚、飛鏢、籃球等應用。辦公方面,阿里雲的無影雲電腦爲適配3D生態特別定製了空間大屏。

“引領者”的另一面藏在發佈會外面的體驗區。很少看到科技公司的發佈會,到處是孩子的身影。他們和大人一樣,樂此不疲地體驗着新款產品,甚至比父母們更快上手。

也許站在未來某個時點回望,他們和Dan、祝銘明的孩子一樣,就是AR的原住民。一副小小的眼鏡改變了他們認識世界的方式。

如果將格局放大一點,這個引領者的角色其實早就不僅僅屬於Rokid。

在去年10月和浙大學弟學妹的分享中,祝銘明特別強調了:“目前,據我所知國際上XR領域裡,70%的頂級專家來自中國,而這其中大部分來自浙大。所以希望同學們對祖國要有信心、對自己要有信心。”

“其實,包括中國在內的東亞國家,對科技產品本身就比較熱情高,歐美反而更理性看待,相對保守很多。”一直以來,祝銘明認爲,以AR爲代表的XR領域,中國有機會超過歐美各國。

而他特別提到母校浙大,也不是一種客套。1997年,祝銘明在浙大網絡與媒體實驗室求學時,直接參與了“敦煌數字復原”項目的第一代開發,這也爲後來Rokid主攻博物館場景埋下了伏筆。

更何況,浙大系是國內AR眼鏡創業版圖最大的一股勢力。

當然,這些年政府主導的產業投資基金也在扮演引領者的角色。對Rokid來說,是餘杭國投、餘江工投。

當政府和產業表現出對新技術的極度渴求,這是科技創業者的福音。

文|樑應傑