企業競爭力-養數據 阿里巴巴先發制人利器

養數據 阿里巴巴先發制人利器

若要收集公司沒有的數據,通常需要花費更多精力和技巧。例如,個性化手機購物應用程式,會根據使用者的偏好推薦商品。圖/路透

阿里巴巴集團價值最高的不是淘寶,不是天貓,也不是支付寶,而是阿里平臺上所產生的大量數據。進入行動網路、資訊碎片化時代,解讀數據、從數據找商機、提煉價值的能力,決定了企業競爭力。

在阿里巴巴,面試數據分析師時,一定會問他們一個問題:「假如我是一家知名電子商務的CEO,今天是星期一早上9點,請你提供我3項數據指標,向我證明,在過去的一週企業營運一切正常,讓我踏實。你認爲,會是哪3項指標?」

絕大多數面試者對這個問題的回答比較一致:一是流量、二是交易量、三是其他,包括轉換率、交易額等。當他們這樣回答完後,我會反問:「剛剛我問的問題,你真的聽清楚了?」接着,我會提醒:「我要的數據是給CEO看的,還是頂級電商的CEO,而且時間軸是一週的敏感性數據。」

面試進行到這一環節,會發現大部分面試者根本聽不懂「CEO」的含義。既然是CEO,就意味他是公司最高領導層,給他看的東西顯然要與其他人不同。

絕大多數面試者很少會換位思考,都是從自己的角度思考,而非以一個數據分析師、要給CEO彙報3項數據指標的分析師身分思考問題。

所以,我要再問面試者:「當你坐在面試桌對面給我答案的時候,有沒有想過,在星期一的早上,這家知名電商CEO真正想看的是什麼?」

CEO要的是踏實,聽完後可以安心吃早餐。

也許你會反問:「什麼是踏實的狀況?」

我回答:「最近這家電商和另一家電商在打價格戰,最近又新推出了圖書項目,那麼CEO最關注的是,這些圖書的業務做得好不好。」

你再問:「什麼是好?是否基於每天買書的新增用戶和原有用戶購書的數量?而且,CEO是希望用書吸引新用戶,還是想透過圖書業務的推廣,讓現有用戶進行交叉購買?」

作爲一名數據分析師,如果不把自己的分析與當下結合,便無法進步。有趣的是,當我把這個問題貼在網路上,還是會有很多人追問我答案,CEO關心的到底是哪3項數據。這時我真的很想說,答案不是結果,方法纔是。

從用數據到養數據

過去,有一些問題困擾我:「現在的企業獲取數據如此容易,數據的增長速度如此快,對企業來說,到底要收集什麼樣的數據?收集多少?收集數據的邊界在哪?」

後來,我在美國遇到一位高人,他認爲,過去收集數據很難,現在獲取數據資源卻變得容易,但是如果收集數據的出發點不是爲了解決問題,那麼收集再多的數據也沒意義。

例如,很多電商高階主管會詢問數據分析師,商品的重複購買率是多少。於是,工作人員收集數據計算重複購買率,卻很少想到高階主管需要重複購買率是爲了做什麼決定。重複購買率有不同的定義,而做不同的決策,需要考慮不同定義的重複購買率。

2011年底,我開始思考怎麼從「用數據」轉變爲「養數據」(即從數據化營運轉變爲營運數據),特別煩惱該收集什麼樣的數據。

我曾試圖做出一個特別大且適合多數人使用的數據應用,但來發現,這在數據應用的起步階段幾乎是不可能,因爲要找到可以解決大部分需求的數據應用並不容易;再者,當時公司的數據非常豐富,需要考慮的因素很多,因素之間的聯繫又很複雜。

所以,當開發數據應用時,數據就等於原料;當原料一直處於變化的情況下,做出來的產品很容易產生問題。體會到數據和應用的關係之後,我決定從小角度切入,先把小應用做出來,就是很好的標靶。

「小」指得是應用的目標很具體。許多人在沒有獲取足夠的數據,且缺乏對數據理解的情況下做出決策,其實是在「享受」自己的無知。

譬如:對於一款數據應用,如果目的是分辨兩種決策誰更好以及差異,就是很具體的問題;但如果是想知道如何讓公司獲利,就是一個空泛的目標。

經過一番周折後,按照小角度切入的想法設計數據應用,就可以做得具體而快速,而且可以避免因原料的變化導致數據缺失的問題。

發展數據戰略

「養數據」有一個重要含義,就是要決定收集哪些數據。被動收集數據的行爲是「收集」,主動收集數據的行爲則是「養數據」。

拿某電商婦幼類別爲例,如果收集主體是一家醫院,寶寶的姓名、性別、出生年月和媽媽的姓名等數據的收集,就是收集數據,因爲在住院檔案和出生證明上,這些都是不可少的。但是,如果是婦幼用品品牌要針對家庭行銷,這些資訊顯然不足,寶寶奶粉的品牌、家庭收入、職業等資訊,需要企業主動收集,就是「養」出來的數據。

養數據通常有2類,一是網站自身沒有的數據,需要使用者主動提供;另一類是公司擁有但沒有收集的數據。

若要收集公司沒有的數據,在養數據時,通常需要花費更多的精力和技巧。

例如,現在有很多個性化的手機購物應用程式,會根據使用者的偏好推薦商品,讓每個人都有完全不一樣的購物體驗。

具體的運作原理是,當用戶第一次使用這些應用程式時,介面會彈出一些問題,以互動的方式收集使用者的資訊數據,例如:出幾款衣服,讓用戶挑選喜歡哪一款。在幾個問題之後,應用程式就知道用戶的喜好了。

這類應用通常還有另個特點,讓用戶點「贊」,點讚的功能,是讓用戶明確告訴應用程式自己喜歡什麼,如此一來,用戶就可以在過程中不斷透露自己的偏好,應用程式就可以養出使用者的核心數據。

對於公司有數據但沒有收集的狀況,許多是因爲內部資源協調和公司決策的問題。很多提供餐飲和團購資訊的網站,通常有一個功能是「把資訊透過簡訊發送到手機」,就不需要使用者特別記錄,不過有些網站會記錄使用者的手機號碼,有些網站不會。

這些手機號碼需不需要企業存下來?這是一個與業務決定和資源協調的問題,如果決定記錄,需要開發人員在後臺優化功能。我的想法當然是記錄這些數據,也就是養數據,這不僅能夠檢驗用戶的手機號碼是否有效,還能夠慢慢建立企業與用戶的社交關係。

總之,「用數據」更多的是一種方法論,「養數據」則是一種數據戰略,基於深入業務理解的更高層的次商業決策,數據養得時間愈早,累積的數據愈多。養數據也是一種管理和商業藝術,一旦養成,會產生非常大的商業價值。

(本文摘自天下雜誌出版《大數據的關鍵思考》,作者爲阿里巴巴集團數據技術及產品部副總裁、數據委員會會長)