天哪!!Databricks竟然這樣。。。

本文首發微信公衆號:飛總聊IT

昨天Snowflake剛開完會,CEO和黃仁勳互相一起聊天,黃仁勳說,我會保證給你要的GPU的。

今天早上美國股市一開盤,Snowflake一直猛漲。

結果,沒過多久,就開始從高點一路往下跌。

原來Databricks的Data+AI的keynote開始了。

爲什麼Databricks一開會,Snowflake就開跌呢?

Databricks開場先出王炸,搞了一個LakehouseIQ的東西,也就是Databricks基於自己的數據庫創建的大語言模型。

我們還記得吧,前兩天Databricks。

這家被收購的公司,就是幫助企業用自己的數據從頭訓練自己的大語言模型的創業公司。

估計Databricks是最近才收購,但是早就開始訓練自己的大語言模型了。

Databricks展示了自己的LakehouseIQ的各種整合,其中有個例子,用英語問歐洲的銷售情況。

但是公司並沒有歐洲這個分類,只有東歐西歐兩個分類。LakehouseIQ很快就給出了正確的SQL。

當然LakehouseIQ能幹的東西很多。起碼demo看起來很牛逼。

這就比Snowflake那邊和黃仁勳討論顯卡要幾塊,能不能發貨高級多了。

後面Databricks又起飛地展示了怎麼樣用LakehouseIQ去debug。以及怎麼樣用MosaicML的平臺訓練自己的大模型,花費多少。還有改進後的MLFlow怎麼樣去評估不同的大語言模型之間到底哪個更牛逼等功能。

當然,Databricks還引入了自己的Vector search的東西,也就是說Databricks用自己的Lakehouse搞了個VectorDB,姑且這樣判斷吧。

所以,Snowflake的股價那是伴隨着Databricks的keynote一路往下跌,實在是自己太不行了,Databricks明顯是有備而來。

當然Databricks除了有很多大語言模型的東西以外,還加了不少自己的東西。

其中Delta Lake這個扶不起的阿斗迎來了3.0。這個3.0可以理解成爲大亂燉。什麼意思呢?就是Delta Lake在生成自己的metadata的同時也生成Iceberg和Hudi的。

這樣一來,一張表既可以當成是Delta Lake的表,也可以當做是Iceberg的表,我是你,但你還是你。這聽起來好像確實很牛逼。

不過我個人對這個做法存疑。因爲Iceberg現在有一些功能,比如說merge on read,是Delta Lake沒有的,所以雖然我可以是你,但是其實我只能是那個你的一部分,很多你的功能我並不能真的提供。

我說Delta Lake既然已經錯過了最好的時期了,不如加入Iceberg的社區算了。你好我好大家好,何必玩我是你,但你只是你的遊戲呢?

Databricks還介紹了自己的Unity Catalog的新進展,以及開始展示自己的Data Marketplace和Native APP Store。後者確實是動作慢了一點。

Snowflake有Native APP Store已經很久了,Databricks今天終於推出來了。

不管怎麼樣吧,晚來了也比沒來要強。只不過所有的native APP到底哪家強,這個問題還真的不好說。

我還忽略了一些非常技術的部分。比如說首席架構師和cofounder帶着大家重新溫習數據庫論文,給大家解釋Databricks可以怎麼樣通過機器學習突破極限,做出最牛逼的數據倉庫來等等。

不管怎麼樣吧。評價一下,Databricks在大語言模型上的手腳,真的是很快,這一點不得不刮目相看了。

應該說,除了微軟以外,這是我見到的手腳最快的一家公司了,谷歌都似乎還差了一點。至於做數據庫的公司裡,那更是獨樹一幟。

大語言模型整的快,那現在400多億的估值也就有了繼續吹牛逼的空間了,弄不好Databricks還能夠再漲一波。

這方面不得不說,Snowflake確實是慢了不止一拍。

所以,Databricks牛逼了一把,Snowflake感覺不太好看了。

最後,再宣傳一下飛總的ChatGPT朋友圈。飛總的朋友圈聚焦在大模型的技術和商業上,歡迎志同道合的人一起加入學習研究。