對戰GPT,Meta開源Code Llama!!!

本文首發微信公衆號:飛總聊IT

Meta自從開放了Llama 2以後,最近又開源了Code Llama。

Code Llama是一個在Llama 2上經過微調得到的專用的編寫代碼的LLM,總共有三個版本,基礎版本,Python版本,以及指令遵循版本。

Meta爲這三個版本都準備了不同的參數量級,分別是7 Billion, 13 Billion和34Billion。

根據Meta的測試,Code Llama和GPT 3.5差不多,按照Meta的說法,這已經是開源世界裡面最牛逼的編程LLM了。

爲什麼要做這件事情呢?因爲Meta開源了Llama 和Llama 2以後,大家發現,儘管在日常的問答上,表現還不錯,但是在編程相關的表現上,這個模型和GPT3.5比起來,實在是有很大的差距。

所以Meta專門又找了一大堆的代碼相關的數據,對這個大模型進行了finetune,也就是微調,這樣一來,它的性能終於能夠和GPT 3.5 差不多了。

當然,Meta表示,這是開源領域最先進的大模型,歡迎大家使用,但是不接受反駁。最後一句話是我瞎說的。

這一屆的程序員是很幸福的,因爲有GitHub Copilot X這樣的產品,寫代碼的時候,AI自動就幫助程序員寫完很多的代碼了。

但是,畢竟GitHub Copilot X這種不是開源的,還收費,在企業內部代碼上用,肯定多多少少都有一些顧慮。

所以從某種程度上來說,Meta這個開源的大模型,起碼是做了一次雷鋒,給很多企業解決了在企業內部代碼上沒有AI幫助程序員們寫代碼的問題。

據說這次的開源LLM可以支持Python,C++,Java,JavaScript等各種語言,支持通過自然語言來生成代碼,也支持給一段代碼,幫助debug。

這些體驗,可謂和GPT很像了。至於其實際效果到底怎麼樣,開源出來還沒被大規模的驗證,效果好不好,還真的不好說。

不過以前開源的Llama 2來看,我就覺得挺有意思的。

因爲微軟選擇了和Meta合作,在Azure的雲上提供Llama 2的服務。

要知道微軟自己是和OpenAI深度合作的,那麼微軟爲什麼又要和Meta合作呢?

我們只能這樣認爲,一方面,微軟和OpenAI的關係,可能也沒有外界想象的那麼好。另外一方面,Meta的開源模型Llama 2,和OpenAI的差距,也沒有那麼誇張。

這樣一來,基於商業利益的考慮,微軟腳踩多隻船,也可以理解了。

但是同樣的,我們也可以判斷,這個Code Llama,估計也是一個和GPT有差距,但是湊合着應該也夠用的產品。

這無疑是開源大模型的勝利。畢竟,開源社區太缺一款能打的能幫助程序員寫代碼的AI大模型了。

這不,缺什麼,就送什麼,Meta果然是大模型界的活雷鋒,不愧是做開源做得風生水起的公司。只是不知道,將來Meta要怎麼樣從這筆生意裡面賺到錢呢?

文章最後再安利一下我的星球,星球聚焦ChatGPT和大語言模型的發展和應用,歡迎有興趣的人加入一起討論大語言模型的技術和商業相關的知識。