MiniMax閆俊傑:越發理解「科學技術是第一生產力」的含義
MiniMax的大模型日處理交互量排名國內AI公司首位。
本文爲IPO早知道原創
作者|Stone Jin
據IPO早知道消息,在8月31日舉行的首個“MiniMax Link夥伴日”上,MiniMax創始人閆俊傑以“用技術突破回答‘每日與世界的30億次交互’”爲主題作了開場演講。
同時,閆俊傑在本次夥伴日上分享了基於MOE(混合專家模型)+ Linear Attention(線性注意力)的新一代模型技術的應用,並展示了MiniMax最新音樂模型、視頻模型的研發成果。
另據閆俊傑透露,MiniMax每日與全球用戶進行超30億次交互,處理超3萬億文本token、2000萬張圖片和7萬小時語音,大模型日處理交互量排名國內AI公司首位
值得一提的是,在本次夥伴日上,閆俊傑多次強調,其越來越意識到了“科學技術是第一生產力”這句話的含義,這也是MiniMax堅持技術創新的最底層原因。對此,閆俊傑進一步解釋稱,MiniMax一直都覺得技術重要,只是從“覺得技術重要”到“100%認爲技術重要”其實也需要一個過程。
“做技術是一件非常奢侈的事,這件事甚至只有創業的時候纔會理解。”閆俊傑補充道,“首先,做技術可能會失敗;其次,做技術的研發投入很大;第三,當實驗真正成功的時候,就會去想之前的嘗試是不是可以不做,有時候就會想要不要走點‘捷徑’。但從我們的實踐經驗證明,一旦想要‘走捷徑’就會被打臉,這個事也發生好多次了。MiniMax這兩年多的時間也遭遇了好幾個‘至暗時刻’,拋開所有表象東西,我才越來越深刻地意識到‘技術是一家科技公司最核心要素’這件事,這是我們多次‘至暗時刻’裡最共性的一點。”
在閆俊傑看來,當真正突破一些技術後,能夠非常顯著地感受到用戶或者客戶的認可,這是一種強烈的正反饋。“大部分正反饋也會遇到一些‘噪聲’,但經過思考和總結後就會發現,本質還是技術的進步。其實不管是正反饋還是負反饋,到最後會發現底層都是技術,我還是比較慶幸自己一直是一個做技術的人。”
回到產品層面。作爲中國首個研發MoE大語言模型併成功上線的AI企業,MiniMax持續在模型算法上做創新,並最新推出基於MOE+ Linear Attention的新一代模型技術。通過此新型線性模型架構,MiniMax大模型能在單位時間內更加高效地訓練海量數據,極大地提升了模型的實用性和響應速度。
在與GPT-4o同一代模型能力對比上,新一代模型處理10萬token時效率可提升2-3倍,並且隨着長度越長,提升越明顯。相比於通用Transformer架構,新架構的原生線性計算複雜度大幅減少了大模型的訓練和推理成本。在128K的序列長度下,新架構成本減少90%以上。
閆俊傑指出,不管是做MOE還是Linear attention、乃至其他探索,MiniMax最本質的思考邏輯還是如何讓同樣的效果模型變得更快。“快就是好。在兩個性能類似的模型中,訓練和推理更快的那個,可以更有效地利用算力資源迭代更多的數據,從而能夠有一個更好的模型能力。”
此外,MiniMax本次還推出了視頻模型和音樂模型——視頻模型具有壓縮率高、文本響應好和風格多樣等優點,可生成原生高分辨率、高幀率視頻,模型能力首屈一指;而MiniMax第一款音樂模型則可以合成純音樂爲製作人快速構建歌曲的基本結構,由歌手自由演繹主唱或和聲部分,且已實現對粵語、日語、韓語、西班牙語等多語種支持的升級。
目前, MiniMax音樂生成模型與視頻生成模型已經在開放平臺和海螺AI網頁版上線。此外,abab 7系列多模態模型將於未來數週內正式發佈,並採用新一代創新技術
據閆俊傑介紹,MiniMax當前的商業化主要分成兩種形式:對於開放平臺,MiniMax現已有2000多家客戶,包括知名互聯網公司、知名傳統企業等;對於To C產品,MiniMax的產品裡也有廣告機制。閆俊傑表示,在目前的階段,MiniMax最優先考慮的不是商業化,而是真正讓技術到達廣泛可用的程度。
對於星野等C端產品,閆俊傑進一步指出,MiniMax的底層設計是做一個內容社區。“打造AI內容社區這件事在全球範圍內都是比較獨特的,星野在AI內容社區這件事上也做得比較靠前。”
當然,“社區”也是所有互聯網產品中最難做的一個。爲此,要想自己的AI應用取得滲透率和和使用深度上質的提高,閆俊傑認爲最重要的三個優化方向是:如何讓模型的錯誤率持續降低;無限長的輸入和輸出;以及多模態。“這需要一步一步演化,不是一蹴而就的。”
當談及與大廠的競爭時,閆俊傑坦言,MiniMax能做的事情就是儘可能將兩點能力無限放大:其一是如何提升技術,其二則是如何跟用戶更好的共創。“想要和大廠競爭,就需要快速看清一些非常底層的東西。這兩點(技術提升與用戶共創)都需要一些非常關鍵的判斷,也都需要非常長期的積累。”
閆俊傑亦強調,競爭其實並不是一件“壞事”,中國的移動互聯網、手機、新能源汽車等行業都在經歷了長期激烈的競爭後、站在了全球領先的位置上。
“競爭是客觀規律。大模型確實可以產生巨大的社會價值,也確實就應該有很多的競爭。”閆俊傑表示,“希望與各位攜手努力,和MiniMax一起,把人類的智能邊界再向外推動一點,真正實現Intelligence with Everyone。