中國大模型數量佔全球超1/3;AI模型訓練成本暴漲,2027年或達1000億美元;Kimi發佈官方瀏覽器插件丨AI情報局

融資快報

Quantum Rise 獲 1500 萬美元種子資金:Quantum Rise 以所謂的“諮詢 2.0”模式將 AI 部署到公司中,以自動化工作流程、提供路線圖和量身定製的 AI 解決方案,並普遍加速業務發展。本輪由Growth Partners 投資。

Sanctuary AI 完成未公開融資:Sanctuary AI 正在構建具有類人智能的通用機器人。他們的類人機器人 Phoenix 專注於上半身任務,表現出類似人類的運動範圍。這些機器人利用 Sanctuary 的 AI 控制系統 Carbon,增強了在 24 小時內學習和自動執行新任務的能力。領投方:BDC Capital 旗下 Thrive Venture Fund、InBC Investment Corp.

九科信息完成數千萬元B1輪融資:九科信息孵化於招商局內部的創新“RPA+AI”項目,相關產品可以無縫集成到RPA機器人中,實現RPA任務自由調度,爲國央企提供AI智能自動化平臺。由諾輝基金領投,老股東深創投索斯福跟投。

智有範獲A輪融資數千萬元:智有範是一家一站式全屋智能系統研發服務商,專注Al+ loT領域,以前沿科技、打造高調性的全屋智能產品及服務應用於智慧家庭,及智慧小區、智慧辦公、智慧養老等空間系統。此輪融資由主板上市公司產業孵化基金領投。

(歡迎添加微信AIyanxishe2,瞭解更多AIGC、融資情況,與志同道合的朋友一同暢聊時新AI產品)

國內情報:

月之暗面推出 Kimi 智能助手官方瀏覽器插件:

併爲網頁用戶帶來多項新功能。Kimi 插件,目前只有兩個按鈕:一個是點問筆,劃選文字後就會出現;另一個是總結器,出現在網頁右下角,快速總結全文、答疑解惑。

月之暗面楊植麟成阿里雲新代言人,二者“聯姻”,幫Kimi技術突破:

阿里雲官宣兩位新“代言人”——月之暗面科技有限公司創始人楊植麟和智聯招聘集團總裁張月佳,這是月之暗面首次公開與阿里雲的合作情況。信息顯示,阿里雲的算力和大模型服務平臺助力月之暗面提升模型推理效率,加速Kimi智能助手實現技術突破。智聯招聘集團的大模型應用也基於阿里雲實現快速部署和上線支持。

此前 4 月份,阿里雲也曾宣佈過一波重量級「代言人」,包括百川智能創始人王小川、分衆傳媒創始人江南春、高途集團創始人陳向東等。

書⽣·浦語2.5 InternLM2.5-7B模型宣佈開源,支持處理百萬字長文:

InternLM2.5-7B 模型已開源,上海人工智能實驗室承諾提供免費商用授權。該模型在數學評測集 MATH 上準確率達到 60%,與 GPT-4Turbo1106 版本相當,支持高達 1M tokens 的上下文,優化了長文檔理解與智能體交互,具備搜索和整合上百個網頁信息的能力,通過MindSearch多智能體框架,模擬人的思維過程。

快手推出AIGC微短劇《山海奇鏡之劈波斬浪》 由可靈提供技術支持:

該劇以《山海經》爲靈感來源,通過賽博風格復現了上古神話世界中的神怪異獸和奇花異草。微短劇的製作得到了快手視頻生成大模型“可靈”的深度技術支持,從山脈到海洋、從森林到天際的場景都呈現出升級後的視覺效果。

北大千問團隊推出數學專用版CriticGPT,“找茬”讓大模型進步更快:

北大千問團隊推出了專門用於數學問題的 CriticGPT 變體 Math-Minos。該模型通過引入故意設置的錯誤並詳細標註,訓練出能夠進行 debug 的模型,從而提升了模型在數學問題解決方案的驗證能力。研究團隊採用了 GPT-4 生成的逐步自然語言反饋作爲理由標籤,不僅指出瞭解決方案的正誤,還能分析出錯誤的原因。

中國AI大模型數量佔全球超1/3:

根據中國信息通信研究院發佈的《全球數字經濟白皮書》,中國在全球人工智能大模型的佔比已超過1/3,達到36%,僅次於美國的44%。在全球AI企業數量上,中國以15%的佔比緊隨美國之後,位列第二。同時,中國的AI獨角獸企業數量也達到了71家。

中國AI大模型論文數量全球第一,清華力壓麻省理工、斯坦福:

根據美國喬治城大學的數據分析平臺 ETO 最新調查報告,2017—2022 年期間,全球發佈了 125.5 萬篇與 AI 相關的論文,其中中國發布了 24.3 萬篇,佔到了總數的 25%,排名第一。美國位列第二,發佈了 17.1 萬篇論文。ETO 只統計了英文技術論文,如果算上中文論文,中國發布的論文數量將會更多。中國AI論文的被引用次數領先美國,中國科學院排名第一、谷歌排名第二,清華大學排名第三超過了麻省理工、斯坦福、卡內基梅隆等著名大學。

周鴻禕稱2024年是大模型場景之年,To C將出現殺手級應用:

“大模型是風口,不是泡沫。”周鴻禕表示“今年英偉達市值一直狂飆,超越了微軟和蘋果,這就是人類進入人工智能時代的一個標誌。”周鴻禕稱,今年年初的時候,我說24年會是大模型的場景之年,當時很多同行不以爲然,在刷各種參數,但是到了6月份,我覺得整個研究就都轉過來了。“因爲模型不是產品,模型只是能力,你有了人工智能的能力,還要結合具體的需求。”

國際情報:

X 被曝將新增多項 Grok 模型功能支持,含聊天機器人側面板:

獨立應用程序研究者 Nima Owji 表示,X 社交平臺正在開發多項基於 xAI Grok 模型的功能,爲 X Premium 訂閱用戶提供更豐富的使用體驗。其中之一便是類似於其他生成式 AI 聊天機器人的 Grok 側面板,用戶可在使用 X 平臺任意功能時同 Grok 機器人交流。X 還將新增兩項功能:賬戶總結和高亮文本搜索。這幾項功能尚未向公衆開放,新功能旨在提升 X Premium 付費訂閱的吸引力。

ChatGPT無法取代人類程序員! IEEE 35頁論文測出困難編碼正確率僅爲0.66%:

IEEE 在其期刊上發表了一項關於 ChatGPT 代碼生成能力評估的論文,該研究使用 LeetCode 問題庫作爲數據集,揭示了 ChatGPT 生成功能性正確代碼的能力差異很大,成功率從 0.66% 到 89% 不等,受到任務難度和編程語言等多種因素的影響。在對C、C++、Java、JavaScript 和 Python進行測試後,研究人員發現即使在某些情況下 AI 能夠生成優質代碼,但也存在安全性問題。

科幻照進現實?Open-TeleVision支持遠程操控機器人:

加州大學聖地亞哥分校和麻省理工學院的研究員們開發了一款開源遠程操作系統,名爲 Open-Television。該系統支持多種設備,能夠提供實時立體視頻流,用戶可以通過 VR 頭顯隔空操控機器人。其核心理念是模擬人類雙目立體視覺和活動頸部,提升操作的自然性和沉浸感。該系統採用逆運動學算法將 VR 頭顯的 API 映射到機器人身上,實現精確的動作傳遞,基於 Web 平臺,隨時隨地可以通過瀏覽器訪問。此外,該系統還解決了人形機器人和人體自由度不匹配的問題,並通過遙操作方式採集的數據訓練機器人自主完成任務。

項目地址:https://github.com/Improbable-AI/VisionProTeleop

哈佛DeepMind在世界模擬器馴養「賽博老鼠」:

哈佛大學與谷歌 DeepMind 人工智能實驗室合作,開發出了一隻搭載 AI 大腦的“虛擬老鼠”,能夠模擬真實齧齒動物的所有動作,甚至表現出未經明確訓練的新奇行爲。這項研究結果發表在 Nature 期刊上,標誌着虛擬神經科學領域的開創。虛擬老鼠的大腦由人工神經網絡構成,通過在物理模擬器 MuJoCo 中的訓練,能夠準確預測真實老鼠大腦中的神經活動。這一技術不僅有助於理解大腦如何產生複雜動作,還可能用於設計改進的機器人控制系統。

單卡A100實現百萬token推理,速度快10倍:

微軟和薩里大學的研究團隊提出了 MInference 方法,旨在通過動態稀疏注意力機制加速長上下文語言模型的預填充階段。這種方法能夠在不修改預訓練模型和不進行額外微調的情況下,直接應用於現有的 LLM。通過實驗驗證,MInference 能夠顯著降低 A100 上的預填充推理延遲,提升速度至多 10 倍,並在多項任務中保持或提高準確性。

蘋果大模型Siri預計明年1月啓動測試:

古爾曼最新爆料,AI加持的Siri並不會立即隨着iOS18的發佈而到來,蘋果計劃於明年1月啓動測試,並預計在iOS18.4版本中正式推出這一革新性功能,留給用戶近九個月的期待時光。

Anthropic CEO稱AI 模型訓練成本暴漲,2027 年或達 1000 億美元:

Anthropic 首席執行官表示,當前 AI 模型訓練成本高達10億美元,未來三年有可能上升到100億美元甚至1000億美元。在 AI 訓練成本的上升趨勢中,硬件和能源消耗是兩大重要成本支出。英偉達等供應商的 GPU 交付量將呈幾何級增長,而數據中心的電力需求也將急劇增加。此外,人力資源、數據採集和運行維護等方面也將耗費大量成本。如果不解決這些問題,AI 模型的訓練成本有可能在2027年達到1000億美元。

更多國際情報:

新加坡研究團隊製作出可食用的 3D 打印二維碼:這一技術採用了全新設計的擠出系統,能夠在不同食物材料之間進行切換。

反AI圖像盜竊工具Glaze需求量劇增:該工具可以在圖像中添加難以察覺的噪點,以防止 AI 系統模仿風格的工具。據 Glaze 開發者 Ben Zhao 稱,自 Meta 宣佈利用用戶數據進行 AI 訓練計劃後,WebGlaze 的網頁版本的訪問請求積壓巨大。

Meta AI 將在 Android 版 WhatsApp 中增強圖像處理能力:這個新的測試版本將允許用戶直接向 Meta AI 發送照片,並就這些圖片提出問題或使用文字提示來編輯圖像。

日本總務省報告,該國僅 9.1% 的個人使用生成式 AI,遠低於中美英等國:數據顯示,日本個人使用生成式 AI與中國的 56.3%、美國的 46.3%、英國的 39.8% 和德國的 34.6% 存在較大差距。

Product Hunt 熱榜,智能工作流程AI助手MindPal

MindPal作爲一款AI工作流程構建工具,近期在Product Hunt平臺上榮獲當日最佳產品。這款工具提供了豐富的模板和自定義選項,涵蓋從PESTLE分析到品牌標語生成等多個領域,旨在幫助企業高效自動化各種任務。用戶可以根據自身需求快速構建AI工作流程,利用多種數據類型進行訓練,並將AI代理與常用工具無縫連接。

MindPal的核心優勢在於其靈活性和效率提升。它支持多個AI代理協作完成複雜任務,允許用戶選擇最佳AI模型,甚至可以在非工作時間自動運行工作流程。

?https://mindpal.space/?ref=producthunt

GitHub Trending 熱榜,AI生態去中心化網絡GaiaNet

GaiaNet作爲一個創新的去中心化人工智能代理網絡,正在重塑AI推理的未來。該平臺允許個人將閒置硬件貢獻爲GaiaNodes,支持包括Huggingface、Llama、Gemma等在內的2000多種大型語言模型,實現分佈式AI推理。GaiaNet的核心優勢在於其無單點故障、多樣化、審查抗性和強大的隱私保護特性。

通過GaiaNet Protocol和GaiaAPI,該平臺爲開發者和用戶提供了一個開放、安全的AI生態系統。在教育和商業領域,GaiaNet展現出巨大潛力,如個性化AI助教和靈活的AI角色扮演。這一創新平臺不僅爲AI應用開闢了無限可能,還通過其獨特的網絡架構和強大的模型支持,正在推動AI技術向更加去中心化、民主化的方向發展。

?https://www.gaianet.ai/

開發者推薦

1.AI多功能助手Onyxium:集成創新技術提升工作效率

Onyxium作爲一個綜合性AI工具集成平臺,爲個人和企業用戶提供了從圖像識別到文本分析、語音識別等多項功能。該平臺以技術優先、易用性和成本效益爲核心,通過雲服務實現全球覆蓋,並根據用戶行爲提供個性化體驗。Onyxium的工具設計簡單易用,能夠幫助用戶進行對象和模式識別、情感分析、關鍵詞提取等多種任務。

爲滿足不同規模用戶的需求,Onyxium提供多種定價方案,包括面向初創企業的個人計劃和針對大型企業的商業計劃,同時還設有免費試用選項。用戶反饋顯示,Onyxium在提高生產力和創造力方面表現突出,被認爲是一個有價值的效率工具。平臺還通過新聞通訊爲用戶提供最新AI發展信息和獨家資源,並設有FAQ部分以便快速解答常見問題。

?https://onyxium-ai-xi.vercel.app/?ref=producthunt

2.AI漫畫翻譯新選擇:AI Manga Translator助力多語言閱讀

AI Manga Translator作爲一款專業的在線漫畫翻譯工具,正在爲全球漫畫愛好者帶來全新的閱讀體驗。這個平臺利用人工智能技術,包括DeepL和LLM的API,爲用戶提供快速、準確的多語種漫畫翻譯服務,同時保持原始圖像的佈局和結構。支持的語言範圍廣泛,從中文、英文到日語、韓語等多種語言,滿足不同用戶的需求。

?https://aimangatranslator.com/manga-translator/

3.AI驅動個性化播客:PocketPod

PocketPod作爲一款由Y Combinator和ElevenLabs投資的AI播客產品,正在爲用戶帶來全新的音頻內容體驗。這款創新產品允許用戶選擇感興趣的主題,隨後通過AI技術自動從互聯網搜索、聚合、清洗信息並生成個性化播客。PocketPod支持多種應用場景,包括每日新聞和特定主題深入研究,例如關於蘋果技術的專題播客。其核心優勢在於全面的自動化處理,能夠實時將最新信息轉化爲可聽內容,爲用戶提供即時、個性化的音頻資訊服務。

?https://pocketpod.app/

4.Suno AI Prompt Generator:AI輔助音樂創作工具

Suno AI Prompt Generator是一款免費的在線工具,專爲音樂創作者設計。該工具允許用戶通過自定義元標籤和多種音樂風格來生成歌曲和歌詞,提供創意的AI提示以激發靈感。用戶可以探索包括搖滾、流行等在內的多種音樂類型。

?https://sunoprompt.com/zh?ref=therundown

前沿技術

1.AI視頻創新:MOTIA讓視頻拓展無限可能

MOTIA (Mastering Video Outpainting Through Input-Specific Adaptation) 作爲一種新型的視頻外繪製技術,正在revolutionizing視頻內容創作領域。這項由擴散模型驅動的技術能夠智能地在原始視頻視角之外生成高質量、連貫的內容,爲創作者提供了前所未有的創意空間。

MOTIA的核心優勢在於其兩階段處理方法:首先通過輸入特定適應學習源視頻模式,然後利用模式感知外繪製技術擴展視頻邊界。這種創新方法不僅提高了生成質量,還增強了靈活性,無需大量特定任務調整就能在多個基準測試中超越現有最先進的方法。MOTIA爲視頻創作者、電影製作和虛擬現實等領域開啓了新的可能性,標誌着視頻處理技術的重大突破。

?https://be-your-outpainter.github.io

2.BeyondScene: AI突破視覺極限,超高清人物場景生成

BeyondScene作爲一項突破性的AI視覺技術,正在爲高分辨率人物場景生成開闢新天地。這個創新框架克服了現有文本到圖像擴散模型的侷限,能夠生成超過8K分辨率的精美人物場景,同時保持出色的文本-圖像對應性和自然度。

該技術無需昂貴的重新訓練,就能超越預訓練擴散模型的能力,爲高分辨率人物場景創作開啓了新的可能性。BeyondScene在詳細文本描述的對應性和自然度方面均優於現有方法,爲電影製作、虛擬現實和數字藝術等領域帶來了革命性的變革。

?https://github.com/BeyondScene/BeyondScene

3.MInference 1.0:長文本LLM推理的革命性加速器

微軟公司和薩里大學的成員推出MInference 1.0作爲一項突破性技術,正在爲大型語言模型(LLM)的長文本處理帶來顯著提升。這個創新框架通過動態稀疏注意力機制,有效解決了LLM在處理長序列時面臨的計算挑戰,尤其是在預填充階段的效率問題。核心創新點:

-識別並利用長文本注意力矩陣中的三種獨特模式:A形、垂直條紋和塊稀疏。

-離線確定每個注意力頭的最佳模式,並在推理過程中動態構建稀疏索引。

-通過優化的GPU內核執行高效的稀疏注意力計算。

?https://hqjiang.com/minference.html

4.ax-llm/ax:智能代理構建的多功能Typescript庫

ax-llm/ax是一個基於Stanford DSPy論文的創新Typescript庫,爲構建大型語言模型(LLMs)驅動的智能代理提供了強大支持。這個多功能工具包支持多種LLMs和矢量數據庫,提供了一系列高級功能,如流式輸出驗證、多模態DSPy支持和自動提示調優。ax-llm/ax簡化了LLMs的集成和應用,支持自動生成類型安全的提示,允許構建可調用其他代理的代理,並能處理各種格式的文檔。該庫還集成了OpenTelemetry追蹤和觀測功能,以及自動調優提示效率的優化器。開發者可通過npm安裝使用,通過運行示例快速上手,爲AI應用開發提供了一個全面而靈活的解決方案。

?https://axllm.dev/

熱議話題

AI數據中心遭"炸彈"威脅?藝術與科技的對決引發熱議

近日,一則關於"Art tools "的推文意外獲得11.7萬點贊,引發網絡熱議。一幅諷刺漫畫將傳統藝術工具與AI數據中心並列,,將AI數據中心比作一個潛在的"破壞性"工具。暗示AI可能對傳統創作方式產生衝擊,進一步加劇了討論。

這場爭議反映了公衆對AI技術的複雜態度。有人擔憂AI威脅就業和社會秩序,也有人認爲無需過度憂慮。討論涉及AI對藝術創作的影響、財富分配問題,以及如何在科技發展與傳統保護間尋求平衡。這一事件凸顯了在AI快速發展的今天,社會各界需要共同探討AI與人類和諧共存的方式。這場爭議反映了公衆對AI技術的複雜態度。有人擔憂AI威脅就業和社會秩序,也有人認爲無需過度憂慮。討論涉及AI對藝術創作的影響、財富分配問題,以及如何在科技發展與傳統保護間尋求平衡。這一事件凸顯了在AI快速發展的今天,社會各界需要共同探討AI與人類和諧共存的方式。

敬請期待明日的最新動態!

雷峰網