☰

幻方量化旗下DeepSeek發佈開源模型，超越阿里Qwen、Meta Llama

藍鯨新聞12月27日訊 12月26日晚，AI公司深度求索（DeepSeek）正式上線全新系列模型DeepSeek-V3首個版本並同步開源。該模型在多項評測集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他開源模型，並逼近GPT-4o、Claude-3.5-Sonnet等頂尖閉源模型。據官方技術論文披露，v3模型的總訓練成本爲557.6萬美元，GPT-4o等模型的訓練成本約爲1億美元。DeepSeek-V3定價爲每百萬輸入tokens 0.5元（緩存命中）/2元（緩存未命中），每百萬輸出tokens 8元，並享有45天的優惠價格體驗期。今年5月，DeepSeek是率先發起國內大模型價格戰的公司之一。（藍鯨新聞朱儁熹）

相關資訊

▣ 幻方量化旗下DeepSeek發佈第二代MoE模型
▣ 幻方量化旗下模型DeepSeek上線V3版本
▣ Meta發佈LLAMA 3.1開源人工智能模型
▣ Meta發佈LLAMA 3.1 405B開源人工智能模型
▣ 谷歌發佈Gemma 2輕量級模型，以牽制Meta的開源模型Llama 3
Meta發佈大模型Llama 3
▣ 開源大模型分水嶺：Meta發佈Llama 3 對標GPT-4
▣ Meta震撼發佈Llama 3，一夜重回開源大模型鐵王座
Meta繼續押寶開源大模型 Llama 3拿下“賽點”？
▣ Meta宣佈基於Llama 3.1模型發佈Al Studio
▣ 百川智能發佈2代開源大模型，王小川：已超越LLaMA 2
▣ Meta發佈Llama 3.1開源大模型系列，扎克伯格：開源人工是前進之路
▣ 阿里發佈開源多模態模型Qwen2-VL，多項性能超越GPT-4o
▣ Meta發佈Llama 3，高管：最智能開源大模型，最強版還在路上
▣ AI週報｜Meta發佈最強開源模型Llama 3.1；OpenAI測試AI搜索功能
▣ 聯發科宣佈運用Meta大模型Llama 2
▣ 阿里雲發佈開源模型Qwen2
▣ Meta(META.US)發佈Llama 3.2輕量級AI模型適用於移動設備
▣ Meta Platforms發佈了多模態LLAMA 3.2人工智能模型
▣ 外媒：Meta發佈最新人工智能模型Llama 3
▣ 什麼是開源AI？官方定義終於來了 Meta Llama模型沒過關
▣ 對標 GPT-4，消息稱 Meta 最快下週發佈兩款 Llama 3 模型
大型自然語言模型Llama下載量累積近3.5億次 Meta強調得益於開源的力量
▣ 阿里國際發佈最新開源多模態模型Ovis
▣ 最強開源大模型！Llama 3下週見？
▣ Meta 發佈多模態 Llama 3.2 ，意義非凡
▣ 開源模型Llama3發佈，原來Meta纔是真OpenAI？
▣ 開源且能力比肩o1！阿里、幻方相繼發佈重磅新品，推理大模型直逼OpenAI
▣ 吳泳銘：阿里發佈超100個開源模型，超30萬家企業接入通義大模型

DMCA | PRIVACY | s@bg3.co