幻方量化旗下DeepSeek發佈開源模型,超越阿里Qwen、Meta Llama
藍鯨新聞12月27日訊 12月26日晚,AI公司深度求索(DeepSeek)正式上線全新系列模型DeepSeek-V3首個版本並同步開源。該模型在多項評測集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他開源模型,並逼近GPT-4o、Claude-3.5-Sonnet等頂尖閉源模型。據官方技術論文披露,v3模型的總訓練成本爲557.6萬美元,GPT-4o等模型的訓練成本約爲1億美元。DeepSeek-V3定價爲每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元,並享有45天的優惠價格體驗期。今年5月,DeepSeek是率先發起國內大模型價格戰的公司之一。(藍鯨新聞 朱儁熹)