①DeepSeek在美區(qū)蘋果App Store免費榜升至第六位,超越Google Gemini等; ②DeepSeek出現(xiàn)短時閃崩現(xiàn)象,回應(yīng)稱可能是新模型發(fā)布后用戶訪問量激增導(dǎo)致; ③DeepSeek推出開源模型DeepSeek-V3和R1推理模型。
據(jù)新浪財經(jīng)報道,截至北京時間1月26日15:45,DeepSeek在美區(qū)蘋果App Store免費榜升至第六位,超越Google Gemini、Microsoft Copilot等美國科技公司的生成式AI產(chǎn)品。
同在今日,DeepSeek出現(xiàn)了短時閃崩現(xiàn)象。不少網(wǎng)友反映,使用時遇到 “服務(wù)器繁忙” 的提示。
對此,DeepSeek回應(yīng)稱,當(dāng)天下午確實出現(xiàn)了局部服務(wù)波動,但問題在數(shù)分鐘內(nèi)就得到了解決。此次事件可能是由于新模型發(fā)布后,用戶訪問量激增,服務(wù)器一時無法滿足大量用戶的并發(fā)需求。不過,官方狀態(tài)頁并未將這一事件標(biāo)記為事故。
界面新聞了解到,此前DeepSeek在美區(qū)榜單的排名并無特別突出表現(xiàn),處于穩(wěn)步上升階段,但未進(jìn)入前十。此次突然躥升,與其近期一系列突出表現(xiàn)有直接關(guān)系。
去年年底,DeepSeek推出開源模型DeepSeek-V3。當(dāng)時,聊天機器人競技場(Chatbot Arena)數(shù)據(jù)顯示,DeepSeek-V3在所有模型中排名第七,在開源模型中排第一,是全球前十中性價比最高的模型。
DeepSeek-V3大模型的核心技術(shù)創(chuàng)新是其迅速崛起的關(guān)鍵。該模型融合了Multi-head Latent Attention(MLA)、混合專家架構(gòu)(MoE)和FP8低精度訓(xùn)練三項技術(shù),顯著提升了性能與效率。
而在本月20日,DeepSeek又正式開源R1推理模型。1月24日,DeepSeek-R1在Chatbot Arena綜合榜單上排名第三,與OpenAI的頂尖推理模型o1并列。在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)性極強的領(lǐng)域,DeepSeek-R1拔得頭籌;在風(fēng)格控制以及高難度提示詞與風(fēng)格控制結(jié)合的測試中,DeepSeek-R1均與o1 并列第一。
此外,Artificial-Analysis的初始基準(zhǔn)測試結(jié)果顯示,DeepSeek-R1在AI分析質(zhì)量指數(shù)中取得第二高分,但價格卻是o1的約三十分之一。
DeepSeek以“低成本訓(xùn)練”和“高性價比”為核心賣點,其API輸入價格僅為每百萬Token 0.1元人民幣,遠(yuǎn)低于Claude 3.5 Sonnet(3美元/百萬Token),吸引了不少中小開發(fā)者和企業(yè)。這種低成本訓(xùn)練策略也讓該公司有了“AI界拼多多”的稱號,甚至引發(fā)了間接沖擊英偉達(dá)等硬件廠商的討論。界面新聞稍早前曾報道,360公司創(chuàng)始人周鴻祎認(rèn)為,DeepSeek在對抗美國AI技術(shù)霸權(quán)的 “中國大模型技術(shù)復(fù)仇者聯(lián)盟戰(zhàn)隊” 中,DeepSeek必定占有一席之地。他還特別指出,由于DeepSeek及其創(chuàng)始人非常低調(diào),其技術(shù)能力和未來前景被市場嚴(yán)重低估。
DeepSeek即為杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月。公司由知名量化資管巨頭幻方量化創(chuàng)立。如今,DeepSeek的種種表現(xiàn),已讓包括Meta在內(nèi)的硅谷科技巨頭感受到了壓力。