忘忧草视频在线观看_中文字幕无码日韩专区免费_这里有精品综合久久_自偷自拍亚洲首页av

超越ChatGPT登頂 Deepseek被“擠”到宕機(jī)!或?qū)⑼苿?dòng)AI應(yīng)用爆發(fā)
原創(chuàng)
2025-01-27 22:59 星期一
科創(chuàng)板日?qǐng)?bào)記者 黃心怡
①正如大家沒(méi)法猜到,做游戲顯卡的英偉達(dá),最后會(huì)成為AI界最重要的公司。大家也沒(méi)法猜到,中國(guó)AI大模型的希望,可能就在炒股公司身上。
②除了降低AI大模型的硬件門檻和能源消耗,DeepSeek的成功,更重要的是為AI未來(lái)的應(yīng)用落地鋪平了道路。

《科創(chuàng)板日?qǐng)?bào)》1月27日訊(記者 黃心怡)“正如大家沒(méi)法猜到,做游戲顯卡的英偉達(dá),最后會(huì)成為AI界最重要的公司。大家也沒(méi)法猜到,中國(guó)AI大模型的希望,可能就在炒股的公司身上?!币幻鹑诳萍紭I(yè)內(nèi)人士表示。

今日,國(guó)內(nèi)AI初創(chuàng)公司DeepSeek出現(xiàn)了短時(shí)閃崩現(xiàn)象。據(jù)DeepSeek回應(yīng),其服務(wù)再次“宕機(jī)”,源自新模型發(fā)布后,用戶訪問(wèn)量激增所致。

這家由知名私募巨頭幻方量化于2023年4月創(chuàng)立的大模型公司,近日正式發(fā)布推理大模型DeepSeek-R1。在國(guó)外大模型排名Arena上,DeepSeek-R1基準(zhǔn)測(cè)試已經(jīng)升至全類別大模型第三,其中在風(fēng)格控制類模型(StyleCtrl)分類中與OpenAI o1并列第一。

1月27日,DeepSeek應(yīng)用登頂蘋果美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,超越了ChatGPT。同日,蘋果中國(guó)區(qū)應(yīng)用商店免費(fèi)榜顯示,DeepSeek成為中國(guó)區(qū)第一。

“DeepSeek AI已經(jīng)能思考了,這是質(zhì)的飛躍。以前的模型在思考/推理方面不夠穩(wěn)定可靠,武漢大學(xué)計(jì)算機(jī)學(xué)院教授、中國(guó)人工智能學(xué)會(huì)心智計(jì)算專委會(huì)副主任委員蔡恒進(jìn)如此評(píng)價(jià)DeepSeek。

在DeepSeek引發(fā)業(yè)內(nèi)震動(dòng)的同時(shí),以科技股為主的納斯達(dá)克100指數(shù)期貨跌幅達(dá)3%,原因是市場(chǎng)擔(dān)憂DeepSeek的AI模型可能會(huì)擾亂科技行業(yè)。

市場(chǎng)分析認(rèn)為,DeepSeek R1的成功可能削弱了市場(chǎng)對(duì)英偉達(dá)AI芯片需求的預(yù)期。因?yàn)镈eepSeek似乎以極低的成本構(gòu)建了一個(gè)突破性的人工智能模型,并且無(wú)需使用頂尖芯片。這令人質(zhì)疑對(duì)AI芯片投入數(shù)千億美元支出的實(shí)際效用。

此前有消息稱,DeepSeek僅用2048顆英偉達(dá)H800 GPU和約550萬(wàn)美元,就訓(xùn)練出6710億參數(shù)的開源大模型,是Llama-3405B超6000萬(wàn)美元訓(xùn)練成本的十分之一不到。

不過(guò),《科創(chuàng)板日?qǐng)?bào)》記者了解到,550萬(wàn)美金只是DeepSeek-V3訓(xùn)練成本的一部分。根據(jù)DeepSeek的論文表述,這僅僅包括DeepSeek-V3的正式訓(xùn)練,不包括與架構(gòu)、算法、數(shù)據(jù)相關(guān)的前期研究、消融實(shí)驗(yàn)的成本。而DeepSeek r1的真實(shí)算力成本投入遠(yuǎn)不止600萬(wàn)美元。

多名業(yè)內(nèi)人士認(rèn)為,OpenAI對(duì)大模型的前沿探索與DeepSeek的后發(fā)追趕,所需的算力原本就不是一個(gè)量級(jí)。創(chuàng)新和探索必然伴隨著算力和各項(xiàng)成本的浪費(fèi),在確定性的路徑上優(yōu)化所付出的代價(jià),與探索未知所付出的代價(jià)之間不宜簡(jiǎn)單對(duì)比。

但是,DeepSeek大模型的推出,無(wú)疑展示了模型架構(gòu)在算法和數(shù)據(jù)層面創(chuàng)新的價(jià)值。

曾幾何時(shí),OpenAI的火爆來(lái)自“大力出奇跡”,即算力越大、數(shù)據(jù)越多,就能得到越強(qiáng)的大模型。這種“軍備競(jìng)賽”型開發(fā)模式,帶來(lái)了驚人的能源消耗和訓(xùn)練成本。受大模型訓(xùn)練的高昂成本拖累,OpenAI在2024年的虧損額可能達(dá)到50億美元,預(yù)計(jì)到2026年其虧損將進(jìn)一步攀升至140億美元。

“DeepSeek則帶來(lái)了對(duì)算力/能耗的需求十余倍的降低。”蔡恒進(jìn)強(qiáng)調(diào)。

魔形智能創(chuàng)始人徐凌杰向《科創(chuàng)板日?qǐng)?bào)》介紹,DeepSeek巧妙利用了多種優(yōu)化手段來(lái)降低成本,其中包括采用低精度數(shù)據(jù)格式進(jìn)行訓(xùn)練,復(fù)用和共享參數(shù),以及通過(guò)MoE混合專家的架構(gòu)動(dòng)態(tài)激活部分參數(shù)。

除了降低AI大模型的硬件門檻和能源消耗,DeepSeek的成功,更重要的是為AI未來(lái)的應(yīng)用落地鋪平了道路。

隨著模型性能的逐步穩(wěn)定和應(yīng)用的陸續(xù)落地,未來(lái)算力的推理需求將超過(guò)訓(xùn)練需求。Arm基礎(chǔ)設(shè)施事業(yè)部產(chǎn)品解決方案副總裁Dermot O’Driscoll在接受《科創(chuàng)板日?qǐng)?bào)》采訪時(shí)就曾表示,接下來(lái)將看到更多關(guān)于AI推理領(lǐng)域的更多突破,即AI的實(shí)際應(yīng)用?!斑@些創(chuàng)新將從數(shù)據(jù)中心延伸到邊緣計(jì)算,再進(jìn)一步擴(kuò)展至終端設(shè)備。因此,下一輪創(chuàng)新的重點(diǎn)將從AI訓(xùn)練轉(zhuǎn)向AI推理。這意味著在AI推理領(lǐng)域?qū)⒂瓉?lái)巨大的機(jī)遇?!?/p>

“歷史數(shù)據(jù)表明,10倍成本下降可激發(fā)百倍需求,當(dāng)前模型推理成本已進(jìn)入快速下降通道,或?qū)⑼苿?dòng)AI應(yīng)用爆發(fā)?!毙炝杞鼙硎荆?strong>針對(duì)-V3模型(參數(shù)量6710億),其推理采用創(chuàng)新兩階段架構(gòu):32張H800 GPU并行處理預(yù)填充任務(wù),320張H800集群加速流式解碼。為追求極致性價(jià)比,需將數(shù)百GPU通過(guò)超高速網(wǎng)絡(luò)組成‘超節(jié)點(diǎn)’,這一需求正推動(dòng)智算中心集群化的演進(jìn),加速AI算力基礎(chǔ)設(shè)施升級(jí)?!?/p>

目前,DeepSeek模型的端側(cè)落地已在推進(jìn)中。近日,AMD宣布將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,該模型經(jīng)過(guò)SGLang強(qiáng)化,針對(duì)Al推理進(jìn)行了優(yōu)化。而英特爾中國(guó)區(qū)技術(shù)部總經(jīng)理高宇也表示:Deepseek-R1已經(jīng)在AI PC上跑起來(lái)了!Flowy大模型AI PC應(yīng)用平臺(tái)現(xiàn)已支持在Intel Core Ultra AI PC上運(yùn)行Deepseek-r。

端側(cè)大模型正開始在智能手機(jī)、智能汽車、PC等多種設(shè)備上嶄露頭角。然而,硬件資源限制、模型壓縮等多重挑戰(zhàn)始終困擾著端側(cè)大模型。Deepseek r1端側(cè)大模型的推出,有望為下游應(yīng)用的繁榮帶來(lái)了更大的空間,推動(dòng)更多推理芯片的涌現(xiàn),以及大模型應(yīng)用生態(tài)的發(fā)展。

收藏
166.76W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題
4.64W 人關(guān)注