2025年01月29日 16:30:43
DeepSeek引發(fā)資本市場對算力增長展望的擔(dān)憂 華泰證券分析
財聯(lián)社1月29日電,華泰證券研報稱,DeepSeek發(fā)布R1模型及相關(guān)應(yīng)用,以較低的訓(xùn)練成本達到與現(xiàn)有前沿模型相當(dāng)?shù)男Ч?,引發(fā)市場對算力投資的擔(dān)憂。華泰證券認(rèn)為:1)DeepSeek主要創(chuàng)新是通過在預(yù)訓(xùn)練階段加入強化學(xué)習(xí),DeepSeek V3訓(xùn)練成本相當(dāng)于Llama3系列的7%,對當(dāng)前世代AI大模型的降本做出了重要貢獻,有望降低現(xiàn)有模型的訓(xùn)練和推理成本;2)目前北美四大AI公司主要通過擴大GPU集群規(guī)模的方式探索下一代大模型,DeepSeek的方式是否在下一代模型研發(fā)中有效還有待觀察。3)DeepSeek這次的成功顯示,在Scaling Law放緩的大背景下,中美在大模型技術(shù)上的差距有望縮小。
我要評論
反饋意見
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論