&

2025年01月29日 16:30:43

DeepSeek引發(fā)資本市場對算力增長展望的擔(dān)憂華泰證券分析

財聯(lián)社1月29日電，華泰證券研報稱，DeepSeek發(fā)布R1模型及相關(guān)應(yīng)用，以較低的訓(xùn)練成本達到與現(xiàn)有前沿模型相當(dāng)?shù)男Ч?，引發(fā)市場對算力投資的擔(dān)憂。華泰證券認(rèn)為：1）DeepSeek主要創(chuàng)新是通過在預(yù)訓(xùn)練階段加入強化學(xué)習(xí)，DeepSeek V3訓(xùn)練成本相當(dāng)于Llama3系列的7%，對當(dāng)前世代AI大模型的降本做出了重要貢獻，有望降低現(xiàn)有模型的訓(xùn)練和推理成本；2）目前北美四大AI公司主要通過擴大GPU集群規(guī)模的方式探索下一代大模型，DeepSeek的方式是否在下一代模型研發(fā)中有效還有待觀察。3）DeepSeek這次的成功顯示，在Scaling Law放緩的大背景下，中美在大模型技術(shù)上的差距有望縮小。

閱371.26W

我要評論

反饋意見