&

2025年02月06日 15:44:33

李飛飛團(tuán)隊(duì)訓(xùn)練出媲美DeepSeek R1的推理模型云計(jì)算費(fèi)用不到50美元

《科創(chuàng)板日?qǐng)?bào)》6日訊，李飛飛等斯坦福大學(xué)和華盛頓大學(xué)研究人員近日以不到50美元的云計(jì)算費(fèi)用訓(xùn)練了一個(gè)名叫s1的人工智能推理模型。該模型在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn)與OpenAI的o1和DeepSeek的R1等尖端推理模型類似。
研究人員表示，s1使用通過蒸餾法由Gemini Thinking Experimental模型提煉出來的1000個(gè)樣本小型數(shù)據(jù)集，對(duì)Qwen2.5-32B-Instruct模型進(jìn)行監(jiān)督微調(diào)。使用16個(gè)英偉達(dá)H100 GPU進(jìn)行了26分鐘的訓(xùn)練。
小K注：“不到50美元”僅為云計(jì)算服務(wù)費(fèi)用，不包括服務(wù)器、顯卡等硬件投入費(fèi)用，因這部分已經(jīng)由云廠商承擔(dān)。 (TechCrunch)

閱63.65W

我要評(píng)論

反饋意見