![logo](https://cdnjs.cls.cn/www/20200601/image/telegraph-logo.png)
李飛飛團(tuán)隊(duì)訓(xùn)練出媲美DeepSeek R1的推理模型 云計(jì)算費(fèi)用不到50美元
《科創(chuàng)板日?qǐng)?bào)》6日訊,李飛飛等斯坦福大學(xué)和華盛頓大學(xué)研究人員近日以不到50美元的云計(jì)算費(fèi)用訓(xùn)練了一個(gè)名叫s1的人工智能推理模型。該模型在數(shù)學(xué)和編碼能力測(cè)試中的表現(xiàn)與OpenAI的o1和DeepSeek的R1等尖端推理模型類似。
研究人員表示,s1使用通過蒸餾法由Gemini Thinking Experimental模型提煉出來的1000個(gè)樣本小型數(shù)據(jù)集,對(duì)Qwen2.5-32B-Instruct模型進(jìn)行監(jiān)督微調(diào)。使用16個(gè)英偉達(dá)H100 GPU進(jìn)行了26分鐘的訓(xùn)練。
小K注:“不到50美元”僅為云計(jì)算服務(wù)費(fèi)用,不包括服務(wù)器、顯卡等硬件投入費(fèi)用,因這部分已經(jīng)由云廠商承擔(dān)。 (TechCrunch)
研究人員表示,s1使用通過蒸餾法由Gemini Thinking Experimental模型提煉出來的1000個(gè)樣本小型數(shù)據(jù)集,對(duì)Qwen2.5-32B-Instruct模型進(jìn)行監(jiān)督微調(diào)。使用16個(gè)英偉達(dá)H100 GPU進(jìn)行了26分鐘的訓(xùn)練。
小K注:“不到50美元”僅為云計(jì)算服務(wù)費(fèi)用,不包括服務(wù)器、顯卡等硬件投入費(fèi)用,因這部分已經(jīng)由云廠商承擔(dān)。 (TechCrunch)
我要評(píng)論
反饋意見 ![arrow](https://cdnjs.cls.cn/www/20200601/image/right-arrow.png)
![arrow](https://cdnjs.cls.cn/www/20200601/image/right-arrow.png)
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
關(guān)聯(lián)話題
4.68W 人關(guān)注
+ 關(guān)注
2.04W 人關(guān)注
+ 關(guān)注