忘忧草视频在线观看_中文字幕无码日韩专区免费_这里有精品综合久久_自偷自拍亚洲首页av

DeepSeek深夜發(fā)布多模態(tài)大模型 圖像性能跑分力壓OpenAI競(jìng)品
原創(chuàng)
2025-01-28 03:51 星期二
財(cái)聯(lián)社 史正丞
①Janus-Pro是DeepSeek最新升級(jí)的多模態(tài)大模型,不僅能生成圖像,也能對(duì)圖片進(jìn)行描述、識(shí)別圖像中的文字、知名景點(diǎn),并對(duì)圖片內(nèi)容進(jìn)行解讀;
②目前該模型已經(jīng)開(kāi)放下載,70億和15億的參數(shù)量,意味著普通消費(fèi)級(jí)電腦也能跑得動(dòng)。

財(cái)聯(lián)社1月28日訊(編輯 史正丞)就在華爾街周一緊張?jiān)u估“DeepSeek風(fēng)暴”之際,這家中國(guó)公司再度甩出新品:在圖像生成基準(zhǔn)測(cè)試中超越OpenAI“文生圖”模型DALL-E 3的多模態(tài)大模型Janus-Pro,同樣也是開(kāi)源的。

image

除夕凌晨鐘聲敲響前不久,DeepSeek工程師們?cè)凇氨П槨逼脚_(tái)上傳了Janus Pro 7B和1.5B模型。這倆模型是對(duì)去年10月發(fā)布的Janus模型的升級(jí)。

image

(Janus與Janus Pro 7B生成圖像的對(duì)比,來(lái)源:技術(shù)報(bào)告)

15億和70億的參數(shù)量,意味著這兩個(gè)模型具備在消費(fèi)級(jí)電腦上本地運(yùn)行的潛力。與R1一樣,Janus Pro采用MIT許可證,在商用方面沒(méi)有限制。

據(jù)DeepSeek介紹,Janus-Pro是一個(gè)新穎的自回歸框架,統(tǒng)一了多模態(tài)理解和生成。通過(guò)將視覺(jué)編碼分離為“理解”和“生成”兩條路徑,同時(shí)仍采用單一的Transformer架構(gòu)進(jìn)行處理,解決了以往方法的局限性。這種分離不僅緩解了視覺(jué)編碼器在理解和生成中的角色沖突,還提升了框架的靈活性。

image

從報(bào)告給出的“跑分”數(shù)據(jù)來(lái)看,在部分文生圖基準(zhǔn)測(cè)試中,Janus-Pro 70億參數(shù)模型表現(xiàn)好于OpenAI的DALL-E 3、Stability AI的Stable Diffusion 3-Meduim等。

image

(來(lái)源:技術(shù)報(bào)告)

雖然DALL-E 3是OpenAI在2023年發(fā)布的一款“老模型”,同時(shí)Janus Pro目前只能分析和生成規(guī)格較小的圖像(384 x 384)。DeepSeek在如此緊湊的模型尺寸中依然展現(xiàn)了令人印象深刻的性能。

技術(shù)報(bào)告顯示,在視覺(jué)生成方面,Janus-Pro通過(guò)添加7200萬(wàn)張高質(zhì)量合成圖像,使得在統(tǒng)一預(yù)訓(xùn)練階段真實(shí)數(shù)據(jù)與合成數(shù)據(jù)的比例達(dá)到1:1,實(shí)現(xiàn)“更具視覺(jué)吸引力和穩(wěn)定性的圖像輸出”。在多模態(tài)理解的訓(xùn)練數(shù)據(jù)方面,新模型參考了DeepSeek VL2并增加了大約9000萬(wàn)個(gè)樣本。

作為一個(gè)多模態(tài)模型,Janus-Pro不僅可以“文生圖”,同樣也能對(duì)圖片進(jìn)行描述,識(shí)別地標(biāo)景點(diǎn)(例如杭州的西湖),識(shí)別圖像中的文字,并能對(duì)圖片中的知識(shí)(例如下圖中的“貓和老鼠”蛋糕)進(jìn)行介紹。

image image

(來(lái)源:技術(shù)報(bào)告)

公司也在報(bào)告中,給出了更多圖像生成的案例。

image

(來(lái)源:技術(shù)報(bào)告)

收藏
111.76W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話(huà)題
4.64W 人關(guān)注