①AI可定制不一樣祝福語(yǔ)且“細(xì)心”附上對(duì)方名字,無(wú)需手動(dòng)操作便完成發(fā)送; ②智譜、OpenAI上線(xiàn)AI智能體新產(chǎn)品,最大的獨(dú)特之處在于具備獨(dú)立思考、調(diào)用工具的能力; ③隨著AI Agent不斷普及,機(jī)構(gòu)看好推理算力和軟件市場(chǎng)。
《科創(chuàng)板日?qǐng)?bào)》1月24日訊(編輯 宋子喬) 春節(jié)將至,年味兒漸濃,AI給出了拜年新思路,讓AI智能體(AI Agent)送上春節(jié)祝福,一句話(huà)就能實(shí)現(xiàn)——
據(jù)自媒體測(cè)試,給AI下達(dá)“給群里所有人發(fā)送新春祝福語(yǔ)”的任務(wù)后,AI為該微信群的各位定制了不一樣賀詞,且“細(xì)心”附上了對(duì)方名字,無(wú)需手動(dòng)操作便完成發(fā)送。
用GLM-PC發(fā)定制化新春祝賀時(shí)GLM-PC的思考過(guò)程
這番操作出自智譜剛上線(xiàn)的電腦智能體GLM-PC。
1月23日,智譜正式上線(xiàn)GLM-PC。據(jù)介紹,GLM-PC是基于智譜多模態(tài)大模型 CogAgent,全球首個(gè)面向公眾、回車(chē)即用的電腦智能體(agent)。它能像人類(lèi)一樣“觀察”和“操作”計(jì)算機(jī),協(xié)助用戶(hù)高效完成各類(lèi)電腦任務(wù)。GLM-PC還推出了深度思考模式,并新增邏輯推理和代碼生成功能。
2024年10月,智譜發(fā)布的手機(jī)版智能體AutoGLM火速出圈,跟手機(jī)端的AutoGLM不一樣,GLM-PC引入了代碼機(jī)制,而在深度思考模式下,GLM-PC接收任務(wù)后會(huì)生成一套非常詳細(xì)的思維鏈,再去執(zhí)行,代碼式的思維鏈可進(jìn)一步強(qiáng)化GLM-PC對(duì)復(fù)雜任務(wù)的規(guī)劃、推理、和反思的能力。
目前,GLM-PC的Window和Mac客戶(hù)端已同步上線(xiàn)。智譜表示,正與聯(lián)想、華碩等知名PC 廠商展開(kāi)深度合作探討,共同推動(dòng)AIPC的創(chuàng)新與發(fā)展。
晚些時(shí)候,OpenAI的AI智能體Operator在北京時(shí)間1月24日凌晨亮相,它能夠代理用戶(hù)執(zhí)行基于網(wǎng)頁(yè)的操作,直接與網(wǎng)頁(yè)交互——像人類(lèi)一樣點(diǎn)擊、滾動(dòng)和輸入文字,自動(dòng)執(zhí)行各種復(fù)雜操作,包括編寫(xiě)代碼、預(yù)訂餐廳、購(gòu)物等。后續(xù)的部分用戶(hù)測(cè)試顯示,Operator還可以完成在Arxiv上進(jìn)行論文分類(lèi)搜索,閱讀多篇論文并完成綜述整理的復(fù)雜工作。
用Operator預(yù)定餐廳
用Operator買(mǎi)菜
與智譜的深度思考模式類(lèi)似,Operator可通過(guò)新模型“計(jì)算機(jī)使用智能體”(Computer-Using Agent,簡(jiǎn)稱(chēng)CUA)的系統(tǒng)進(jìn)行復(fù)雜的思維鏈反思和步驟規(guī)劃,CUA結(jié)合了高級(jí)的圖形用戶(hù)界面感知能力與結(jié)構(gòu)化的問(wèn)題解決能力,能夠?qū)⑷蝿?wù)分解為多步驟計(jì)劃,并在遇到挑戰(zhàn)時(shí)自我調(diào)整和糾正,大大提高了Operator完成任務(wù)的精度和復(fù)雜性。
目前,OpenAI的“Operator”智能體以“研究預(yù)覽”(research preview)的形式向美國(guó)的ChatGPT Pro用戶(hù)開(kāi)放。(小K注:ChatGPT Pro的訂閱費(fèi)用為每月200美元,該服務(wù)專(zhuān)為需要高級(jí)AI功能的專(zhuān)業(yè)用戶(hù)設(shè)計(jì),提供無(wú)限制訪問(wèn)包括GPT-4o和o1在內(nèi)的高級(jí)模型)
OpenAI表示還將擴(kuò)展智能體的動(dòng)作空間,在接下來(lái)幾周/幾個(gè)月內(nèi)推出更多的智能體。此外,其還計(jì)劃開(kāi)放API接口,讓開(kāi)發(fā)者能夠基于CUA構(gòu)建自定義的計(jì)算機(jī)智能體。
2025 智能體元年?
OpenAI總裁Greg Brockman為Operator打call并強(qiáng)調(diào),“2025年是智能體之年”。
OpenAI曾被曝出內(nèi)部AGI路線(xiàn)圖,將這一終極目標(biāo)的實(shí)現(xiàn)劃分了五級(jí)。目前OpenAI正向AI智能體,即L3級(jí)邁進(jìn)(代理者,可以采取行動(dòng)的系統(tǒng))。
2024年,智譜同樣將AGI的實(shí)現(xiàn)劃分了5級(jí)。智譜CEO張鵬在Agent Open Day上再次闡述了公司對(duì)AI能力演進(jìn)的戰(zhàn)略構(gòu)想——截至目前,LLM已經(jīng)初步具備了人類(lèi)與現(xiàn)實(shí)物理世界互動(dòng)的部分能力,智能體將會(huì)極大地提升L3使用工具能力,同時(shí)開(kāi)啟對(duì)L4自我學(xué)習(xí)能力的探索。
無(wú)論是智譜還是OpenAI,其智能體最大的獨(dú)特之處在于具備獨(dú)立思考、調(diào)用工具的能力。對(duì)于普通用戶(hù)而言,其最核心的功能是AI自主操作硬件設(shè)備,輔助完成復(fù)雜推理任務(wù)。
手機(jī)上的智能體能夠精準(zhǔn)操控各類(lèi)應(yīng)用,實(shí)現(xiàn)跨場(chǎng)景智能交互;電腦端的智能體被訓(xùn)練用于與圖形用戶(hù)界面GUI(在屏幕上看到的按鈕、菜單和文本框)進(jìn)行交互,意味AI能適應(yīng)幾乎所有的計(jì)算機(jī)環(huán)境,進(jìn)一步凸顯了AI玩轉(zhuǎn)各類(lèi)操作系統(tǒng)的能力。
另?yè)?jù)《科創(chuàng)板日?qǐng)?bào)》不完全梳理,谷歌、微軟、Anthropic在內(nèi)的頭部廠商正爭(zhēng)先推出AI智能體產(chǎn)品——
微軟在其Dynamics365平臺(tái)一口氣推出10個(gè)自主AI智能體,稱(chēng)相當(dāng)于187名全職員工的產(chǎn)出;
谷歌發(fā)布號(hào)稱(chēng)“智能體時(shí)代”最強(qiáng)大模型Gemini 2,提供多模態(tài)開(kāi)發(fā)接口,讓智能體能“看懂”物理世界;
Anthropic為大模型Claude迭代了新功能——Computer Use,讓AI可以像人一樣操控電腦。Claude3.5 Sonnet是首個(gè)支持計(jì)算機(jī)控制的模型,能夠模擬人類(lèi)操作計(jì)算機(jī),包括移動(dòng)光標(biāo)、點(diǎn)擊按鈕和輸入文本;
華為公布了一項(xiàng)可讓AI像人類(lèi)一樣操作手機(jī)的新研究成果,相關(guān)團(tuán)隊(duì)提出了一個(gè)手機(jī)控制架構(gòu):Lightweight Multi-modal App Control(輕量級(jí)多模態(tài)應(yīng)用控制,簡(jiǎn)稱(chēng)LiMAC)。
華創(chuàng)證券表示,隨著AI技術(shù)的不斷進(jìn)步,AI Agent已經(jīng)不再局限于簡(jiǎn)單的任務(wù)執(zhí)行,當(dāng)前正逐步實(shí)現(xiàn)從0到1的跨越式創(chuàng)新。眾多企業(yè)和研究機(jī)構(gòu)投入研發(fā),推出創(chuàng)新產(chǎn)品。行業(yè)結(jié)構(gòu)初步形成,相關(guān)產(chǎn)業(yè)鏈和生態(tài)系統(tǒng)逐漸完善。根據(jù)Root analysis,預(yù)計(jì)全球AI代理市場(chǎng)規(guī)模將從2024年的52.9億美元增長(zhǎng)到2035年的2168億美元,2024-2035年預(yù)測(cè)期內(nèi)的復(fù)合年增長(zhǎng)率為40.15%。
天風(fēng)證券表示,展望2025年,AI Agent和推理需求的指數(shù)級(jí)增長(zhǎng)有望引領(lǐng)規(guī)模化AI應(yīng)用元年,持續(xù)推動(dòng)軟件產(chǎn)品能力邊界的拓展,賦能企業(yè)實(shí)現(xiàn)更高效的運(yùn)營(yíng)和成本優(yōu)化。以字節(jié)跳動(dòng)為代表的企業(yè)通過(guò)豆包AI等核心產(chǎn)品的廣泛應(yīng)用,率先全面布局AI市場(chǎng),顯著提升推理能力和多場(chǎng)景適配性,為國(guó)內(nèi)AI Agent技術(shù)實(shí)踐提供了落地基礎(chǔ)。結(jié)合大模型與AI Agent未來(lái)的技術(shù)進(jìn)步,智能化應(yīng)用場(chǎng)景加速拓展,助力企業(yè)級(jí)市場(chǎng)實(shí)現(xiàn)降本增效。這一現(xiàn)象將引領(lǐng)ToB SaaS行業(yè)迎來(lái)新一輪成長(zhǎng)機(jī)遇,為中國(guó)軟件行業(yè)在未來(lái)五年孕育出一批高成長(zhǎng)型紅利企業(yè)奠定基礎(chǔ)。
中國(guó)銀河證券表示,AI Agent將是通往通用人工智能時(shí)代的必經(jīng)之路,大模型快速迭代升級(jí)推動(dòng)AI Agent能力提升,長(zhǎng)期來(lái)看AI Agent關(guān)鍵在于推理能力,未來(lái)AI Agent廣泛滲透時(shí),對(duì)于推理算力的需求將是指數(shù)級(jí)爆發(fā)增長(zhǎng)。