新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)對(duì)著手機(jī)說(shuō)“給老板朋友圈第一條點(diǎn)贊,并寫(xiě)一個(gè)彩虹屁評(píng)論”,然后把它放在一旁,只見(jiàn)手機(jī)屏幕上開(kāi)始“全自動(dòng)”操作,從進(jìn)入微信、找到具體微信聯(lián)系人、點(diǎn)贊再到輸入評(píng)論內(nèi)容并確定,仿佛有一只無(wú)形的手在操作手機(jī)。
圖中執(zhí)行點(diǎn)贊的操作為AI自動(dòng)完成
10月25日,“新AI六小龍”之一的智譜展示了其最新技術(shù)進(jìn)展——AI工具“AutoGLM”的使用手機(jī)能力,只需接收文字/語(yǔ)音指令,它就可以模擬人類(lèi)操作手機(jī)。除了朋友圈點(diǎn)贊、寫(xiě)評(píng)論以外,智譜還展示了電商網(wǎng)購(gòu)、O2O平臺(tái)寫(xiě)五星好評(píng)、外賣(mài)下單、資料檢索篩選、高鐵購(gòu)票等多個(gè)場(chǎng)景,不過(guò)根據(jù)視頻展示的內(nèi)容,在支付時(shí)還需要用戶(hù)的確認(rèn)。
智譜方面表示,理論上,AutoGLM可以完成人類(lèi)在電子設(shè)備上做的任何事,它不受限于簡(jiǎn)單的任務(wù)場(chǎng)景或API調(diào)用,也不需要用戶(hù)手動(dòng)搭建復(fù)雜繁瑣的工作流,操作邏輯與人類(lèi)類(lèi)似。
據(jù)了解,AutoGLM基于智譜自研的“基礎(chǔ)智能體解耦合中間界面”和“自進(jìn)化在線課程強(qiáng)化學(xué)習(xí)框架”。其中的核心技術(shù)WebRL,克服了大模型智能體任務(wù)規(guī)劃和動(dòng)作執(zhí)行存在的能力拮抗、訓(xùn)練任務(wù)和數(shù)據(jù)稀缺、反饋信號(hào)稀少和策略分布漂移等智能體研究和應(yīng)用難題,加之自適應(yīng)學(xué)習(xí)策略,能夠在迭代過(guò)程中不斷改進(jìn)、持續(xù)穩(wěn)定地提高自身性能。就像一個(gè)人,在成長(zhǎng)過(guò)程中,不斷獲取新技能。
此外,智譜今日也發(fā)布了GLM-4-Voice端到端情感語(yǔ)音模型,這避免了傳統(tǒng)的“語(yǔ)音轉(zhuǎn)文字再轉(zhuǎn)語(yǔ)音”級(jí)聯(lián)方案過(guò)程中帶來(lái)的信息損失和誤差積累,也擁有理論上更高的建模上限,相比該公司之前的產(chǎn)品進(jìn)行了升級(jí),并且該模型“發(fā)布即開(kāi)源”,是智譜的首個(gè)開(kāi)源端到端多模態(tài)模型。
目前,AutoGLM Web已經(jīng)通過(guò)智譜清言插件對(duì)外發(fā)布,可以根據(jù)用戶(hù)指令在網(wǎng)站上自動(dòng)完成高級(jí)檢索、總結(jié)與內(nèi)容生成。手機(jī)端AutoGLM現(xiàn)已開(kāi)啟內(nèi)測(cè),暫時(shí)僅支持安卓系統(tǒng)。GLM-4-Voice也已經(jīng)部署在清言App上。
校對(duì) 穆祥桐