國內(nèi)人工智能大模型又增一家入局者——第四范式發(fā)布的“式說3.0”。
4月26日,第四范式創(chuàng)始人兼CEO戴文淵現(xiàn)場演示了“式說”的各類能力,新京報貝殼財經(jīng)記者注意到,相比其他大模型,“式說”除了展示文本生成、圖片生成和編寫代碼能力外,還在實機演示中重點展示了AI在B端的各類應用場景,如輸入文字后自動判斷任務,主動向用戶提問,使用戶可以直接用文本執(zhí)行“裝箱”目標的能力。
以此為契機,戴文淵提出了AIGS戰(zhàn)略(AI-Generated SoftwareAI生成軟件):以生成式AI重構(gòu)企業(yè)軟件。他表示“式說”將定位為基于多模態(tài)大模型的新型開發(fā)平臺,提升企業(yè)軟件的體驗和開發(fā)效率,實現(xiàn)AIGS,“C端產(chǎn)品已經(jīng)逼近用戶體驗的上限,而B端的企業(yè)級軟件往往是個十分復雜的執(zhí)行系統(tǒng),堆砌十幾層菜單和成千上萬功能也不算多,目前這些B端軟件極為復雜的交互體驗,以及復雜性帶來的極低開發(fā)效率,恰恰為生成式AI留下足夠大的重構(gòu)和改造空間?!?/p>
“式說”有何能力?寫作、制圖、編程 然后將三者結(jié)合“裝集裝箱”
新京報貝殼財經(jīng)記者在現(xiàn)場看到,第四范式一共準備了數(shù)個場景的演示,包括AI對話、AI群聊總結(jié)、AI生圖、AI預定會議日程以及AI在金融、醫(yī)療、航空等領域的應用等。
“式說”首先展示了日常的文案寫作功能,如生成旅游計劃、編寫研發(fā)大語言模型步驟等。其還展現(xiàn)了連續(xù)對話能力,在編寫劇本的演示中,“式說”首先編寫了一個《流浪地球3》劇本,當戴文淵要求“式說”在此基礎上再寫一個《流浪地球4》劇本,并加入第四范式公司元素時,“式說”同樣完成了要求,“可以讓第四范式科技公司的人工智能應用到電影中,比如讓人工智能成為電影中一個重要角色,幫助救世主人公完成他的使命。”
此外,“式說”還展示了文生圖和寫代碼功能,如“畫一張配色鮮艷的籃球鞋”、“用VBA編寫一個求兩個數(shù)乘積的代碼”。
值得注意的是,第四范式別出心裁地將上述三種能力“融為一體”,現(xiàn)場演示了“式說”執(zhí)行集裝箱“裝箱”任務的流程。在實機演示中,戴文淵下達指令“幫我執(zhí)行一個裝箱任務”,之后“式說”在交互界面中展現(xiàn)了其“思考”過程,表示“我認為這是一個裝箱任務”,給出了“任務目標”,并主動要求戴文淵輸入集裝箱尺寸、數(shù)量和其他約束條件,最后生成了裝箱演示的動圖,耗時1分鐘左右,耗時無疑快于人工手動撰寫方案。
“過去很難通過人類語言(自然語言)的方式去調(diào)用企業(yè)軟件的功能,現(xiàn)在當我們有更強的語義理解和生成能力,再加上GPT任務翻譯、任務分發(fā)和推理的能力,就可以通過更好的對話框式交互方式實現(xiàn)功能的調(diào)用,不再需要找到某個位于十幾級的菜單目錄之下的功能?!贝魑臏Y說。
此外,針對B端的應用場景,第四范式還展示了“式說”對圖片的理解能力,如輸入圖片后令其“找相同”等。
在戴文淵看來,要做到AIGS,大模型未必需要是知識廣博、十項全能冠軍的通才,更重要的在于模型具備Copilot(副駕艙),和思維鏈CoT(chain of thoughts,多步推理)的能力。
貝殼財經(jīng)記者了解到,實際上“式說”在2.0階段就加入了多模態(tài)和Copilot,這是因為很多企業(yè)軟件里的數(shù)據(jù)是多模態(tài)的,而Copilot能把人的指令翻譯成要調(diào)用后臺的哪個API。此前發(fā)布的“式說”2.0的Demo中,門店員工通過語音、文本等交互方式向“式說”發(fā)起指令,“式說”理解后,聯(lián)網(wǎng)門店監(jiān)控軟件調(diào)出后廚未戴口罩的圖片,并直接將圖片以對話框的形式輸出給員工。
戴文淵表示,大模型去調(diào)用軟件內(nèi)置的一個個功能、數(shù)據(jù)來對話框式完成任務,已經(jīng)能產(chǎn)生巨大價值。但員工用企業(yè)軟件時也會面臨復雜任務,需要人按照順序執(zhí)行一個個功能。因此,“式說”3.0強調(diào)的是Copilot加上思維鏈CoT,具有更強的推理能力,在學習大量數(shù)據(jù)和“攻略”后,能形成中間的邏輯推理步驟,從而做到拆分并執(zhí)行復雜工作。
入局大模型如何選擇發(fā)展方向?第四范式AI要走“AIGS戰(zhàn)略”
第四范式方面對新京報貝殼財經(jīng)記者表示,在BERT(谷歌早年發(fā)布的自然語言處理框架)出來時,范式研究院就已經(jīng)開始關(guān)注并投入在這個技術(shù)領域,GPT3出來以后更加明確了要朝這個方向。ChatGPT熱潮對該公司最大的幫助,就是整個市場的信心一下從0調(diào)滿,確定性的投入更大了,再往后就是推動產(chǎn)品和商業(yè)化。
該公司也透露了“式說”的迭代過程——“式說1.0”為在ChatGPT爆紅之后推出的第一代產(chǎn)品,有生成語言的能力;“式說2.0”則在語言能力基礎上,加入了文本、語音、圖像、表格、視頻等多模態(tài)輸入及輸出能力,并增加了企業(yè)級Copilot能力。以與企業(yè)內(nèi)部應用庫、企業(yè)私有數(shù)據(jù)等進行聯(lián)網(wǎng),對信息和數(shù)據(jù)進行分析,回答員工的問詢或執(zhí)行相關(guān)任務,從知識助手成為業(yè)務助手;“式說3.0”則在生成式和語言能力的基礎之上,發(fā)力Copilot和思維鏈COT(多步推理、復雜任務拆分、形成數(shù)據(jù)飛輪),改造傳統(tǒng)B端企業(yè)軟件的體驗與開發(fā)效率,因此稱之為AIGS,以生成式AI重構(gòu)企業(yè)軟件。
在與國內(nèi)大模型“同行”的對比上,第四范式方面表示,中國目前還沒有像OpenAI那樣在大模型上絕對領先的公司,也會有更多的大模型。大模型是新的生產(chǎn)力,大家都得有大模型作為底座,所以入局的門檻變高了,但是在達到這個門檻之后,重點在于如何選擇方向。
第四范式方面認為,比較大的機會在于改造整個的企業(yè)軟件行業(yè),也就是AIGS。發(fā)力的大模型技術(shù)方向是Copilot可控(執(zhí)行可控、知錯能改),和思維鏈COT((chain of thoughts,多步推理、復雜任務拆分)的能力,形成數(shù)據(jù)飛輪(比如將某垂直領域的數(shù)據(jù)和流程投入大模型,很快可以形成模型在該領域的思維鏈)。
戴文淵表示,第四范式的AIGS戰(zhàn)略,就是指基于式說大模型背后的Copilot+COT能力,把企業(yè)軟件改造成新型的交互范式,并在新型交互上不斷地學習軟件的使用過程,形成領域軟件的“思維鏈”。最終,由于新的交互形式的出現(xiàn),企業(yè)軟件的開發(fā)效率變得更高。
戴文淵現(xiàn)場演示“式說”大模型 新京報記者攝
記者聯(lián)系郵箱:luoyidan@xjbnews.com
新京報貝殼財經(jīng)記者 羅亦丹
編輯 岳彩周
校對 柳寶慶