一位年輕的女性走在充滿霓虹燈的東京街頭、兩艘戰(zhàn)船在咖啡杯里航行、黑人小伙在云端看書、古鎮(zhèn)巷子里迎接龍燈的男女老少……這些由Sora(一款文生視頻模型)生成的視頻效果足以“亂真”。


當(dāng)?shù)貢r間2月15日,OpenAI (一家海外人工智能公司)推出旗下首個文生視頻大模型Sora,同時展示了由它生成的48段視頻。該模型生成的視頻以超高的清晰度、連貫性、語義還原度引發(fā)業(yè)內(nèi)廣泛關(guān)注。


Sora的驚艷令人振奮,它的出現(xiàn)也可能會深遠地影響到游戲、影視和廣告等內(nèi)容行業(yè)?!澳壳翱磥恚珹IGC(生成式人工智能)相關(guān)工具的應(yīng)用,能夠有效提高媒體、設(shè)計等相關(guān)領(lǐng)域的內(nèi)容生產(chǎn)速度,利用AIGC工具進行概念構(gòu)想和快速迭代,會成為未來這些行業(yè)工作流程中的重要一環(huán)?!敝袊囆g(shù)科技研究所數(shù)字藝術(shù)部主任張宜春接受新京報貝殼財經(jīng)專訪時說。


雖然技術(shù)路徑、呈現(xiàn)效果與Sora還存在差異,但生成式人工智能已經(jīng)成為國內(nèi)的熱門賽道,不少技術(shù)也已投入應(yīng)用。新京報貝殼財經(jīng)獨家獲悉,年初摘得iOS(蘋果旗下手機應(yīng)用商店)免費榜冠軍的言情手游《世界之外》中的不少人物和劇情就來自人工智能生成。此外,2月6日上線的古裝探案劇《大唐狄公案》也用人工智能生成了古代長安城的全景鏡頭。不少CPC廣告(點擊付費廣告)的物料也使用了人工智能生成。


華泰證券研報顯示,2023年實際誕生的文生視頻大模型達到數(shù)十個,全球用戶數(shù)量超過百萬級別,但目前多數(shù)視頻模型仍處于產(chǎn)品早期階段。2024年各大公司加快了文生視頻模型的研發(fā)步伐。


Sora生成的視頻截圖。圖/IC


游戲行業(yè)

內(nèi)容生產(chǎn)、語音交互等領(lǐng)域已應(yīng)用AIGC,核心畫面仍需人工加入


2024年開年,網(wǎng)易旗下的無限流言情手游《世界之外》成為“黑馬”。但鮮少有人知道這款游戲的很多對話和美術(shù)都由人工智能生成。


“初期這個項目(《世界之外》)在內(nèi)部優(yōu)先級不高,甚至已經(jīng)到了‘待砍’的邊緣,但游戲的主策劃四處奔走,堅持要把這個游戲發(fā)出來。這個團隊人很少,所以這款游戲的很多人物和對話都是AI生成的。現(xiàn)在這個題材爆了,又緊急配了不少人,開始美化和修飾?!庇螒蛐袠I(yè)資深運營林函(化名)向記者透露,他曾經(jīng)服務(wù)過多家主流游戲大廠。


網(wǎng)易2024年財報顯示,旗下《逆水寒》《蛋仔派對》等游戲大量使用AI技術(shù)。比如,基于伏羲人工智能模型的《逆水寒》手游中,融合了高智能NPC(非玩家角色)、AI捏臉、AI作詩、AI作畫、AI大宋頭條等?!兜白信蓪Α穭t提供了具有AI算法的用戶內(nèi)容生成工具,能夠降低用戶制作地圖的門檻,目前該游戲地圖總數(shù)突破了1億張,單張地圖最高游玩次數(shù)超1.2億次。另據(jù)貝殼財經(jīng)記者了解,目前不少游戲公司已經(jīng)在研究將AI用于3D建模的不同方向。


據(jù)林函介紹,目前的主流游戲廠商,在非核心內(nèi)容上都使用了AIGC,主要應(yīng)用領(lǐng)域有以下幾個方面:其一是游戲內(nèi)容生產(chǎn),包括圖形、圖像生成,游戲劇本創(chuàng)作,NPC智能生成等,甚至有的游戲中90%的過場圖都可以用AIGC再結(jié)合一些人工優(yōu)化生成,這是降本增效的方式;其二使用AI對話和語音交互,比如根據(jù)游戲策略和人物屬性,給NPC生成語言包,讓他更有交互和情感屬性;其三是在商業(yè)投放的過程中,用AI來預(yù)測和模擬部分玩家的行為,從而更好地調(diào)優(yōu)商業(yè)化數(shù)值。


“只要生成的底圖比較正常,操作動作不要太夸張,就可以用。”從事游戲AI技術(shù)的陳星(化名)說。目前文生視頻模型還停留在“4秒時代”,陳星認為,市面上的Pika、Runway等模型只能生成Gif圖(圖形交換格式)效果的內(nèi)容,這些只能用在游戲“稍微動一點”的地方。


但涉及游戲較為核心的畫面則需要人工加入。陳星表示,目前Sora最多能生成一分鐘的視頻,比較理想的使用場景是,如果需要制作5至10分鐘的長CG(計算機生成圖像),需要通過不斷調(diào)整提示詞,生成一些較為滿意的片段和鏡頭,再通過人工的剪輯讓這些片段看起來“更連貫些”,但更有可能出現(xiàn)的情況是,很大部分片段無法直接使用,造成更大的成本和算力浪費。


但陳星認為,“生成式人工智能對獨立游戲的開發(fā)者和小工作室是利好的,以前獨立游戲里沒有的CG、過場動畫和3D模型等,現(xiàn)在都可以有了。因為這些內(nèi)容是逐幀渲染出來的,非常耗時耗錢?!币杂螒騊V(游戲宣傳視頻)為例,一段高質(zhì)量的PV視頻起碼花費數(shù)百萬元。


但從事游戲項目用戶增長的張青(化名)提示,如果在二次元、MMO(大型多人在線游戲)、SLG(策略類游戲)等強調(diào)美術(shù)和內(nèi)容質(zhì)量的游戲中,直接使用模型生成內(nèi)容容易招致玩家反感。他認為,這類游戲如果使用模型生成內(nèi)容,“可能用在比較細微的地方,不太可能用在主線過場動畫或主要宣傳的視頻,比如PV”。


據(jù)伽馬數(shù)據(jù)《中國游戲產(chǎn)業(yè)AIGC發(fā)展前景報告》,在中國游戲營收TOP50游戲企業(yè)中,已有64%的游戲企業(yè)明確布局AIGC領(lǐng)域,并有實質(zhì)性動作。已布局企業(yè)中,有27家企業(yè)已將AIGC投入到了游戲研發(fā)、營銷、運營等游戲產(chǎn)業(yè)全流程應(yīng)用層面;12家企業(yè)運用AIGC相關(guān)技術(shù)為其他行業(yè)或企業(yè)提供解決方案;9家企業(yè)則選擇重點布局數(shù)字人、元宇宙領(lǐng)域。


廣告行業(yè)

AIGC內(nèi)容可能會最早應(yīng)用在點擊付費廣告上


農(nóng)夫山泉生肖龍AI繪畫小程序上線,20天吸引網(wǎng)友創(chuàng)作一百多萬張龍寶寶畫作;可口可樂“龍連你我”系列活動用AI帶領(lǐng)百萬人沖擊吉尼斯挑戰(zhàn)……自AIGC問世以來,就已讓不少廣告人感到壓力,龍年開局的幾個優(yōu)秀傳播案例更是都用上了AI元素。


“每天早晨,我都會根據(jù)自己擬定的主題創(chuàng)作方向,用Midjunery、文心一格等軟件來訓(xùn)練圖片,直到生成6組滿意的(圖片),分發(fā)到視頻號、小紅書和抖音上。一年來運營三個賬號的成本只有幾千元,這在以前是完全想不到的,此前為圖庫付費都要幾萬甚至更多?!碧锖}埜嬖V新京報貝殼財經(jīng)記者。


田海龍此前是一家A股上市傳播機構(gòu)的設(shè)計創(chuàng)意總監(jiān),有近20年廣告設(shè)計經(jīng)驗。從2023年開始嘗試用AIGC輔助創(chuàng)意設(shè)計工作。他孵化的“龍哥的AI實驗室”賬號僅用10個月就獲得了“視頻號2023年度優(yōu)秀創(chuàng)作者”,訓(xùn)練生成的圖片作品入選國劇盛典、新華社活動,他自己也成了“文心一格”的核心訓(xùn)練師。


“目前國內(nèi)的專業(yè)文生圖模型經(jīng)歷了至少四次迭代。第一代模型輸出的圖片完全不具備圖片基本使用需求,也不符合我的審美。有天早晨,某款模型的產(chǎn)品人員提示我模型升級了,我用此前用過的提示詞試了一下,結(jié)果出來的圖片超出我的預(yù)期。但直到第三代模型出來之前,我都不敢用它訓(xùn)練人像圖片,因為(模型)對人像的五官無法正常表現(xiàn),理解誤差大,直到第三代模型專門針對人像進行了優(yōu)化?!碧锖}堉钢謾C上他用不同版本模型訓(xùn)練出的圖片告訴記者。


田海龍這樣描述他使用過的國外和國內(nèi)文生圖模型的差異,“教育的環(huán)境、方法、師資的水平以及優(yōu)秀教師的數(shù)量都不在一個水平,結(jié)果導(dǎo)致不管是畫質(zhì)、細節(jié)、像素,還是畫幅、景深,國內(nèi)模型生成的圖都略遜于國外模型,但也能感受到國內(nèi)模型的進步速度之快?!彼麄€人判斷是由于優(yōu)質(zhì)訓(xùn)練內(nèi)容和算力投入的不足,導(dǎo)致了中文模型的弱點。


經(jīng)過超10個月的深度使用,田海龍認為AIGC生成的內(nèi)容目前尚無法實現(xiàn)高端客戶對定制和創(chuàng)新內(nèi)容的需求,因為目前的模型都是通用型,還沒有針對廣告設(shè)計行業(yè)優(yōu)化訓(xùn)練的模型。


“但一些基礎(chǔ)需求,比如對品牌要求不高的提案設(shè)計稿、概念稿,以及傳播配圖、熱點海報等是可以滿足的。原本五人左右的團隊,現(xiàn)在會被一個人的‘超級個體’取代,尤其目前消費降級,客戶對品牌調(diào)性的要求相對較低?!碧锖}堈f。此外,他認為形成有個人特色的AIGC圖庫,出售圖片版權(quán),也是一種商業(yè)路徑。


海外獨立導(dǎo)演杜蘭馨也持類似觀點,“比較大型的廣告公司才會做上百萬甚至上千萬的廣告。中小企業(yè)的商業(yè)視頻,10萬到20萬水平的廣告片,Sora的技術(shù)是可以達到?!?/p>


無法實現(xiàn)定制和創(chuàng)新的局限也體現(xiàn)在技術(shù)細節(jié)上。據(jù)公開信息,Sora的技術(shù)路線繼承了此前公開的DALL-E文生圖模型,有一定程度的創(chuàng)新,但并非顛覆性,因此當(dāng)下Sora不可能產(chǎn)生真正“原創(chuàng)性”的內(nèi)容,依然高度依賴人為調(diào)教。


受訪的不少從業(yè)者表示,AIGC內(nèi)容可能會最早應(yīng)用在CPC廣告上。“因為它可以質(zhì)量低,可以和產(chǎn)品沒那么貼合,只要來用戶量就行。”從事游戲項目用戶增長的張青說。


據(jù)介紹,在游戲行業(yè)CPC廣告投放大多交給外包公司。陳星表示,“如果未來AIGC模型上線了選區(qū)修改功能,就能直接在原素材上進行修改,一直改出自己想要的效果”。張青判斷,在成本受限的情況下,公司可能傾向于選擇用AI生成相關(guān)廣告,而不再使用外包公司。


影視行業(yè)

AIGC內(nèi)容缺乏敘事性,只能作素材或前期預(yù)覽


在影視行業(yè)中,2月6日上線的古裝探案劇《大唐狄公案》中就用到了人工智能生成。第一集中,鏡頭從青磚古瓦的恢宏建筑掃過,展示了一座大型古代長安城全景,街道行人、亭臺樓閣、古體建筑都由AI生成。


劇集由優(yōu)酷和儒意影業(yè)等出品,AI技術(shù)由阿里大文娛研發(fā)。優(yōu)酷方面表示,使用AI生成長安城,主要原因是因為國內(nèi)沒有完整的唐代長安城實景地,而傳統(tǒng)特效在畫面轉(zhuǎn)場的精度、流暢度方面也無法滿足劇組需求,而且拍攝時間很緊,劇組知道阿里大文娛的技術(shù)后,就決定采用這套方案。但記者注意到,該片中生成的長安城主要是大全景,細節(jié)特寫及人物較少。


此前優(yōu)酷的爆款劇《異人之下》則使用了AI數(shù)字人演員。阿里大文娛首席技術(shù)官鄭勇在此前接受新京報采訪時表示,相較傳統(tǒng)虛擬制作,通過自研AI技術(shù)打造的數(shù)字人厘里,在《異人之下》中降低了在建模、原畫等環(huán)節(jié)投入的成本和時間,也避免了對動捕技術(shù)的依賴,讓制作成本降低了80%,效率提升40%,呈現(xiàn)效果也更趨近于真人拍攝。


此外,阿里大文娛還在研究一套針對特效影片的“預(yù)演”系統(tǒng),該系統(tǒng)受到漫威的啟發(fā),漫威在拍攝特效影片時會將電影最復(fù)雜的部分“預(yù)演”出來。


雖然已經(jīng)有局部應(yīng)用,但大多受訪的影視行業(yè)人士認為,邏輯的連貫性、細節(jié)的可操作性以及敘事性,都會影響到AIGC在高質(zhì)量影視行業(yè)的應(yīng)用?!斑€不知道Sora生成一個視頻的周期是多久,也不知道視頻的分辨率、幀速率等指標能達到什么程度,這些都需要正式公測才知道。目前來看,它會很適用于短視頻的制作,但要影響到對質(zhì)量、品質(zhì)有較高要求的影視行業(yè),還有很長路要走?!盌NEG高級環(huán)境藝術(shù)家李建鋒表示。


“生成出來的視頻是類似于空鏡頭的比較萬能的鏡頭,最先替代的可能是純視頻素材提供網(wǎng)站,小團隊、小作坊可能會用,廣告公司應(yīng)該還不會。對電影級別的視頻制作,最多就是導(dǎo)演拍攝前做輔助,不過因為敘事性缺乏可能連這個都做不了,畢竟現(xiàn)在連比較成熟的文生圖都沒辦法完全取代故事版的地位,更不用說預(yù)覽了。”李建鋒說。


中國科普作協(xié)科學(xué)與影視融合專委會常務(wù)副主任林育智也在采訪中表達了類似觀點?!半娪皬膩聿皇呛唵蔚漠嬅婧吐曇舻慕M合,它是我們的情感共情與共鳴,是我們和這個社會的人文思辨,是一段脫離于這個世界的沉浸,這是AI無法取代的?!绷钟钦f。他此前曾任《獨行月球》《三體》《流浪地球2》等科幻作品的科學(xué)顧問。


展望

已經(jīng)實現(xiàn)指數(shù)級進步,但仍無法取代現(xiàn)有行業(yè)


在被問及AIGC內(nèi)容距離滿足定制化需求、實現(xiàn)商業(yè)化還有哪些路要走時,中國藝術(shù)科技研究所數(shù)字藝術(shù)部主任張宜春總結(jié)了三大方面。


其一在技術(shù)方面,雖然目前的AIGC工具能夠出現(xiàn)讓人較為滿意的結(jié)果,但是如果細摳目前AIGC工具所生成的圖片、視頻,總會在細節(jié)上看出一些脫離真實的小錯誤。因此用作最終落地的產(chǎn)品,特別是要求精益求精的各個場景,依然不能完美滿足客戶的要求。其二來自于觀念,目前AIGC所生成的東西,尚沒有能夠擺脫人類已有認知領(lǐng)域的桎梏,形成超越人類想象力邊界的新東西,更像是對人類已有經(jīng)驗的整合和加工。即AIGC做的東西還不足以和現(xiàn)在的藝術(shù)創(chuàng)作觀念、格調(diào)相匹配。其三在設(shè)計和藝術(shù)層面,目前AIGC生成內(nèi)容的想象力和創(chuàng)造力,還沒有超越人類已有認知,也就是缺乏那么一點點讓人產(chǎn)生震撼的“不同”,因此達不到藝術(shù)設(shè)計創(chuàng)作在實用中的效果。


但他表示,“隨著AIGC工具的不斷進化,而且隨著使用工具者的人員規(guī)模和操作水平提升,目前所限制的三個條件,有可能在未來某個時間點,不再成為障礙。畢竟,我們已經(jīng)看到很多人,在以文生圖的設(shè)計中,表現(xiàn)出了足夠的創(chuàng)造力,未來只是如何將這種個人的想象力轉(zhuǎn)化成實際的視覺結(jié)果,這也是AIGC正在做和未來也將要做的事情?!?/p>


中央財經(jīng)大學(xué)中國互聯(lián)網(wǎng)經(jīng)濟研究院副院長劉航研究員認為,簡單利用Sora所生成的視頻未必真正符合行業(yè)的實際需求,需要技術(shù)人員找到與人工智能更有效的溝通與互動方式,才能不斷縮小文生視頻技術(shù)與從業(yè)者需求之間的差距,“這實際對從業(yè)者在理解并掌握人工智能技術(shù)層面的能力提出了更高要求”。


游戲行業(yè)的陳星認為目前的AIGC還不能滿足用戶對接續(xù)感的要求。“游戲不可能只短暫玩一下,玩家探索游戲世界需要很長時間,游戲世界中的每個地方也需要連接在一起?!彼J為,即使Sora的生成時長得到拓展,也存在所謂的上限,“依據(jù)我對算法的理解,生成內(nèi)容越長,算法對前面生成內(nèi)容的記憶越弱”。


成本也成為一大限制因素?!熬退鉙ora生成的視頻能夠用到游戲中,目前也需要通過3D建模、游戲引擎等拼接游戲片段以實現(xiàn)效果,這難免與‘節(jié)約成本’背離?!标愋钦f。


“游戲很多畫面需要實時生成,使用Sora實時生成游戲畫面將耗費巨大的算力,如果是API(應(yīng)用程序接口)形式,價格會很貴,如果是模型推理按照目前的云端服務(wù)器來說,這對游戲廠商和普通玩家都是壓力,小廠商基本無法支撐?!标愋钦f。


面對AIGC內(nèi)容過多,可能會影響平臺的內(nèi)容質(zhì)量,造成虛擬和真實的難以區(qū)分,甚至?xí)砬謾?quán)風(fēng)險和失業(yè)風(fēng)險。張宜春建議,首先,所有AIGC的生成物,必須有人類可識別的標識,表明其特性,避免理性上的誤導(dǎo)。其次,在AIGC的技術(shù)檢測方法上,工具創(chuàng)作者、使用者、發(fā)布者必須建立起嚴格的技術(shù)鏈條,統(tǒng)一完成人工內(nèi)容和AI生成內(nèi)容的檢測和甄別?!皩τ谛蜗竽7碌刃は駲?quán)的模仿,我覺得可以展開相關(guān)的法律制度和分配制度研究工作,建立其‘多方參與、各方受益、社會廣泛監(jiān)督、總體寬容、加強社會組織功能’的AIGC新生態(tài)。”張宜春說。


新京報首席記者 白金蕾 記者 韋英姿

編輯 張冰 校對 劉越