趙本山用英文演小品、郭德綱用英文說相聲、范明用英文演戲……近日,多個中國“土味”明星開口說英語的視頻引發(fā)關(guān)注。


不僅有中國的明星飆英文,網(wǎng)絡(luò)上也傳播著不少外國明星用中文接受采訪的視頻,如泰勒·斯威夫特、安妮·海瑟薇等。有的甚至脫離了原本的內(nèi)容,僅使用明星的臉,再加上創(chuàng)作者的聲音和內(nèi)容,直接讓安妮·海瑟薇唱起了“東北rap”。


新京報貝殼財經(jīng)記者發(fā)現(xiàn),目前已有專業(yè)公司在提供AI換聲服務(wù),其中最火的公司當屬一個名為HeyGen的公司。該公司在 9 月7日上線視頻翻譯功能后,在國外社交平臺上迅速走紅。這家公司靠免費試用攬客,排隊人數(shù)眾多,想要跳過排隊或者享受更多的服務(wù)則需要充值。


也有公司在靠明星換聲視頻引流來賣AI換聲服務(wù):制作AI換聲視頻的單價為3元/秒,視頻最少30秒,最長5分鐘。


值得注意的是,AI換聲不僅存在著侵權(quán)等法律風險,這一技術(shù)還有可能被不法分子利用,成為AI詐騙的新手段。


從熊貓阿寶秀中文到趙本山飆英語,AI換聲是如何以假亂真的?


貝殼財經(jīng)記者發(fā)現(xiàn),這一系列視頻的火爆首先來源于B站UP主“johnhuu”的視頻《這才是沒有譯制片腔調(diào)的翻譯!》,該視頻發(fā)布于10月17日,截至11月3日已有254.5萬的播放量。后來被各類短視頻賬號廣泛引用的“憨豆先生講中文”“蔡明講英文”等視頻正是來源于該視頻。


在這一視頻中,johnhuu表示,要達到此類效果必須同時符合三個條件:“第一,地道的口語翻譯;第二,克隆說話者的聲音;第三,把嘴型換了?!?/p>


而實際上,上述三個條件均可以通過AI技術(shù)實現(xiàn)。


首先,語言之間的互相翻譯早已是一項成熟的技術(shù),“機器翻譯”已成為不少作品跨國傳播最簡單的途徑,國內(nèi)騰訊、科大訊飛等均已推出此類同聲翻譯技術(shù)多年。


而對于克隆說話者的聲音,早在今年上半年AI孫燕姿爆火時就早已有成熟的技術(shù)路徑:創(chuàng)造出AI孫燕姿的AI音色替換技術(shù),其來源為so-vits-svc模型,一款由中國歌聲合成愛好者Rcell開發(fā)的AI語音轉(zhuǎn)換項目,其技術(shù)原理是使用孫燕姿的聲音“替換”其他歌手的干聲,達到以假亂真的效果。


在口型替換方面,早在2015年《功夫熊貓3》引入中國時,該片的主創(chuàng)團隊就透露,該片的中文版本按照中文臺詞,給每個角色都重新做了口型和表情,“所以,觀眾會覺得阿寶本來說的就是中文?!?019年,包括斯坦福大學、普林斯頓大學在內(nèi)的多個研究團隊也推出了能夠編輯頭部特寫對話視頻的機器算法,該算法會從其他視頻中尋找人物講話時的嘴部動作,生成新的視頻。


不過,AI配音視頻要想完全和原視頻取得一致,符合原視頻時長、情景的翻譯必不可少,對此,一個精妙的翻譯也必不可少。


11月3日,johnhuu告訴貝殼財經(jīng)記者,此類AI配音視頻里,翻譯占90%,克隆聲音和換嘴只是錦上添花,占10%。在其看來,相聲小品這種有梗的句子,機器翻譯不了。


AI換聲生意:有公司靠免費試用攬客有公司靠明星換聲引流,制作換聲視頻3元/秒


與之相伴,AI換聲生意也正在浮出水面。


事實上,目前已經(jīng)有科技公司推出了將這三項技術(shù)結(jié)合的“打包翻譯服務(wù)”,其中最火的公司當屬一個名為HeyGen的公司。該公司在 9 月7日上線視頻翻譯功能后,在外國社交平臺上迅速走紅。HeyGen 的目標是“消除語言障礙”,公司聯(lián)合創(chuàng)始人兼首席執(zhí)行官Joshua Xu說:“我們設(shè)想在未來,用不同語言制作視頻內(nèi)容和傳播信息,就像打字一樣簡單”。


11月3日,貝殼財經(jīng)記者登錄HeyGen官網(wǎng),發(fā)現(xiàn)該公司致力于使用文字直接生成虛擬人,而在其“視頻翻譯”功能中,用戶可以通過上傳一段不大于1GB大小的視頻,并選擇“想要翻譯的語言”來實現(xiàn)AI換聲功能。這項功能目前極其火爆,貝殼財經(jīng)記者上午8點上傳了一段視頻,顯示已進入排隊等待序列,前方還有3.48萬人,而當記者等待至11點25分時,前方排隊的還有3.21萬人。目前,每名用戶可以免費試用兩次視頻翻譯服務(wù),但想要跳過排隊或者享受更多的服務(wù)則需要充值。


根據(jù)HeyGen官網(wǎng)上的信息,僅從名字上看,公司的兩名創(chuàng)始人Joshua Xu和Wayne Liang均為華裔,其中Wayne Liang的履歷上還有“字節(jié)跳動美國公司前設(shè)計主管”的介紹。


11月2日,記者還通過抖音平臺,聯(lián)系了一家使用明星視頻進行AI換聲的公司客服,對方表示,制作AI換聲視頻的單價為3元/秒,視頻最少30秒,最長5分鐘??头Q,該技術(shù)可將作者的原聲視頻進行中英語言互譯。


當記者詢問是否可使用明星的視頻來當作換聲素材時,客服表示,“我不建議你再用明星了,有版權(quán)問題的隱患。我們是靠這個引流來賣服務(wù),我們自己也要調(diào)整?!蓖瑫r,該客服表示,如果客戶堅持要用明星素材,公司可以提供轉(zhuǎn)換服務(wù),但客戶本人需承擔后續(xù)影響。


客服表示,客戶使用這一服務(wù)的目的不一,“有想要文化出海、出海賣貨的,也有人只是為了好玩”,對于原視頻的質(zhì)量要求,該客服表示,“視頻里面的人物嘴部不能遮擋,視頻里面最好不要出現(xiàn)多人對話和畫外音,也不要有背景音樂和雜音,這些都會降低視頻生成效果。”


貝殼財經(jīng)記者發(fā)現(xiàn),有網(wǎng)友在社交媒體上分享了制作這類視頻的工具,在一款名為“Rask AI”的軟件里,只需將視頻通過本地上傳,并選擇視頻所需要轉(zhuǎn)換的語言,點擊生成后AI會自動處理。處理后的視頻人物說話口型與所用語言一致。


AI換聲服務(wù)有的涉嫌侵犯作品的翻譯權(quán)


記者發(fā)現(xiàn),AI換聲的事件并不只存在影視行業(yè),今年5月,“AI孫燕姿”翻唱多首歌曲的事件引發(fā)關(guān)注。有法律人士指出, 此類AI孫燕姿作品存在版權(quán)問題。


北京市中聞律師事務(wù)所合伙人趙虎告訴貝殼財經(jīng)記者,明星AI換聲短視頻可能侵犯了三種權(quán)利。第一是翻譯權(quán),根據(jù)《著作權(quán)法》的規(guī)定,無論是郭德綱的相聲還是趙本山的小品,都是作品,享有著作權(quán)。而著作權(quán)其中一項子權(quán)利為翻譯權(quán),如果想要翻譯一個作品,應該經(jīng)過原作品著作權(quán)人的授權(quán)。第二,信息網(wǎng)絡(luò)傳播權(quán)。如果沒有取得他人作品的信息網(wǎng)絡(luò)傳播權(quán),就把他人的作品上傳到短視頻平臺上,那么就侵犯了他人作品的信息網(wǎng)絡(luò)傳播權(quán)。第三,錄音錄像制作者權(quán)。未經(jīng)授權(quán),在互聯(lián)網(wǎng)上傳播錄像制品也是侵權(quán)的。


警惕AI換聲背后的詐騙風險,接到騷擾電話小心對方竊取你的聲音


值得警惕的是,AI換聲帶來的風險距普通人的生活并不遙遠,記者發(fā)現(xiàn),當前已發(fā)生了多起由AI換臉換聲導致的詐騙案件。


今年9月,徐州警方公布一則AI換聲詐騙案件細節(jié):高中生晶晶突然收到“好友”的轉(zhuǎn)賬求助,由于擔心被騙,晶晶要求對方發(fā)了一段語音,在確認是她熟悉的高中同學后,晶晶通過QQ轉(zhuǎn)給對方2000元,但收到錢后,對方便消失了,隨后晶晶才反應過來自己被騙。


這并非個例。


今年5月,包頭市公安局公布一則案件細節(jié):郭先生的好友突然通過微信視頻聯(lián)系到他,稱想要借郭先生公司的賬戶走一下賬?;谝曨l聊天信任的前提下,郭先生先后分兩筆把 430 萬元給對方打了過去。最后,郭先生發(fā)現(xiàn)自己遇到了“高端”騙局,對方通過智能AI換臉技術(shù),佯裝成好友對他實施了詐騙。郭先生稱,“我在視頻中也確認了面孔和聲音,所以才放松了戒備”。


多地警方已對AI詐騙常用手段進行揭秘,其中就有“聲音合成”方面的AI深度造假:騙子通過騷擾電話錄音等來提取某人聲音,獲取素材后進行聲音合成,從而可以用偽造的聲音騙過對方。


10月13日,國家金融監(jiān)督管理總局在《關(guān)于警惕利用AI新型技術(shù)實施詐騙的風險提示》中指出,利用AI新型技術(shù)實施詐騙主要有“擬聲”“換臉”兩種手段,即通過模擬他人聲音或形象騙取信任,進而詐騙錢財。國家金融監(jiān)督管理總局提醒廣大金融消費者:第一,網(wǎng)絡(luò)渠道“眼見”不一定為實;第二,轉(zhuǎn)賬匯款務(wù)必核驗對方身份;第三,保護好照片、聲音等個人信息。


新京報貝殼財經(jīng)見習記者 韋博雅 記者 羅亦丹

編輯 岳彩周

校對 楊許麗 陳荻雁