雖然元宇宙概念因大模型的火熱而短暫熄火,但元宇宙內(nèi)的“門(mén)面人物”虛擬數(shù)字人作為人工智能技術(shù)產(chǎn)物,得益于算力提升,迎來(lái)低成本、規(guī)?;涞氐目赡堋?/p>
4月25日,騰訊云智能“數(shù)智人媒體溝通會(huì)”上,騰訊云智能小樣本數(shù)智人生產(chǎn)平臺(tái)首次對(duì)外發(fā)布,平臺(tái)具有訓(xùn)練樣本小、生產(chǎn)效率高、自動(dòng)化生產(chǎn)等特性,可以輕松實(shí)現(xiàn)“自助式”數(shù)智人生產(chǎn)制作。
(資料圖)
采訪中,騰訊優(yōu)圖實(shí)驗(yàn)室研究總監(jiān)汪鋮杰對(duì)第一財(cái)經(jīng)記者表示,以前行業(yè)做的數(shù)智人效果未必好,有的一看就知道特別假;現(xiàn)在的數(shù)智人看一眼,還要猜測(cè)它們到底是真還是假。
技術(shù)發(fā)展帶動(dòng)數(shù)智人產(chǎn)業(yè)落地
伴隨人工智能技術(shù)的發(fā)展,國(guó)內(nèi)偶像綜藝、品牌代言人、熱門(mén)網(wǎng)紅等行業(yè)相繼出現(xiàn)由數(shù)字人扮演的角色,同時(shí)數(shù)量不斷增加。各家大廠也陸續(xù)發(fā)布了自己的數(shù)字人、虛擬人、數(shù)智人產(chǎn)品。
不論名字如何形容,其本質(zhì)都是通過(guò)計(jì)算機(jī)圖形學(xué)技術(shù)(Computer Graphic,CG)創(chuàng)造出與人類形象接近的數(shù)字化形象,并賦予其特定的人物身份設(shè)定,在視覺(jué)上拉近和人的心理距離,為人類帶來(lái)更加真實(shí)的情感互動(dòng)。據(jù)相關(guān)機(jī)構(gòu)預(yù)測(cè),到2030年,我國(guó)數(shù)字人整體市場(chǎng)規(guī)模將達(dá)到2700億元。
騰訊則直接推出數(shù)智人的生產(chǎn)平臺(tái)。騰訊方面介紹稱,騰訊云智能小樣本數(shù)智人生產(chǎn)平臺(tái)依托騰訊自研AI能力和技術(shù)經(jīng)驗(yàn),需要3分鐘真人口播視頻、100句語(yǔ)音素材,平臺(tái)便可通過(guò)音頻、文本多模態(tài)數(shù)據(jù)輸入,實(shí)時(shí)建模并生成高清人像,在24小時(shí)內(nèi)制作出與真人近似的“數(shù)智人”。
另外,成本方面,該生產(chǎn)平臺(tái)已將成本降低到千元級(jí)別,制作周期縮短至小時(shí)級(jí),大幅降低數(shù)字人使用門(mén)檻。但是,3D超寫(xiě)實(shí)、高精定制等高技術(shù)要求的數(shù)智人仍要求高成本,以及具體針對(duì)客戶需求進(jìn)行定制。
騰訊云智能數(shù)智人產(chǎn)品總經(jīng)理陳磊表示,小樣本數(shù)智人支持半身、全身形象展示,手勢(shì)動(dòng)作會(huì)根據(jù)內(nèi)容靈活調(diào)整,也支持錄制背景任意更換,適用于直播帶貨等更廣泛的商用場(chǎng)景。
相較于2D真人精品數(shù)字人,陳磊認(rèn)為小樣本數(shù)智人無(wú)需專業(yè)影棚錄制素材,成本更低;相較于照片生成、僅能呈現(xiàn)面部形態(tài)的數(shù)字人,小樣本數(shù)智人可根據(jù)文本設(shè)計(jì)手勢(shì),唇動(dòng)、口型、表情復(fù)現(xiàn)真人風(fēng)格。
東方證券研報(bào)分析認(rèn)為,虛擬數(shù)字人的驅(qū)動(dòng)可分為由真人扮演(業(yè)內(nèi)稱為“中之人”)驅(qū)動(dòng)和 AI 驅(qū)動(dòng)。過(guò)去 AI 驅(qū)動(dòng)數(shù)字人的痛點(diǎn)在于成本較高、交互效果不佳,因此由真人扮演驅(qū)動(dòng)更為常見(jiàn),此類路線背后的商業(yè)模式內(nèi)核是偶像娛樂(lè)工業(yè)、虛擬主播帶貨等,如字節(jié)跳動(dòng)旗下游戲品牌朝夕光年和樂(lè)華娛樂(lè)共同打造的虛擬偶像女團(tuán)A-SOUL。
另外,隨著近期AI 領(lǐng)域的技術(shù)突破、文本、圖像等領(lǐng)域的大模型應(yīng)用的快速落地,AI 驅(qū)動(dòng)的數(shù)字人的制作門(mén)檻和成本有望降低,例如外貌合成、動(dòng)作合成等環(huán)節(jié)均可借助 AI 技術(shù);數(shù)字人的對(duì)話能力有望得到質(zhì)的提升,擁有更加接近真人的對(duì)話能力。可以推測(cè),AI 與數(shù)字人的結(jié)合,將使數(shù)字人的應(yīng)用場(chǎng)景及范圍明顯擴(kuò)大,例如通過(guò)語(yǔ)音合成、表情合成以及深度學(xué)習(xí)等技術(shù),打造的虛擬客服、服務(wù)助手等已在實(shí)際生活、工作場(chǎng)景中進(jìn)入大規(guī)模應(yīng)用。
行業(yè)尚未形成穩(wěn)定競(jìng)爭(zhēng)格局
4月下旬,浙江省人民政府印發(fā)《關(guān)于進(jìn)一步擴(kuò)大消費(fèi)促進(jìn)高質(zhì)量發(fā)展若干舉措的通知》,其中提出:搶抓電子商務(wù)直播快速發(fā)展機(jī)遇,發(fā)展數(shù)字人虛擬主播、元宇宙新消費(fèi)場(chǎng)景等新業(yè)態(tài)新模式。發(fā)展“跨境電子商務(wù)+直播”模式,打造跨境保稅倉(cāng)直播總部基地,舉辦保稅倉(cāng)實(shí)景直播帶貨等活動(dòng)。
東方證券研報(bào)分析稱,短視頻、直播電商是數(shù)字人應(yīng)用的核心場(chǎng)景之一。數(shù)字人目前的主要應(yīng)用場(chǎng)景包括營(yíng)銷代言、電商帶貨、客服等。其中,數(shù)字人進(jìn)行電商直播帶貨的優(yōu)勢(shì)在于降低人工成本、不間斷直播、可控性強(qiáng)。
人工成本是直播/短視頻電商中的重要成本構(gòu)成(且人力成本的增加是未來(lái)趨勢(shì)),虛擬人可代替真人在電商直播或者視頻拍攝中出鏡從而降低人工成本的支出。另外,時(shí)長(zhǎng)是直播電商產(chǎn)能的重要衡量指標(biāo),數(shù)字人可以和真人主播配合,例如真人主播在黃金時(shí)段直播,而虛擬人主播則在流量低谷時(shí)替代真人主播,實(shí)現(xiàn) 7×24 小時(shí)全天直播,可實(shí)現(xiàn)最大限度的客戶觸達(dá)。以及數(shù)字人形象和人設(shè)相對(duì)穩(wěn)定,出錯(cuò)概率低,相對(duì)可控。
陳磊在采訪中透露,目前已有好幾個(gè)合作伙伴接入騰訊數(shù)智人,也上線了各大平臺(tái)。另外,電商直播只是落地場(chǎng)景中一個(gè)小場(chǎng)景,作為個(gè)人數(shù)智分身,各行各業(yè)都有,只要是時(shí)間寶貴的行業(yè)都有這個(gè)需求。
天眼查數(shù)據(jù)顯示,我國(guó)現(xiàn)有“虛擬人”“數(shù)字人”的相關(guān)企業(yè)66.2萬(wàn)余家。其中,超九成的虛擬人企業(yè)成立于5年之內(nèi),成立于1年內(nèi)的相關(guān)企業(yè)占比41.9%。尤其是目前低技術(shù)門(mén)檻的數(shù)智人批量生產(chǎn),極易造成同質(zhì)化競(jìng)爭(zhēng)局面。對(duì)此,汪鋮杰對(duì)第一財(cái)經(jīng)記者表示,在一些舊的生產(chǎn)模式往新的生產(chǎn)模式走的過(guò)程,大家都會(huì)找到自己的定位。
另外,陳磊對(duì)第一財(cái)經(jīng)表示,騰訊的數(shù)智人產(chǎn)品從2018年開(kāi)始找各個(gè)行業(yè)與場(chǎng)景尋找落地價(jià)值,解決客戶實(shí)際問(wèn)題痛點(diǎn),所做的事情更多是產(chǎn)生實(shí)際價(jià)值這個(gè)點(diǎn)。通過(guò)小樣本,從整體的發(fā)展階段來(lái)看,讓成本有足夠的降低,讓小樣本數(shù)智人將企業(yè)歷史沉淀算力,包括管線化能力在內(nèi)的訓(xùn)練一站式,變成自助式工具化手段,賦能給行業(yè)的合作伙伴,幫助他們拓展場(chǎng)景,成就垂直場(chǎng)景的價(jià)值。
另外,客戶企業(yè)選擇也有自身的要求與標(biāo)準(zhǔn)。頭豹研究院分析稱,企業(yè)在選擇虛擬數(shù)字人廠商時(shí)主要會(huì)考量幾個(gè)因素:廠商的技術(shù)實(shí)力、報(bào)價(jià)預(yù)算、虛擬數(shù)字人后期運(yùn)維服務(wù),以及廠商和企業(yè)之間既定的互信合作關(guān)系,例如在銀行業(yè),人工智能服務(wù)涉及商業(yè)數(shù)據(jù)或客戶隱私,企業(yè)傾向于交由熟悉的外包公司,而不是頭部技術(shù)廠商來(lái)完成。
除此之外,頭豹研究院分析表示,業(yè)內(nèi)頭部廠商在人像驅(qū)動(dòng)、智能對(duì)話和語(yǔ)音交互等技術(shù)領(lǐng)域并無(wú)較大差距,差異化主要集中在兩大方面:首先是知識(shí)圖譜方面,虛擬偶像、虛擬帶貨主播、虛擬銀行客服、虛擬財(cái)務(wù)員工和虛擬醫(yī)生等不同場(chǎng)景下應(yīng)用的知識(shí)圖譜各不相同,同一場(chǎng)景下不同業(yè)務(wù)涉及的知識(shí)庫(kù)也存在差異,以金融業(yè)為例,要求虛擬數(shù)字人廠商沉淀豐富的業(yè)務(wù)場(chǎng)景能力,針對(duì)金融企業(yè)的營(yíng)銷、風(fēng)控、客服等場(chǎng)景均具備成熟的產(chǎn)品方案能力;其次是廠商和企業(yè)之間先行的互信合作關(guān)系,如客戶向信賴的廠商提出需求,確定虛擬數(shù)字人的形象、功能、任務(wù)框架和知識(shí)圖譜,由廠商進(jìn)行后續(xù)的開(kāi)發(fā)。
因此整體來(lái)看,國(guó)內(nèi)虛擬人行業(yè)尚未形成穩(wěn)定的競(jìng)爭(zhēng)格局,市面也尚未出現(xiàn)成熟高端的應(yīng)用產(chǎn)品,行業(yè)仍需持續(xù)投入底層技術(shù)研發(fā),并在垂直行業(yè)爭(zhēng)奪市場(chǎng)份額。
最新資訊
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) 93dn.com 版權(quán)所有,未經(jīng)書(shū)面授權(quán)禁止使用
Copyright©2008-2020 By All Rights Reserved 皖I(lǐng)CP備2022009963號(hào)-10
聯(lián)系我們: 39 60 29 14 2@qq.com