近日,在百度AI Day開放日上,百度官宣打造業(yè)界首個(gè)超頭主播羅永浩數(shù)字人,這也是業(yè)內(nèi)首個(gè)多模態(tài)高度融合數(shù)字人。該技術(shù)基于文心大模型4.5T升級(jí),實(shí)現(xiàn)語言、聲音與形象的協(xié)調(diào)一致。
首個(gè)多模態(tài)高度融合數(shù)字人
此前,6月15日,羅永浩數(shù)字人在百度電商首次開播。據(jù)悉,數(shù)字人直播間僅開播26分鐘創(chuàng)下超1300萬人次觀看、GMV突破5500萬元的行業(yè)新紀(jì)錄,部分核心品類帶貨量反超真人直播。
據(jù)百度方面介紹,此次合作主要得益于百度發(fā)布的高說服力數(shù)字人等關(guān)鍵技術(shù)突破。百度電商數(shù)據(jù)顯示,目前已有累計(jì)超10萬數(shù)字人主播,覆蓋電商、教育、醫(yī)療等數(shù)十個(gè)行業(yè),驗(yàn)證了數(shù)字人直播的商業(yè)可行性。
此外,今年4月百度發(fā)布的高說服力數(shù)字人已讓數(shù)字人帶入3.0時(shí)代,這是一個(gè)新的里程碑,標(biāo)志著智能電商邁入新篇章,新一代高說服力數(shù)字人成為了一個(gè)像真人一樣。
百度強(qiáng)調(diào),羅永浩數(shù)字人已達(dá)到媲美超頭主播的體感效果,隨著大模型與多模能力發(fā)展,數(shù)字人未來超越真人效果極具潛力。
事實(shí)上,AI數(shù)字人融合了人工智能、計(jì)算機(jī)視覺、自然語言處理等尖端技術(shù),能夠以高度逼真、智能的形象呈現(xiàn)在現(xiàn)實(shí)中,它可以根據(jù)不同的課程內(nèi)容和教學(xué)目標(biāo),扮演教師助手、虛擬講解員、學(xué)習(xí)伙伴等多種角色。
捕捉市場風(fēng)口
技術(shù)層面,各類大模型加速迭代并構(gòu)建開源生態(tài),人工智能應(yīng)用場景的構(gòu)建成為新的科技焦點(diǎn),多模態(tài)AI成為核心突破方向,并且AI驅(qū)動(dòng)數(shù)字人的應(yīng)用場景正在加速落地,逐步向互聯(lián)網(wǎng)、文旅、金融、快消、教育等領(lǐng)域加速滲透。
例如相較于傳統(tǒng)的教學(xué)模式,AI數(shù)字人能夠?qū)崿F(xiàn)24小時(shí)不間斷的教學(xué)服務(wù),為學(xué)生提供個(gè)性化的學(xué)習(xí)指導(dǎo),精準(zhǔn)解答疑問,引導(dǎo)學(xué)習(xí)思路,極大地提高了教學(xué)效率和學(xué)習(xí)效果。
專家表示,在當(dāng)今數(shù)字化浪潮席卷全球的背景下,各個(gè)領(lǐng)域正面臨著前所未有的變革機(jī)遇,而隨著技術(shù)的不斷進(jìn)步,AI數(shù)字人作為前沿科技的結(jié)晶,正逐步走進(jìn)人們的視野,而將其深度融合,并有望形成千億級(jí)新賽道。
微美全息AI算法驅(qū)動(dòng)數(shù)字人體系創(chuàng)新
誠然,越來越多的企業(yè)與資本布局?jǐn)?shù)字人領(lǐng)域。公開資料顯示,AI上市企業(yè)微美全息,在經(jīng)過技術(shù)的不斷積累和大量的市場檢驗(yàn)后,將大模型與多模態(tài)技術(shù)結(jié)合,通過深度學(xué)習(xí)、動(dòng)作模擬、情感模擬等算法,僅需少量真人視頻數(shù)據(jù)即可生成高擬真數(shù)字人,顯著降低制作成本,并支持低延遲、高精度的交互體驗(yàn)。
此外,微美全息數(shù)字人支持語音、圖像、視頻等多模態(tài)交互,結(jié)合大模型的記憶與性格復(fù)刻能力,實(shí)現(xiàn)自然對(duì)話和情感化互動(dòng)。同時(shí)為深化對(duì)AI驅(qū)動(dòng)的交互式數(shù)字人解決方案的應(yīng)用方式,微美全息依托AI虛擬數(shù)字人生成平臺(tái),實(shí)現(xiàn)低成本、短周期、批量化生產(chǎn),定制化設(shè)計(jì)外貌特征,滿足不同行業(yè)場景需求,提供更智能、個(gè)性化和精準(zhǔn)的交互體驗(yàn)。
結(jié)語
在當(dāng)下這個(gè)挑戰(zhàn)與機(jī)遇并存的時(shí)期,作為由計(jì)算機(jī)圖形學(xué)、動(dòng)作捕捉、AI深度學(xué)習(xí)、語音合成等計(jì)算機(jī)手段創(chuàng)造及使用,并具有多重人類特征的綜合產(chǎn)物,數(shù)字人是新一代信息技術(shù)集成創(chuàng)新和應(yīng)用的未來產(chǎn)業(yè),也是數(shù)字經(jīng)濟(jì)與實(shí)體經(jīng)濟(jì)融合的高級(jí)形態(tài)。未來,數(shù)字人是否廣泛滲透到傳統(tǒng)產(chǎn)業(yè)中,實(shí)現(xiàn)產(chǎn)業(yè)的向外擴(kuò)展,成為繼互聯(lián)網(wǎng)之后的又一重要推動(dòng)力?請(qǐng)拭目以待。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。