騰訊混元發(fā)布并開(kāi)源語(yǔ)音數(shù)字人模型
來(lái)源:人民財(cái)訊 作者:王煥城 2025-05-28 12:35
Aa 大號(hào)字

人民財(cái)訊5月28日電,5月28日,騰訊混元發(fā)布并開(kāi)源的語(yǔ)音數(shù)字人模型HunyuanVideo-Avatar,由騰訊混元視頻大模型(HunyuanVideo)及騰訊音樂(lè)天琴實(shí)驗(yàn)室MuseV技術(shù)聯(lián)合研發(fā),支持頭肩、半身與全身景別,以及多風(fēng)格、多物種與雙人場(chǎng)景,面向視頻創(chuàng)作者提供高一致性、高動(dòng)態(tài)性的視頻生成能力。用戶(hù)可上傳人物圖像與音頻,HunyuanVideo-Avatar模型會(huì)自動(dòng)理解圖片與音頻,比如人物所在環(huán)境、音頻所蘊(yùn)含的情感等,讓圖中人物自然地說(shuō)話或唱歌,生成包含自然表情、唇形同步及全身動(dòng)作的視頻。

責(zé)任編輯: 任麗珺
e公司聲明:文章提及個(gè)股及內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
更多相關(guān)文章
熱門(mén)解讀 更多
視頻推薦 更多
熱門(mén)股票 更多
股票名稱(chēng) 最新價(jià)
漲跌幅