創(chuàng )澤機器人 |
CHUANGZE ROBOT |
技術(shù)趨勢:視頻生成正在由檢索生成、局部生成走向依靠自然語(yǔ)言提示詞的全量生成,生成內容更加靈活豐富,應用空間廣闊
檢索生成主要是對現有的視頻素材根據關(guān)鍵詞和標簽進(jìn)行檢索匹配,再進(jìn)行相應的拼接和排列組合
特點(diǎn)
1 采用傳統的跨模態(tài)視頻檢索技術(shù),通過(guò)視頻標 簽的或者視頻語(yǔ)義理解的方式從數據庫中的檢 索,再將這些素材進(jìn)行剪輯、組合拼接在一起, 本質(zhì)上還是鍵值對匹配的邏輯
2 例如短視頻平臺的知識類(lèi)視頻、解說(shuō)類(lèi)視頻, 通過(guò)文本關(guān)鍵字在數據庫中進(jìn)行素材檢索,然 后在進(jìn)行拼接組合生成
3 創(chuàng )意空間有限,沒(méi)有貢獻增量素材,但成本極 低,生成速度極快
僅針對視頻的一部分進(jìn)行生 成,例如視頻中人物角色、 動(dòng)作、背景、風(fēng)格化、特殊 效果等
特點(diǎn)
1 采用傳統的計算機視覺(jué)(Cv)、計算機圖形學(xué) (CG)技術(shù),但生成功能有限,主要是一些局 部的垂點(diǎn)功能
2 例如效果生成,在現有視頻上添加多種效果, 如濾鏡、光影、風(fēng)格化、美顏特效等。也可以 做局部動(dòng)態(tài)化,如人物的面部表情生成、搞笑 表情、爆款特效、舞蹈動(dòng)作生成等
3 有一定創(chuàng )意空間,生成部分新元素,成本低但 應用的場(chǎng)景有限
通過(guò)文字、圖片、視頻作為提示 詞來(lái)進(jìn)行憑空生成,不依賴(lài)外部 素材,核心在于大模型的能力
特點(diǎn)
1 采用基于Transformer或者擴散模型的大模型路 線(xiàn),可以通過(guò)自然語(yǔ)言或者指導圖進(jìn)行全局生成 (但也可以嵌入已有內容),視頻的內容、風(fēng)格、 長(cháng)短、分辨率、寬高比都可以進(jìn)行靈活調整
2 例如生成天馬行空的創(chuàng )意視頻、藝術(shù)視頻、卡通 視頻等等,非常靈活
3 創(chuàng )意空間無(wú)限,所有的元素都是全新生成,現 階段成本高昂,但天花板高,應用場(chǎng)景廣泛
附件:AI視頻生成研究報告-由檢索生成、局部生成走向依靠自然語(yǔ)言提示詞的全量生成
![]() |
機器人底盤(pán) Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動(dòng)機器人底盤(pán) 商用機器人 智能垃圾站 智能服務(wù)機器人 大屏機器人 霧化消毒機器人 紫外線(xiàn)消毒機器人 消毒機器人價(jià)格 展廳機器人 服務(wù)機器人底盤(pán) 核酸采樣機器人 智能配送機器人 導覽機器人 |