今年,是 AI 在圖像視頻制作領(lǐng)域進(jìn)步很大的一年。
有人拿著 AI 生成的圖像拿走了數(shù)字藝術(shù)大獎(jiǎng),戰(zhàn)勝了一眾人類藝術(shù)家;有 Tiktok 這樣的應(yīng)用通過(guò)文字輸入生成圖片,變?yōu)槎桃曨l的綠幕背景;還有新的產(chǎn)品可以做到文字直接生成視頻,直接實(shí)現(xiàn)「用嘴做視頻」的效果。
(資料圖片僅供參考)
這次的產(chǎn)品來(lái)自深耕人工智能多年,前段時(shí)間才因?yàn)樵钪姹化偪癯爸S的 Meta。
Meta 元宇宙曾被瘋狂嘲諷
只是這次,你不能嘲諷它了,因?yàn)樗娴挠辛诵⊥黄啤?/p>
文字轉(zhuǎn)視頻,能做成什么樣
現(xiàn)在,你可以動(dòng)嘴做視頻了。
這話雖然有點(diǎn)夸張,但 Meta 這次推出的 Make-A-Video 恐怕真是朝著這個(gè)目標(biāo)前進(jìn)的。
目前 Make-A-Video 可以做到的是:
文字直接生成視頻——將你的想象力變成真實(shí)的、獨(dú)一無(wú)二的視頻
圖片直接轉(zhuǎn)為視頻——讓單一圖片或兩張圖片自然地動(dòng)起來(lái)
視頻生成延伸視頻——輸入一個(gè)視頻創(chuàng)建視頻變體
單說(shuō)文字直接生成視頻這個(gè)方面,Make-A-Video 就戰(zhàn)勝了不少專業(yè)的動(dòng)畫設(shè)計(jì)專業(yè)的學(xué)生。至少它什么風(fēng)格都能做,而且制作成本非常低。
雖然官網(wǎng)還不能讓你直接生成視頻體驗(yàn),但你可以先提交個(gè)人資料,之后 Make-A-Video 有任何動(dòng)向都會(huì)先和你分享。
目前可以看到的案例不多,官網(wǎng)展示的案例在細(xì)節(jié)上還有一些怪異的地方。但不管怎么說(shuō),文字可以直接變視頻,本身就是一個(gè)進(jìn)步了。
一只泰迪熊在畫自畫像,你可以看到小熊的手在紙面陰影部分的投影不太自然。
機(jī)器人在時(shí)代廣場(chǎng)跳舞。
貓拿著電視遙控器換臺(tái),貓咪手部爪子和人手極為相似,某些時(shí)候看還覺(jué)得有點(diǎn)驚悚。
還有戴著橙色針織帽的毛茸茸樹懶在擺弄一臺(tái)筆記本電腦,電腦屏幕的光映在它的眼睛里。
上面這些屬于超現(xiàn)實(shí)風(fēng)格,和現(xiàn)實(shí)更相似的案例則更容易穿幫。
Make-A-Video 展示的案例如果只是專注局部表現(xiàn)都不錯(cuò),例如藝術(shù)家在畫布上畫畫的特寫,馬喝水,在珊瑚礁游泳的小魚。
但是稍微寫實(shí)一點(diǎn)的年輕夫婦在大雨中行走就很怪異,上半身還好,下半身的腳忽隱忽現(xiàn),有時(shí)還會(huì)被拉長(zhǎng),如同鬼片。
還有一些繪畫風(fēng)格的視頻,宇宙飛船登陸火星,穿著晚禮服的夫婦被困在傾盆大雨中,陽(yáng)光灑在桌上,會(huì)動(dòng)的熊貓玩偶。從細(xì)節(jié)上看,這些視頻都不夠完美,但僅僅從 AI 文字轉(zhuǎn)視頻的創(chuàng)新效果來(lái)看,還是讓人驚嘆的。
靜態(tài)的油畫也可以在 Make-A-Video 幫助下動(dòng)起來(lái)——船在大浪中前進(jìn)。
海龜在海中游動(dòng),最初的畫面非常自然,后面變得更像綠幕摳圖,不自然。
瑜伽訓(xùn)練者在朝陽(yáng)中舒展身體,瑜伽墊也會(huì)隨著視頻的變化一起變化——這個(gè) AI 就戰(zhàn)勝不了學(xué)習(xí)影視制作的學(xué)生了,控制變量沒(méi)做好。
最后輸入一個(gè)視頻模仿其風(fēng)格創(chuàng)造視頻變體也有 3 種案例。
其中一個(gè)變化相對(duì)來(lái)說(shuō)沒(méi)那么精致。宇航員在太空中飄舞的視頻變?yōu)榱嗣栏猩匀醢姹镜?4 個(gè)粗放版視頻。
小熊跳舞的視頻倒是有不少令人驚喜的變化,至少舞姿有變化了。
至于最后兔子吃草的視頻就是最「安能辨我是雌雄」的類型了,5 個(gè)視頻最后很難認(rèn)出誰(shuí)是初始視頻,看著都蠻和諧。
文字轉(zhuǎn)圖片剛有進(jìn)展,視頻就來(lái)了
在《阿法狗之后,它再次徹底顛覆人類認(rèn)知》中,我們?cè)?jīng)介紹過(guò)圖像生成應(yīng)用 DALL·E。曾有人用它制作出的圖像去和人類藝術(shù)家 PK并最終取勝。
現(xiàn)在我們看到的 Make-A-Video 可以說(shuō)是一個(gè)視頻版本的 DALL·E(初級(jí)版)——它就像 18 個(gè)月前的 DALL·E,有巨大突破,但現(xiàn)在的效果不一定能讓人滿意。
DALL·E 創(chuàng)作的延伸畫作
甚至可以說(shuō),它就是站在巨人 DALL·E 肩膀上做出成就的產(chǎn)品。相較于文字生成圖片,Make-A-Video 并沒(méi)有在后端進(jìn)行太多全新變革。
研究人員在論文中也表示:「我們看到描述文本生成圖片的模型在生成短視頻方面也驚人地有效?!?/p>
描述文本生成圖片的獲獎(jiǎng)作品
目前 Make-A-Video 制作的視頻有 3 個(gè)優(yōu)點(diǎn):
1.
加速了 T2V 模型(文字轉(zhuǎn)視頻)的訓(xùn)練
2.
不需要成對(duì)的文本轉(zhuǎn)視頻數(shù)據(jù)
3.
轉(zhuǎn)化的視頻繼承了原有圖像/視頻的風(fēng)格
這些圖像當(dāng)然有缺點(diǎn),前面提到的不自然都是真實(shí)存在的。而且它們不像這個(gè)年代誕生的視頻,畫質(zhì)模糊,動(dòng)作僵硬,不支持聲音匹配,一段視頻長(zhǎng)度不超過(guò) 5 秒,解析度 64 x 64px 都是硬傷,它們的清晰度遠(yuǎn)遠(yuǎn)不夠。
這個(gè)視頻狗狗舌頭和手有幾幀非常怪異
幾個(gè)月前清華大學(xué)和智源研究院(BAAI)研究團(tuán)隊(duì)發(fā)布的第一個(gè)能根據(jù)文本直接合成視頻的 CogVideo 模型也有這樣的問(wèn)題。它基于大規(guī)模預(yù)訓(xùn)練的 Transformer 架構(gòu),提出了一種多幀率分層訓(xùn)練策略,可以高效的對(duì)齊文本和視頻片段,只是也經(jīng)不起細(xì)看。
但誰(shuí)能說(shuō) 18 個(gè)月后,Make-A-Video 和 CogVideo 制作的視頻不會(huì)比大部分人更好呢?
CogVideo 生成的視頻——這個(gè)目前僅支持中文生成
目前已經(jīng)發(fā)布的文字轉(zhuǎn)視頻工具雖然不多,但在路上的卻有不少。在 Make-A-Video 發(fā)布后,初創(chuàng)企業(yè) StabilityAI 的開(kāi)發(fā)者就公開(kāi)表示:「我們的(文字轉(zhuǎn)視頻應(yīng)用)會(huì)更快更好,適用于更多人。」
有競(jìng)爭(zhēng)才會(huì)更好,越來(lái)越逼真的文字轉(zhuǎn)圖像功能就是最好的證明。
- 看點(diǎn):用嘴做視頻真來(lái)了,Meta 這個(gè)新應(yīng)用太逆天了
- 環(huán)球關(guān)注:下一個(gè)雷曼兄弟?瑞信被傳瀕臨破產(chǎn),股價(jià)今年暴跌60%
- 全球視訊!古人類DNA與重癥新冠有關(guān)?2022諾獎(jiǎng)得主P??bo,竟是前諾獎(jiǎng)得主私生子
- 環(huán)球即時(shí):Zara,一邊走高端,一邊收廢品
- 今日聚焦!2022年9月北京新三板企業(yè)市值TOP100:2成是國(guó)家級(jí)專精特新“小巨人”企業(yè)
- 熱門看點(diǎn):三星手機(jī)在韓國(guó)本土市場(chǎng)份額首次跌破60%
- 天天資訊:中國(guó)國(guó)慶期間寒潮影響加強(qiáng) 南方局地降溫超25℃
- 世界報(bào)道:10月4日德國(guó)DAX30指數(shù)開(kāi)盤上漲1.27% 英國(guó)富時(shí)100指數(shù)上漲0.6%
- 最新資訊:任天堂影業(yè)正式成立:擁有105名員工 11月開(kāi)放招聘
- 全球觀天下!“風(fēng)光”無(wú)限好 山西晉中新能源產(chǎn)業(yè)蓬勃發(fā)展
- 景區(qū)回應(yīng)無(wú)人值守1元午餐被指炒作 景區(qū)負(fù)責(zé)人回應(yīng):要讓游客吃得理直氣壯
- 年輕人去冷門縣城五星級(jí)酒店度假 反向旅游潮為小城帶來(lái)新機(jī)遇
- 男子遭反向抹零被問(wèn)你差那一毛錢嗎?收銀員表示:是正常的“四舍五入”抹零
- 蘋果供應(yīng)商新增六家中國(guó)公司 包括中科三環(huán)、深圳市乾德電子等
- 沉浸式消費(fèi)經(jīng)營(yíng)場(chǎng)所數(shù)量暴增400% 各地打造新型主題小鎮(zhèn)助力鄉(xiāng)村振興
- 特斯拉市值一日蒸發(fā)5000億 下跌幅度相當(dāng)于三個(gè)理想汽車市值
- 微動(dòng)態(tài)丨“天價(jià)”露營(yíng),割今年最后一波韭菜
- 天天熱門:2022年輕人如廁報(bào)告:躲在廁所隔間不出來(lái)的同事,都在偷偷做什么?
- 環(huán)球今日訊!太原市確定煤炭供給工作目標(biāo) 今年力爭(zhēng)達(dá)到4850萬(wàn)噸
- 世界觀熱點(diǎn):封鎖泄漏點(diǎn) 刑事調(diào)查!“北溪”管道 最新消息→
- 北京抽檢月餅全部合格 涉及全國(guó)各地61家食品生產(chǎn)
- 富陽(yáng)電動(dòng)自行車監(jiān)管實(shí)現(xiàn)“雙百” 電動(dòng)自行車全鏈條
- 淮北黨建促融合引導(dǎo)外賣送餐行業(yè)發(fā)展 壓實(shí)網(wǎng)絡(luò)餐
- 安徽聯(lián)合整治網(wǎng)絡(luò)市場(chǎng)突出問(wèn)題 規(guī)范競(jìng)爭(zhēng)秩序
- 福建四部門聯(lián)合發(fā)文守護(hù)秋季學(xué)校食品安全 嚴(yán)厲打
- 黑龍江:“你點(diǎn)我檢”進(jìn)超市 為消除廣大消費(fèi)者對(duì)
- 上海中秋假期投訴舉報(bào)情況顯示:一般食品、化妝品等
- 遼寧阜新:試點(diǎn)“市場(chǎng)監(jiān)管網(wǎng)格化” 推進(jìn)全員下沉參
- “土榨油”真的就那么好嗎?食用“土榨油”要持謹(jǐn)慎
- 街頭維修廣告騙局多 消費(fèi)者切勿被“李鬼”蒙蔽要
- 1 看點(diǎn):用嘴做視頻真來(lái)了,Meta 這個(gè)新應(yīng)用太逆天了
- 2 環(huán)球關(guān)注:下一個(gè)雷曼兄弟?瑞信被傳瀕臨破產(chǎn),股價(jià)
- 3 全球視訊!古人類DNA與重癥新冠有關(guān)?2022諾獎(jiǎng)得主P
- 4 環(huán)球即時(shí):Zara,一邊走高端,一邊收廢品
- 5 今日聚焦!2022年9月北京新三板企業(yè)市值TOP100:2成
- 6 熱門看點(diǎn):三星手機(jī)在韓國(guó)本土市場(chǎng)份額首次跌破60%
- 7 天天資訊:中國(guó)國(guó)慶期間寒潮影響加強(qiáng) 南方局地降溫
- 8 世界報(bào)道:10月4日德國(guó)DAX30指數(shù)開(kāi)盤上漲1.27% 英國(guó)
- 9 最新資訊:任天堂影業(yè)正式成立:擁有105名員工 11
- 10 全球觀天下!“風(fēng)光”無(wú)限好 山西晉中新能源產(chǎn)業(yè)蓬