男人天堂aa|色戒完整版从哪里能看|久久黄视频|五月天av网,蝙蝠侠成人h版未删减版,国产精品嫩,惩罚者在线观看完整版电影免费

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

春節(jié)AI視頻“技術(shù)擂臺(tái)”:Seedance 2.0被稱“地表最強(qiáng)”,可靈3.0“電影感”能否反超?實(shí)測(cè)來(lái)了

2026-02-09 20:33:59

2月4日晚間,可靈AI 3.0系列全新上線并啟動(dòng)內(nèi)測(cè),強(qiáng)調(diào)從“生成畫(huà)面”邁向“理解創(chuàng)作語(yǔ)言”。每經(jīng)記者實(shí)測(cè)顯示,其“智能分鏡”初步具備鏡頭調(diào)度意識(shí),多語(yǔ)言敘事升級(jí),“一致性”從“主題不崩壞”升至“跨模態(tài)統(tǒng)一”。不過(guò),普通用戶使用仍有門檻,且C端普及度尚難與免費(fèi)大模型抗衡。新的一年,可靈AI需扛住國(guó)內(nèi)科技大廠的強(qiáng)勢(shì)沖擊。

每經(jīng)記者|王郁彪    每經(jīng)編輯|余婷婷    

AI(人工智能)超級(jí)入口競(jìng)賽正酣,穩(wěn)坐國(guó)內(nèi)AI商業(yè)化第一陣營(yíng)的快手“可靈AI”,自然也不會(huì)放過(guò)春節(jié)前這波沖量的機(jī)會(huì)。

2月4日晚間,可靈AI官宣上線可靈AI 3.0系列——“All-in-One”多模態(tài)輸入與輸出的大一統(tǒng)模型體系,包括視頻3.0、視頻3.0 Omni與圖片3.0、圖片3.0 Omni,目前已面向黑金、鉆石、鉑金會(huì)員上線,近期將全量開(kāi)放。這也意味著,可靈AI在不到兩年時(shí)間里完成了三次關(guān)鍵升級(jí)。與此前解決“多任務(wù)統(tǒng)一”與“基礎(chǔ)一致性”的可靈AI O1模型相比,可靈AI 3.0強(qiáng)調(diào)從“生成畫(huà)面”邁向“理解創(chuàng)作語(yǔ)言”。

2月9日,知名科普博主“影視颶風(fēng)”的一則評(píng)測(cè)視頻讓字節(jié)跳動(dòng)旗下視頻生成模型Seedance 2.0“出圈”,評(píng)測(cè)顯示其在視頻大范圍運(yùn)動(dòng)、分鏡、音畫(huà)匹配等方面均有突破。游戲科學(xué)CEO(首席執(zhí)行官)馮驥當(dāng)天也在微博公開(kāi)評(píng)價(jià)了Seedance 2.0,甚至直呼“當(dāng)前地表最強(qiáng)的視頻生成模型,沒(méi)有之一”。


圖片來(lái)源:Bilibili官網(wǎng)截圖

此外,同日還有消息稱小紅書(shū)技術(shù)團(tuán)隊(duì)正研發(fā)視頻剪輯類AI產(chǎn)品OpenStoryline,目前尚在測(cè)試階段,后續(xù)或開(kāi)源。雖然小紅書(shū)方面暫未回應(yīng),但國(guó)內(nèi)大模型公司這波“瘋狂更新”疊加春節(jié)“紅包大戰(zhàn)”的如期到來(lái),無(wú)疑引爆了2026年AI競(jìng)賽的整體態(tài)勢(shì)。

單純比拼模型實(shí)力的賽段或?qū)⒊蔀檫^(guò)去,搶用戶、爭(zhēng)入口、拼規(guī)模,已然是一場(chǎng)“生死戰(zhàn)”。在最新這波春節(jié)“技術(shù)擂臺(tái)”中,可靈3.0究竟有沒(méi)有機(jī)會(huì)反超?《每日經(jīng)濟(jì)新聞》記者獲得了為數(shù)不多的超前內(nèi)測(cè)名額,一測(cè)究竟。

實(shí)測(cè)可靈AI 3.0“智能分鏡”:初步具備鏡頭調(diào)度意識(shí)

據(jù)官方介紹,可靈AI 3.0系列模型不再局限于生成畫(huà)面,而是開(kāi)始理解視頻創(chuàng)作本身。具體有何表現(xiàn)?可靈AI方面向《每日經(jīng)濟(jì)新聞》記者表示,這一能力主要體現(xiàn)在鏡頭關(guān)系、敘事節(jié)奏、角色邏輯與視聽(tīng)語(yǔ)言等方面。AI視頻模型開(kāi)始理解鏡頭、運(yùn)鏡、節(jié)奏和上下文關(guān)聯(lián),可針對(duì)臺(tái)詞設(shè)計(jì)分鏡、搭配畫(huà)外音,對(duì)各類高階視聽(tīng)語(yǔ)言需求均能作出響應(yīng)。

每經(jīng)記者實(shí)測(cè)了可靈AI 3.0“智能分鏡”功能,并輸入包含專業(yè)名詞的復(fù)雜提示詞:“超高速動(dòng)漫戰(zhàn)斗,電影攝像機(jī)并行飛行,劇烈震動(dòng)以展示規(guī)模感,運(yùn)用遠(yuǎn)、全、中、近、特寫(xiě)不同景別,結(jié)合俯拍與仰拍視角。”

從生成視頻效果來(lái)看,可靈AI 3.0生成了包含全景展現(xiàn)場(chǎng)面、中近景聚焦角色搏斗、特寫(xiě)捕捉?jīng)_擊波和面部表情的連貫視頻。打斗場(chǎng)面連貫性強(qiáng),不再是隨機(jī)堆砌炫酷畫(huà)面,而是有意識(shí)地運(yùn)用鏡頭語(yǔ)言來(lái)服務(wù)“戰(zhàn)斗的暴力感與規(guī)模感”這一核心敘事。

圖片來(lái)源:可靈AI3.0智能分鏡功能實(shí)測(cè)截圖

這說(shuō)明可靈AI 3.0初步具備鏡頭調(diào)度意識(shí)。對(duì)于普通用戶而言,這意味著用相對(duì)專業(yè)的術(shù)語(yǔ)描述想法,就有可能獲得結(jié)構(gòu)成熟、富有電影感的短片,在一定程度上降低了專業(yè)敘事影像的制作門檻。

此外,在多角色、多語(yǔ)言敘事上,可靈AI 3.0系列模型也有升級(jí)。

這一輪測(cè)試,每經(jīng)記者輸入了簡(jiǎn)單的提示詞:“一人說(shuō)優(yōu)雅英式英語(yǔ),一人說(shuō)美式英語(yǔ),一人穿插日語(yǔ)臺(tái)詞。”從生成效果能夠看出,一是音畫(huà)同步有明顯提升,二是支持多語(yǔ)言與方言混說(shuō)。

圖片來(lái)源:可靈AI 3.0功能實(shí)測(cè)截圖

記者實(shí)測(cè)后發(fā)現(xiàn),視頻中不同角色說(shuō)不同語(yǔ)言時(shí),口型、面部肌肉運(yùn)動(dòng)甚至神態(tài)情緒都與語(yǔ)音高度匹配。這無(wú)疑將AI視頻長(zhǎng)期“對(duì)口型”不準(zhǔn)的尷尬問(wèn)題向前推進(jìn)了一步。官方介紹稱,模型通過(guò)“原生跨模態(tài)音頻引擎”,實(shí)現(xiàn)了音色還原與提示詞指代的精確對(duì)齊。而官方支持中文多種方言,也為本土化內(nèi)容創(chuàng)作打開(kāi)了空間。

值得注意的是,“智能分鏡”已成為快手、字節(jié)跳動(dòng)本輪技術(shù)升級(jí)的重點(diǎn),在科普博主“影視颶風(fēng)”最新發(fā)布的字節(jié)視頻模型Seedance 2.0的評(píng)測(cè)中,影視颶風(fēng)創(chuàng)始人Tim高度稱贊其生成視頻的精細(xì)度、分鏡連續(xù)性及音畫(huà)匹配度等。比如,Tim稱其分鏡具有“明顯的角度切換”,能夠像真人導(dǎo)演一樣不斷改變攝影機(jī)的位置,并直言其是“改變視頻行業(yè)的AI”。

“一致性”升級(jí):從“主題不崩壞”到“角色、表演、語(yǔ)音、敘事的跨模態(tài)統(tǒng)一”

“一致性”幾乎是AI視頻創(chuàng)作中最難攻克的問(wèn)題。其不僅包括人物主體一致性,如人物不崩壞、動(dòng)作連續(xù)等,還包括時(shí)序的一致性即長(zhǎng)鏡頭、多鏡頭銜接穩(wěn)定;場(chǎng)景與風(fēng)格一致性,即多風(fēng)格同框仍自然協(xié)調(diào);多語(yǔ)言輸出一致性,即跨語(yǔ)言版本仍保持視覺(jué)與角色統(tǒng)一等。

此外,商業(yè)一致性,即文字可用、不變形,商品與Logo(品牌標(biāo)志)穩(wěn)定等也同樣重要。視頻生成高度一致性的保持,是決定AI視頻是否可以實(shí)現(xiàn)“直接交付”的關(guān)鍵。

每經(jīng)記者將此前實(shí)測(cè)可靈AI 2.6模型時(shí)使用的同一提示詞——“《瘋狂動(dòng)物城》里的兔子朱迪和狐貍尼克,正在跳雙人華爾茲的舞蹈,場(chǎng)景在水晶王宮的舞會(huì)上,添加其他舞會(huì)成員”輸入至3.0模型進(jìn)行了對(duì)比測(cè)試。結(jié)果發(fā)現(xiàn),3.0模型在一致性提升方面相對(duì)明顯。

圖片來(lái)源:可靈AI 3.0功能實(shí)測(cè)截圖

首先是人物主體的一致性。記者發(fā)現(xiàn),3.0模型在快速動(dòng)作時(shí)主體沒(méi)有崩壞痕跡;其次是風(fēng)格與場(chǎng)景一致性,2.6模型在補(bǔ)充“其他舞會(huì)成員”時(shí)模糊處理了場(chǎng)景、風(fēng)格,而3.0模型則相對(duì)保持風(fēng)格一致。此外,兩款模型在語(yǔ)義理解上差異明顯,3.0模型生成的主體人物更接近描述要求。同時(shí),3.0模型的智能分鏡功能可以為靜態(tài)提示詞補(bǔ)充分鏡設(shè)計(jì),讓視頻更具看點(diǎn)和觀感。在多角色表現(xiàn)上,3.0模型能讓角色在完成動(dòng)作的同時(shí),保持語(yǔ)音情緒、音色準(zhǔn)確以及風(fēng)格的相對(duì)統(tǒng)一。

圖片來(lái)源:可靈AI 3.0功能實(shí)測(cè)截圖

整體而言,在3.0體系下,“一致性”已從“主體不崩壞”升級(jí)為“角色、表演、語(yǔ)音、敘事邏輯的跨模態(tài)統(tǒng)一”。這使得從創(chuàng)意到成品的視頻生成流程變得相對(duì)省時(shí)省力,尤其適用于需要強(qiáng)表現(xiàn)力的交付場(chǎng)景等。對(duì)于普通C端(消費(fèi)者)用戶而言,能夠快速獲得觀感良好的視頻成品,體驗(yàn)感明顯提升。

對(duì)于一致性的提升,可靈AI方面告訴記者,可靈AI 3.0 是“ All-in-One”的多模態(tài)視頻模型,即通過(guò)一個(gè)模型實(shí)現(xiàn)文字、圖片、聲音、視頻等多模態(tài)信息的輸入與輸出?!癆ll-in-One”并非功能堆疊,而是通過(guò)一體化模型實(shí)現(xiàn)更為原生的多模態(tài)交互。

值得一提的是,從字節(jié)視頻模型Seedance2.0的測(cè)評(píng)效果,馮驥在微博中也提及:“AI理解多模態(tài)信息(文、畫(huà)、影、音)并整合的能力完成了一次飛躍,令人驚嘆?!?/p>

普通用戶使用門檻依然較高

整體實(shí)測(cè)下來(lái)記者發(fā)現(xiàn),對(duì)于普通C端用戶而言,這個(gè)從靜態(tài)概念到動(dòng)態(tài)影片的視頻創(chuàng)作流程仍需相對(duì)專業(yè)的操作,使用起來(lái)有一定的門檻。特別是在利用3.0 Omni對(duì)內(nèi)容進(jìn)行修改時(shí),若提示詞輸入不夠?qū)I(yè),視頻往往需要反復(fù)抽卡。

每經(jīng)記者用國(guó)產(chǎn)大模型DeepSeek生成了一個(gè)復(fù)雜提示詞,實(shí)測(cè)整個(gè)視頻生成的場(chǎng)景推演流程。

第一步:用“圖片3.0”完成構(gòu)思。利用其“強(qiáng)化影視級(jí)敘事畫(huà)面”和“4K輸出”能力,生成一張電影級(jí)角色設(shè)定圖或場(chǎng)景氛圍圖。

圖片來(lái)源:可靈AI 3.0功能實(shí)測(cè)截圖

第二步:用“視頻3.0”實(shí)現(xiàn)動(dòng)態(tài)化。將上圖作為“圖生視頻+主體參考”輸入,通過(guò)“自定義分鏡”功能精確規(guī)劃每個(gè)鏡頭的時(shí)長(zhǎng)、景別,生成一段有敘事節(jié)奏的動(dòng)態(tài)視頻。

圖片來(lái)源:可靈AI 3.0功能實(shí)測(cè)截圖

第三步:用“視頻3.0 Omni”進(jìn)行替換與精修。將原生成視頻中的數(shù)字角色,替換成此前測(cè)試一致性時(shí)所用提示詞中的《瘋狂動(dòng)物城》朱迪這個(gè)主體。

從視頻生成效果來(lái)看,3.0模型在“主體相似度更穩(wěn)定”“對(duì)文本指令響應(yīng)更靈敏”上有進(jìn)步,復(fù)雜敘事的可控性也有一定提升。

圖片來(lái)源:可靈AI 3.0功能實(shí)測(cè)截圖

綜合來(lái)看,3.0系列這一升級(jí)更偏向可靈AI當(dāng)前主要的P端(指自媒體視頻創(chuàng)作者和廣告營(yíng)銷從業(yè)者等專業(yè)用戶)用戶或?qū)I(yè)團(tuán)隊(duì),普通C端用戶很難完整執(zhí)行這個(gè)創(chuàng)作流程。對(duì)于個(gè)人創(chuàng)作者、小團(tuán)隊(duì)而言,它將傳統(tǒng)流程上需要多個(gè)軟件、反復(fù)導(dǎo)入導(dǎo)出的“概念設(shè)計(jì)—預(yù)演—實(shí)拍合成”環(huán)節(jié)壓縮在單一平臺(tái)內(nèi),一定程度上降低了實(shí)驗(yàn)成本等。

貼近C端市場(chǎng)才是可靈AI的大考

近段時(shí)間,多家國(guó)產(chǎn)大模型廠商幾乎同步更新模型進(jìn)展。阿里千問(wèn)、DeepSeek與月之暗面Kimi紛紛下場(chǎng)參賽。從此次各家更新方向來(lái)看,大模型的能力進(jìn)階以及市場(chǎng)競(jìng)爭(zhēng)的焦點(diǎn),已然跳出了單純比拼參數(shù)與輸出表現(xiàn)的階段,邁向了工程化階段。

但與大語(yǔ)言模型有所不同,視頻生成模型在C端用戶特別是國(guó)內(nèi)用戶的日常使用場(chǎng)景中相對(duì)低頻,且天然具備更高使用門檻,可靈想要與阿里千問(wèn)、騰訊元寶以及字節(jié)跳動(dòng)豆包等搶食C端市場(chǎng)蛋糕,難度更大。

對(duì)于普通用戶而言,使用全新可靈AI 3.0模型生成一次高質(zhì)量的3秒到15秒視頻,需要耗費(fèi)36至180“靈感值”(可靈AI貨幣),其在C端的普及度現(xiàn)階段依舊很難與免費(fèi)的大語(yǔ)言模型抗衡。

隨著OpenAI正式發(fā)布第二代AI視頻生成模型Sora 2,并將視頻生成與社交互動(dòng)深度融合,C端消費(fèi)級(jí)應(yīng)用的落地進(jìn)程明顯加快。2025年12月,阿里千問(wèn)App(應(yīng)用程序)第一時(shí)間接入了萬(wàn)相2.6視覺(jué)大模型,全力對(duì)標(biāo)Sora 2。記者了解到,萬(wàn)相2.6支持音畫(huà)同步、多鏡頭生成及聲音驅(qū)動(dòng)等功能,號(hào)稱“全球功能最全的視頻生成模型”。

快手科技創(chuàng)始人兼首席執(zhí)行官程一笑在2025年三季度財(cái)報(bào)電話會(huì)上指出,“當(dāng)前我們的主要精力依然是面向?qū)I(yè)創(chuàng)作者,但未來(lái)也會(huì)將可靈的技術(shù)能力進(jìn)一步產(chǎn)品化,與社交互動(dòng)結(jié)合,加速C端應(yīng)用的商業(yè)化”。從目前情況來(lái)看,上述產(chǎn)品化思路尚未落地兌現(xiàn),可靈AI仍聚焦于模型能力的進(jìn)化迭代。

事實(shí)上,2025年年底,豆包已開(kāi)始向抖音商城導(dǎo)流——當(dāng)用戶詢問(wèn)選購(gòu)意見(jiàn)時(shí),豆包會(huì)直接推薦商品并附上來(lái)自抖音商城的購(gòu)買鏈接。由此可見(jiàn),可靈AI的產(chǎn)品化以及與整個(gè)快手生態(tài)的聯(lián)動(dòng)可能會(huì)變得更加緊迫。新的一年,可靈AI還要持續(xù)面對(duì)來(lái)自阿里、字節(jié)等國(guó)內(nèi)科技大廠的輪番轟炸式“襲擊”,快手只能既快又穩(wěn)。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

1

0