文生視頻大模型Sora已經(jīng)發(fā)布一個多月,其所帶來的震撼依然在業(yè)內(nèi)延續(xù)。這是繼ChatGPT后,OpenAI再次向行業(yè)投入一枚深水炸彈。
據(jù)介紹,Sora可以根據(jù)簡單提示生成最長一分鐘,多種風格、不同畫幅、多視角的高清圖片。在廣為流傳的一則Sora生成的視頻中,一個穿著時尚的女子走在東京街頭,背景中繁華街景、女人墨鏡反射的細節(jié)、皮膚的瑕疵都清晰可見,該視頻包含中景、近景、遠景等多個鏡頭,展示的效果相比其他的文生視頻模型如Runway、Pika等有了顯著提升。
“Sora這類視頻生成模型是世界的模擬器?!監(jiān)penAI在報告中說道,這種模擬能力使 Sora 能夠生成更加接近真實世界運行的視頻內(nèi)容。
這枚炸彈的威力仍在緩慢釋放,百模大戰(zhàn)仍在繼續(xù)。數(shù)月前,艾倫人工智能研究所發(fā)布新一代大模型,Unified-IO 2。數(shù)日前,被稱為“OpenAI 最強競爭對手之一”的Anthropic發(fā)布了最新人工智能Claude 3系列模型(包括了 Opus、Sonnet、Haiku 三款產(chǎn)品),其中功能最強大的Opus智能程度堪比人類。此外,業(yè)界也在翹首期盼GPT-5的到來。
這場無法忽視的技術(shù)革命,給技術(shù)領域和視頻領域帶來的沖擊也是無法忽視的,尤其是以抖音為代表的短視頻領域,Sora一旦投入使用必將對眼下短視頻的內(nèi)容和商業(yè)模式產(chǎn)生一定的影響。
面對技術(shù)浪潮,抖音也沒有被動“躺平”。抖音正嘗試突破慣性的力量,10年元老員工張楠辭去抖音集團CEO一職,全力聚焦剪映,這也讓原本一直“默默無聞”的剪映逐漸走進大眾視線;此外,字節(jié)跳動加大對AI的投入力度,成立新AI部門Flow,抽調(diào)多個業(yè)務部門人才加入,接連推出一系列AI產(chǎn)品。
字節(jié)跳動的危機感、國際視野和創(chuàng)新意識在Sora到來之際,全面顯現(xiàn)。
01
抖音的焦慮
盡管Sora并不完美,但沒有人能否認它的出現(xiàn)是AI領域的一次新的革命。首先,它生成視頻時長最長可達60秒,遠超市面上主流的如Runway、Pika、SVD等AI視頻生成工具。
其次,Sora生成的視頻畫面復雜度和精細度令人震撼。飄落的櫻花落在行人的肩頭,形成了細碎的櫻花雪。小船在波濤中打轉(zhuǎn),卷起的浪隨漩渦運動,蕩出泡沫樣的浪花……這都表明,Sora不僅對提示詞有著精準的理解力,同時邏輯上靠近現(xiàn)實的物理世界。
對于內(nèi)容和商業(yè)生態(tài)高度依賴短視頻的抖音而言,Sora的出現(xiàn)就像異星文明登陸,難免心生恐慌?!肮緦用娴陌肽甓燃夹g(shù)回顧,直到2023年才開始討論GPT,而業(yè)內(nèi)做得比較好的大模型創(chuàng)業(yè)公司都是在2018年至2021年創(chuàng)立的?!弊止?jié)跳動舉行2024年年度全員會時,CEO梁汝波表達了對新技術(shù)的焦慮。
梁汝波的焦慮并非沒有原因。一方面,對于抖音和TikTok而言,1分鐘以內(nèi)視頻占內(nèi)容池大多數(shù)。一個可供參考的數(shù)據(jù)是,目前抖音上短劇的單集時長就是1分鐘上下,介乎內(nèi)容推進和用戶耐性閾值之間。作為內(nèi)容平臺,抖音和TikTok很難被替代,但其內(nèi)容生態(tài)勢必將被Sora和其他文生視頻產(chǎn)品輸出的內(nèi)容震蕩。
更重要的影響在創(chuàng)作端,Sora對傳統(tǒng)的剪輯產(chǎn)品將形成降維打擊,Sora本質(zhì)上降低了視頻的創(chuàng)作門檻,用戶可以通過其生產(chǎn)大量內(nèi)容,這種基于語言交互界面和對話結(jié)果產(chǎn)生方式將改變以往專業(yè)操作所需的流程,并且生成的視頻充滿細節(jié)。而Sora開源后,用戶貢獻的素材內(nèi)容能豐富數(shù)據(jù)資源增加訓練樣本,Sora表現(xiàn)將更加驚艷。
這意味著未來內(nèi)容和剪輯可能合二為一,AI將重塑內(nèi)容產(chǎn)品形態(tài)與功能,單一性功能工具產(chǎn)品的市場空間會受到影響,也就是說,抖音目前面臨的競爭對手不僅僅是騰訊和阿里,還包括Sora。
事實上,在Sora出現(xiàn)之前,抖音已經(jīng)著手AI領域的“再次創(chuàng)業(yè)”。梁汝波在全員會的講話上多次提到危機感,他特別提到公司喪失對機會的敏感度。
實際上,讓剪映再次受到關(guān)注的是今年年初的一則消息,張楠辭去抖音CEO,把精力聚焦在剪映的發(fā)展上,親自帶隊尋求在AI輔助創(chuàng)作上有所突破。
剪映于2019年上線,2021年剪映專業(yè)版 Windows正式上線,自此剪映實現(xiàn)全終端覆蓋。公開信息顯示,上線三年里剪映相關(guān)產(chǎn)品高速發(fā)展,截至2021年,剪映的月活用戶已經(jīng)突破1億,是國內(nèi)最大的移動視頻編輯產(chǎn)品。
剪映最開始被視為一個依附于抖音的工具App,除視頻剪輯、編輯等基本功能之外,剪映還通過提供剪輯模板,豐富的素材庫以及視頻創(chuàng)作課堂,來降低視頻創(chuàng)作成本并向新手提供專業(yè)教學,實現(xiàn)邊學邊剪,同時還能激發(fā)用戶創(chuàng)意。隨著剪映功能逐漸強大,其已經(jīng)成為視頻剪輯最常用的工具之一。
創(chuàng)業(yè)者出身、從0到1推出了抖音的字節(jié)跳動十年元老張楠確實是上佳人選。在她的帶領下,抖音成為一款國民級的短視頻產(chǎn)品,深度改造了國內(nèi)的娛樂內(nèi)容生態(tài)。此外,她也明確表達出“重新創(chuàng)業(yè)”的意愿,在內(nèi)部信中展現(xiàn)出將突破AI視為使命的態(tài)度,在她看來,AI不是要艱難攻克的某項技術(shù),而是必須要抓住的風口,不可錯過的機遇。
張楠在內(nèi)部信中提到,AI圖像生成對她產(chǎn)生了“很大的觸動”,她認為這項技術(shù)將給內(nèi)容創(chuàng)作工具行業(yè)帶來巨大的變化和可能性,改變創(chuàng)作者橫跨多個產(chǎn)品、經(jīng)過復雜的編輯才能完成表達的現(xiàn)狀。同時,她在個人朋友圈中也表示,2024年是她加入公司的第十年,希望在下一個十年再折騰一些熱愛的事情,跟著這個AI時代一起成長。
如果說,張楠是最佳人選,剪映就是抖音突圍Sora的最佳產(chǎn)品抓手。
目前,國內(nèi)短視頻行業(yè)觸達天花板,中國互聯(lián)網(wǎng)絡信息中心2023年3月發(fā)布的第51次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》顯示,中國網(wǎng)民規(guī)模達10.67億,短視頻用戶規(guī)模達10.12億,滲透率高達94.8%。
正如抖音、快手曾經(jīng)沖擊增長見頂?shù)膼蹆?yōu)騰,引發(fā)一場用戶時間爭奪的大戰(zhàn)那樣,文生圖、文生視頻、甚至AGI,將是未來互聯(lián)網(wǎng)內(nèi)容平臺、科技公司未來的競爭籌碼,將重塑下一輪平臺競爭的格局。
AI在視頻創(chuàng)作與在線視頻廣告中都起到了重要的推動作用,而這兩個領域都是抖音的護城河,因此抖音選擇從剪映入手加強在AI領域的布局也被認為是理所當然的一個選擇,同時,這也可能是抖音在信息平臺和電商業(yè)務之外尋找新的增長點的一個嘗試。
目前,剪映已經(jīng)擁有了相當體量的用戶,剪映一側(cè)綁定創(chuàng)作者生態(tài),另一側(cè)綁與內(nèi)容生產(chǎn)、視頻平臺深度鏈接,實現(xiàn)了工具-內(nèi)容-產(chǎn)品的閉環(huán)。
實際上,張楠在卸任抖音CEO前一年已經(jīng)將精力傾斜到剪映上,從成果來看,過去一年剪映推出了一鍵成片、AI克隆音色、數(shù)字人口播等AI功能,為創(chuàng)作者提供智能寫文案、智能匹配素材和配音,大大提高制作效率、降低成本。
剪映新功能
此外,去年AI圖片創(chuàng)作和繪畫工具“Dreamina”開始內(nèi)測,它能根據(jù)用戶文字提示,快速生成四幅由AI創(chuàng)造的圖片,這些圖片展現(xiàn)出不同的風格,支持修整圖片大小比例和模板類型。最近這一產(chǎn)品又開始邀請AI視頻創(chuàng)作者內(nèi)測文生視頻,Dreamina AI 視頻功能有望后續(xù)上線。
圖源:Dreamina官網(wǎng)
02
剪映是否會被取代
就在張楠上任剪映一周后,OpenAI正式推出Sora,有聲音認為,剪映將成為中國 AI 應用最先爆發(fā)的產(chǎn)品。
盡管Sora有著無可匹敵的技術(shù)條件,但是Sora無法取代抖音和剪映。一方面,Sora仍然存在明顯的缺陷,翻看OpenAI發(fā)布的一系列視頻,可以發(fā)現(xiàn)Sora在理解物理運動規(guī)律上仍有缺陷,這個問題具體表現(xiàn)為東京街頭時尚女人錯誤的腳步交錯、人物靠近燃燒的蠟燭火苗卻紋絲不動等。
另一方面,抖音上線近10年,構(gòu)建了龐大的創(chuàng)作者生態(tài)和內(nèi)容生態(tài),背后基于生活的經(jīng)驗與敘事,很難被輕易取代。一個可供參考的態(tài)度是,好萊塢影視創(chuàng)作者認為,Sora影響的將是視覺特效和動畫行業(yè),它目前更像一個科技公司的產(chǎn)品演示,而不是一個可以敘事的作品。
更從底層的邏輯而言,剪映與Sora并不是一類產(chǎn)品,使用場景不同。前者基于圖片和視頻編輯,用戶使用需要一定的時間和精力成本。后者大大降低不同內(nèi)容形式間轉(zhuǎn)化的門檻,不少專業(yè)人士認為Sora的應用層面超越工具,將很快走入更專業(yè)的影視創(chuàng)作、視覺特效等創(chuàng)作行業(yè)。
對于Sora是否會取代剪映的問題,DCCI互聯(lián)網(wǎng)研究院院長劉興亮在參與《Sora出圈,普通人如何挖到“第一桶金”?》的討論時也給出了否定答案,他指出,剪映和Sora是兩個不同的工具,在視頻制作過程中有各自的應用場景。雖然可以使用Sora生成視頻素材,并結(jié)合其他工具進行整合編輯,但這并不能替代專業(yè)操作所需的剪映軟件。
盡管,Sora 并不能取代剪映,但是剪映也必須作出改變,如果剪映不能跟隨技術(shù)的趨勢作出改變,必將被其他競品所取代,剪映也看到了這一危機。
從剪映陸續(xù)推出的新功能來看,它未來更可能成為一款集成式的AIGC創(chuàng)作工具,降低不同形式內(nèi)容的創(chuàng)作及轉(zhuǎn)化門檻,或?qū)⒊蔀橄乱豢畛堿PP。
梁汝波曾在發(fā)言中多次提及“危機感”,并將“加強危機感”列入年度目標,他表示,最大的危機感,是擔心字節(jié)作為一個組織,正在變得平庸,無法取得新的突破。
慣性是互聯(lián)網(wǎng)大廠的通病,在上一個十年,字節(jié)跳動憑借抖音打破BAT的內(nèi)容生產(chǎn)慣性,電商、長視頻和信息流等產(chǎn)業(yè)都被深度重塑。而當下,BAT均已加入生成式AI的洪流,字節(jié)跳動卻落后一步。
2023年3月,百度率先發(fā)布文心一言,同年10月便迭代至4.0版,全面提升理解、生成、邏輯和記憶四大人工智能基礎能力,年底用戶規(guī)模突破1億。阿里的通義千問于同年4月面世,而相對保守的字節(jié)跳動和騰訊,都直到2023年下半年才分別發(fā)布云雀大模型和混元助手。
圖源:使用文心一言生成
關(guān)于“危機感”,梁汝波給出了解題思路,字節(jié)跳動2024年的關(guān)鍵詞是“始終創(chuàng)業(yè),逃逸平庸的重力”。
目前字節(jié)跳動正在加大對AI的研發(fā)投入。據(jù)悉,去年年底字節(jié)跳動成立了一個專注于 AI 創(chuàng)新業(yè)務的新部門 Flow,并且抽調(diào)了內(nèi)部高層管理與業(yè)務骨干擔任該部門的相應負責人。Flow部門目前已經(jīng)上線了豆包、Coze/扣子、AI角色互動APP“話爐”等AI產(chǎn)品,此外,由Flow部門打造的AI產(chǎn)品“PicPic”,也于日前在海外正式上線。
在移動互聯(lián)網(wǎng),字節(jié)跳動以驚人的速度崛起成為行業(yè)里的后起之秀,在短短幾年的時間里,成為了讓阿里與騰訊都無法忽視的存在,在新時代,字節(jié)跳動采用了同樣的打法,字節(jié)跳動能否再打造出一個像抖音一樣的“爆款”,我們拭目以待。