精選聯盟

AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考

作者:CSDN
AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考

AIGC的熱潮,已經開卷視訊了。

年初,OpenAI推出的人工智能文生視訊大模型Sora成為一大亮點。數月之後,文生3D視訊領域再次掀起新浪潮。這次,AI科技公司魔琺科技帶着文生3D視訊産品“有言”登場。

除了直接開放官網使用者注冊、使用通道,便于大家都能試用,在創新理念和技術實力之外,“有言”也向業界抛出了一些值得深思的問題。

AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考
AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考

第一問:狂熱VS清醒,AI視訊生成大模型要颠覆視訊行業?

衆所周知,Sora僅憑幾個視訊的釋出,立即轟動全球AI領域,在技術圈點燃了大家關于視訊大模型的熱烈讨論,甚至被自媒體專家譽為“通用人工智能AGI實作的标志”。然而,除了視訊行業的專業人士和西方技術圈的精英,大部分人對Sora的評價似乎過于樂觀。

用OpenAI官方的話來說,Sora實作了對實體世界極強的模拟能力。但是,這并不意味着Sora無所不能,它在模拟複雜場景和因果關系方面仍顯不足,盡管在時空一緻性上有所提升,卻存在局限。

與其他AI視訊生成工具相比,Sora的革新更多展現在量的積累而非質的飛躍。除官方demo外,Sora也為媒體開放試用。彭博社記者的試用過程中,Sora曾也暴露出不可控的問題,比如生成的内容與提示詞不符,甚至出現荒誕的場景,如一隻猴子長出了鹦鹉的翅膀。

AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考

是以,目前Sora的可用性受到質疑,它距離滿足企業實際需求并實作商用落地似乎還有一段距離。

此背景下,“有言”帶來了更多新的思考。例如,如何提升AI視訊生成産品的可控性,使其更貼近使用者需求,更準确地生成符合預期的内容,這無疑是一個值得深入探讨的問題。

AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考

從使用者實際的應用需求來看,打開“有言”的官方網站,注冊後即可申請試用。在操作上,一方面,“有言”實作了對生成視訊内容和時長的精準控制,更保證了視訊角色、場景、燈光的高度一緻性。另一方面,“有言”開放了部分功能的編輯權限,進而能夠更精确地呈現視訊内容。

簡單來說,使用者通過“有言"能夠便捷地生成視訊腳本文案,完成視訊剪輯,還能進行音效、配樂、字幕包裝等後期制作環節,無需在多個AI工具間頻繁切換,直接就能生産出高品質的視訊作品。現階段,“有言"将最難視訊要素AIGC化,比如腳本、動畫、運鏡、燈光、聲音等要素的AIGC化,而部分視訊要素采取UGC模版庫的方式供使用者選擇,未來将最終實作AIGC everything。但這對文生視訊産品而言,已經在産品化和實際應用中的落地使用邁出了堅實的一步。

AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考

第二問:AIGC視訊生成大爆發,帶來危機還是創造機遇?

在文生視訊大模型領域,并非OpenAI的Sora一枝獨秀,Runway、Pika、Stable Video Diffusion等衆多AI創業公司也在此賽道上競相角逐,打得火熱。早前Sora的釋出之是以引發如此巨大的轟動與熱議,皆因其取得了突破性的進展,實作了AI領域新一代生産力工具的願景。

如今,AI視訊生成領域經曆了翻天覆地的變革,大家将更多的目光轉向AIGC時代的創作工具。回溯視訊行業的發展脈絡,不難發現:PGC時代依賴專業團隊與裝置;UGC時代降低了拍攝門檻,但企業仍受限于品質要求;如今進入AIGC時代,工具的出現讓創作門檻更低、品質更高,徹底颠覆視訊制作流程,解決短視訊供給不足問題。

AIGC無疑是視訊行業生産力革命的必然趨勢,同時也是企業解決視訊時代内容瓶頸的絕佳選擇。AIGC技術工具的推出,雖然給行業帶來了一定的挑戰,但更多的是推動了内容形态的更新,為各行各業注入了前所未有的想象力與創造力。

那麼,在AIGC時代現世的“有言”,在産品易用性、商業場景等方面帶來了什麼?

在操作層面,“有言”簡潔明了的操作界面,AIGC生成的流暢視訊以及完善的一站式視訊創作功能受到了大家的青睐,配合内置的海量視訊模闆案例庫,使使用者能夠輕松選擇對應場景,并通過簡單的修改,快速生成個性化的視訊作品。無論是企業品牌推廣、社媒營運,還是産品營銷、企業内訓,甚至涉及廣電傳媒、知識分享、K12教育、電商、本地生活等多個領域,“有言”都能靈活應對,展現出強大的适應性。特别是在需要高效、精準傳達資訊的場合中,“有言”更是憑借其出色的性能,赢得了使用者的廣泛贊譽。

AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考

在商業價值方面,“有言”的應用價值已經得到了市場的充分驗證。在産品正式推向公衆之前,已有近50家來自不同行業的領軍企業提前付費購買了企業旗艦版産品,包括東吳證券、海爾集團、蘇州廣電、愛爾眼科、自然堂、斯凱奇、中倫律所等衆多知名品牌,覆寫金融、3C、廣電、美護、律所、文旅等多個行業領域。這一卓越成績不僅凸顯了“有言”産品的卓越品質,更預示着其在未來市場上的無限潛力和廣闊前景。

在實際應用層面,“有言”也得到了客戶的檢驗。“有言”通過深度嵌入海爾集團的中台系統,全面賦能其營銷、平台服務、研發、電商、數字化等多條業務線,展現出了強大的應用潛力和廣闊的市場前景。應海爾集團要求,首批為其開通了100個賬号,覆寫集團内的六大職能部門,服務人數超過400人。短短兩個月内,海爾集團利用“有言”高效生産了600多支業務線視訊,總時長近3000分鐘,平均每日産出視訊數量高達30餘支。不僅大幅提升海爾的視訊内容生産能力,更使教育訓練類視訊的制作成本降低了50%。

除此之外,美妝品牌自然堂也通過“有言”實作了視訊内容的高效生産。在短短兩周多的時間内,自然堂各部門便利用“有言”制作了數百支種草視訊、産品講解視訊以及内部教育訓練視訊,極大地提升了品牌傳播效果和内部教育訓練效率。

AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考

第三問:埋頭趕路還是彎道超車,國産AI視訊生成的機會在哪裡?

随着大模型技術的不斷演進和突破,自去年起,國内科技公司紛紛投身于大模型的研發浪潮中,力求在這一前沿領域取得突破。今年Sora橫空出世後,更是讓許多企業壓力倍增,他們開始擔憂自身在大模型研發上的進度和成果是否能與Sora相媲美。

從技術底層邏輯來看,Sora确實展現出了獨特的優勢。它巧妙地結合了基于ChatGPT技術的Transformer模型與文生視訊的Diffusion Model,成功實作了文本到視訊的轉化功能。然而,這種轉化主要依賴于猜測與計算,而非深入的邏輯分析,是以在視訊生成過程中,Sora面臨着時空一緻性、可控性、編輯性、确定性以及時長控制等諸多挑戰。

并且,目前Sora僅停留在demo階段,尚未推出商業化産品供使用者體驗。即便假設Sora能夠推出成熟産品,其高昂的算力成本也将成為商業化的難題。是以,在追求技術創新的同時,也需要考慮如何降低成本,提高産品的實用性和商業化潛力。

此外,2D數字人和3D虛拟人之間的讨論也接連不斷。

一方面,雖然2D數字人視訊技術能夠模拟真實的對話場景,但其AIGC能力仍然有所欠缺,無法輕易改變數字人的形象或創造出3D場景。另一方面,由于3D技術壁壘和門檻極高,涉足其中的企業寥寥無幾。對于技術公司來說,擷取高品質的3D資料尤為艱難。相較于圖文視訊資料的易得性,3D資料顯得尤為稀缺且難以捕捉,其制作往往需要内容創作者的匠心獨運,成本高昂。

要實作國産AI視訊生成,除了大模型路徑外,是否能在深入研究和挖掘自己的市場環境和技術優勢後,擁有一條其他可行的技術路徑呢?

AIGC開卷3D視訊生成,關于生成式AI賽道的三大思考

差異化之下,“有言”采用基于三維圖形學和AIGC技術的路徑,與現實世界的視訊制作流程對應起來。

具體來說,這一技術路徑與Pika、Runway和Sora存在明顯的差別:

  • 在時空一緻性上,Pika和Runway在視訊生成上時空連貫性不佳。相比之下,“有言”采用基于三維圖形學和AIGC的技術路徑,通過實時實體引擎将3D内容轉化為2D視訊,能夠更好地模拟真實世界的時空連貫性。
  • 在内容可控性與确定性上,現有文生視訊産品如Sora在這方面存在不足,而“有言”的三維圖形學和AIGC技術使其生成的3D内容更具可控性和确定性。
  • 在視訊時長上,早期文生視訊産品生成的視訊普遍較短,Sora雖有所提升,但完整視訊生成仍具挑戰。“有言”雖然通過其技術路徑提升了視訊生成的品質,但在時長方面仍有待進一步突破。
  • 在産品完整性上,現有文生視訊産品在“滿足創作者一站式需求”這一方面有所欠缺,而“有言”通過其技術路徑和實時實體引擎,為創作者提供了更全面的解決方案,但仍需不斷優化以滿足更多需求。

值得一提的是,“有言”作為基于三維圖形學和AIGC技術的産品,與生成2D視訊的文生視訊産品存在顯著差異。這種技術差異使得“有言”能夠生成适配VR/AR的内容,為未來的metaverse虛拟3D世界提供了更多可能性。

如今,“有言”已經将3D視訊生成落地,AIGC技術的飛速進步正以前所未有的速度引領我們邁向3D網際網路的新紀元。随着技術的不斷創新與融合,其應用落地正逐漸從美好願景轉化為觸手可及的現實。

未來,魔琺科技如何在自身的技術領域深耕細作,不斷突破技術瓶頸,為3D内容AIGC生成領域的發展注入源源不斷的創新動力,我們拭目以待。

繼續閱讀