精選聯盟

中國首個“Sora級”視訊大模型釋出

作者:1039調查團

2024中關村論壇年會今天(4月27日)首次舉辦“人工智能主題日”,聚焦人工智能最前沿舉行12場活動,多項重大成果集中亮相。其中,大陸首個自研視訊大模型Vidu釋出,全面對标國際頂尖水準。

中國首個“Sora級”視訊大模型釋出

Vidu生成的視訊畫面/來自生數科技

隻需要一段文字指令就能生成一段60秒精緻細膩的視訊,今年2月,文生視訊大模型Sora曾在全球引發震動。對标Sora,生數科技聯合清華大學釋出中國首個長時長、高一緻性、高動态性視訊大模型——Vidu。支援一鍵生成長達16秒、分辨率高達1080P的高清視訊内容。

清華大學人工智能研究院副院長、生數科技首席科學家朱軍介紹,Vidu是聯合攻關團隊全棧自主創新的最新成果,它在多個次元上實作了技術的突破。它可以模拟真實的實體世界,可以具有想象力,可以了解多鏡頭的語言,不再是簡單的鏡頭的推拉,它也可以一鏡到底生成16秒的視訊,不需要任何地剪接。同時它在人物、場景和時間保持上具有高度一緻性,它還可以了解和生成中國元素,能夠在視訊中生成例如熊貓、龍等特有的中國元素。

中國首個“Sora級”視訊大模型釋出
中國首個“Sora級”視訊大模型釋出

Vidu生成的視訊畫面/來自生數科技

根據現場示範的效果,Vidu能夠生成細節複雜、并且符合真實實體規律的場景,例如合理的光影效果、細膩的人物表情等。它還能生成真實世界不存在的虛構畫面,例如“畫室裡的一艘船正在海浪中駛向鏡頭”這樣的場景。在長期和正确的技術路線積累下,Vidu團隊在短短兩個月實作了技術的重大突破。

“今年1月份時,我們當時做出了4秒的視訊生成。在Sora推出之後,我們加快了技術攻關的進度,在3月底我們突破了8秒,雖然4秒到8秒隻有一個2倍的提升,但是一個巨大的進步,它驗證了我們的技術路線是正确的,堅定了我們信心。”朱軍表示,在4月份時,團隊進一步地加大了技術攻關力度,現在視訊生成長度達到了16秒,“在未來還會進一步地突破這個長度,我們相信會是一個更快的速度在疊代。”

中國首個“Sora級”視訊大模型釋出

Vidu生成的視訊畫面/來自生數科技

深度融合了人工智能和機器人等多學科技術的具身智能,正在成為人工智能的下一個浪潮。論壇上,多家科技公司帶來了最新款的人形機器人。銀河通用機器人公司目前研發的機器人技術,已經可以做到在任意場景對任意物體進行抓取。未來5年,通用具身智能驅動的人形機器人有望深度地進入家庭。

“我們計劃通過5年時間,釋出家庭使用的人形機器人,能夠幫你在家裡取東西,包括從桌子上取,從冰箱裡去取,還有在各種地方放東西,還可以使用各種家用電器,幫你用微波爐來加熱食物,再到幫你做一些立體清潔,比如擦桌子、擦鏡子等現在掃地機器人幹不了的事情。”銀河通用創始人王鶴說。

中國首個“Sora級”視訊大模型釋出

多家科技公司展示人形機器人研發成果/大會提供

中國首個“Sora級”視訊大模型釋出

銀河通用研發的人形機器人/記者拍攝

海澱區作為全國人工智能的發展高地,已集聚人工智能企業近千家,占全市的三分之二、全國的六分之一。在論壇上,集中釋出了人工智能發展的階段性成果。

中關村科學城管委會副主任、海澱區副區長唐超介紹,率先釋出了全球首個人工智能街區概念,在海澱53平方公裡城市空間,按照三橫兩縱一帶的格局規劃人工智能街區,全力建設內建通用人工智能技術的城市智能體,率先在五道口和大鐘寺兩個先導區打造智能體樣闆間。

海澱區還釋出了打造全國具身智能創新高地的三年行動方案,聚焦具身大模型和機器人整機,部署實施六大行動,力争到2026年初步建成全國具身智能原始策源地、應用示範新高地和産業加速集聚地,成為中國參與全球具身智能競争的核心力量。

中國首個“Sora級”視訊大模型釋出

中關村論壇“人工智能主題日”主論壇/大會提供

記 者 王琛琛 編 輯 王琛琛 主 編 程 豔

中國首個“Sora級”視訊大模型釋出

繼續閱讀