Mô hình video "Sora-level" đầu tiên của Trung Quốc đã được phát hành

tác giả：Nhiệm vụ điều tra 1039 2024-04-27 19:20:00

Hội nghị thường niên Diễn đàn Zhongguancun năm 2024 đã tổ chức "Ngày chủ đề trí tuệ nhân tạo" lần đầu tiên vào hôm nay (27/4), tập trung đi đầu trong lĩnh vực trí tuệ nhân tạo, tổ chức 12 hoạt động và một số thành tựu lớn đã được công bố. Trong số đó, Vidu, mô hình video tự phát triển đầu tiên ở Trung Quốc đại lục, đã được phát hành, được đánh giá toàn diện so với cấp độ quốc tế hàng đầu.

Mô hình video "Sora-level" đầu tiên của Trung Quốc đã được phát hành

Cảnh quay video được tạo bởi Vidu / từ Shengshu Technology

Chỉ cần một lệnh văn bản duy nhất để tạo ra một video tinh tế dài 60 giây và vào tháng Hai năm nay, mô hình lớn của video Wensheng, Sora, đã gây ra một cú sốc toàn cầu. Cùng với Sora, Biodata Technology và Đại học Thanh Hoa đã cùng phát hành mô hình video dài hạn, tính nhất quán cao và động lực cao đầu tiên của Trung Quốc - Vidu. Nó hỗ trợ tạo nội dung video độ nét cao bằng một cú nhấp chuột lên đến 16 giây và độ phân giải lên đến 1080P.

Zhu Jun, phó hiệu trưởng Viện Trí tuệ nhân tạo của Đại học Thanh Hoa và là nhà khoa học trưởng của Shengshu Technology, giới thiệu rằng Vidu là thành tựu mới nhất của sự đổi mới độc lập toàn diện của nhóm nghiên cứu chung và nó đã đạt được những đột phá công nghệ trong nhiều chiều. Nó có thể mô phỏng thế giới thực, nó có thể tưởng tượng, nó có thể hiểu ngôn ngữ của nhiều bức ảnh, nó không còn là một cú đẩy và kéo ống kính đơn giản, nó cũng có thể tạo ra một video 16 giây trong một lần chụp, mà không cần chỉnh sửa. Đồng thời, nó có mức độ nhất quán cao trong các nhân vật, cảnh và thời gian, đồng thời nó cũng có thể hiểu và tạo ra các yếu tố Trung Quốc, chẳng hạn như gấu trúc, rồng và các yếu tố Trung Quốc độc đáo khác trong video.

Cảnh quay video được tạo bởi Vidu / từ Shengshu Technology

Dựa trên hiệu ứng của trình diễn trực tiếp, Vidu có thể tạo ra các cảnh với các chi tiết phức tạp và quy luật vật lý thực, chẳng hạn như hiệu ứng ánh sáng và bóng tối hợp lý, biểu cảm nhân vật tinh tế, v.v. Nó cũng có thể tạo ra những hình ảnh hư cấu không tồn tại trong thế giới thực, chẳng hạn như cảnh một con tàu trong studio đang đi về phía máy ảnh trong sóng. Với việc tích lũy các tuyến kỹ thuật dài hạn và chính xác, đội ngũ Vidu đã đạt được bước đột phá lớn về công nghệ chỉ trong hai tháng.

"Vào tháng Giêng năm nay, chúng tôi đã thực hiện một thế hệ video dài bốn giây. Sau khi ra mắt Sora, chúng tôi đã đẩy nhanh tiến độ nghiên cứu kỹ thuật và vào cuối tháng 3, chúng tôi đã vượt qua 8 giây, mặc dù 4 giây đến 8 giây chỉ là cải tiến gấp 2 lần, nhưng đó là một tiến bộ rất lớn, nó xác minh rằng lộ trình kỹ thuật của chúng tôi là chính xác và củng cố sự tự tin của chúng tôi. Zhu Jun nói rằng vào tháng 4, nhóm nghiên cứu đã tăng cường hơn nữa các nỗ lực nghiên cứu kỹ thuật và bây giờ thời lượng tạo video đã đạt 16 giây, "Trong tương lai, chúng tôi sẽ tiếp tục vượt qua độ dài này và chúng tôi tin rằng nó sẽ là một lần lặp lại nhanh hơn." "

Cảnh quay video được tạo bởi Vidu / từ Shengshu Technology

Trí thông minh thể hiện, tích hợp sâu các công nghệ đa ngành như trí tuệ nhân tạo và robot, đang trở thành làn sóng trí tuệ nhân tạo tiếp theo. Tại diễn đàn, một số công ty công nghệ đã mang đến những robot hình người mới nhất. Công nghệ robot hiện đang được phát triển bởi Công ty Galaxy General Robotics có thể nắm bắt bất kỳ đối tượng nào trong bất kỳ cảnh nào. Trong 5 năm tới, các robot hình người được điều khiển bởi trí thông minh thể hiện chung dự kiến sẽ xâm nhập sâu vào nhà.

"Chúng tôi có kế hoạch phát hành một robot hình người để sử dụng tại nhà trong 5 năm, có thể giúp bạn nhặt đồ ở nhà, bao gồm nhặt đồ từ bàn, nhặt chúng từ tủ lạnh và đặt mọi thứ ở nhiều nơi khác nhau, và bạn cũng có thể sử dụng các thiết bị gia dụng khác nhau để giúp bạn sử dụng lò vi sóng để hâm nóng thức ăn, và sau đó giúp bạn làm sạch ba chiều, chẳng hạn như lau bàn, lau gương và những thứ khác mà robot quét không thể làm bây giờ. Wang He, người sáng lập Galaxy General, cho biết.

Một số công ty công nghệ giới thiệu kết quả R&D của robot hình người / được cung cấp bởi hội nghị

Robot hình người được phát triển bởi Galaxy General / Ảnh của các nhà báo

Là cao nguyên phát triển của trí tuệ nhân tạo ở Trung Quốc, quận Haidian đã tập hợp gần 1.000 doanh nghiệp trí tuệ nhân tạo, chiếm hai phần ba thành phố và một phần sáu của cả nước. Tại diễn đàn, kết quả theo từng giai đoạn của sự phát triển trí tuệ nhân tạo đã được công bố.

Tang Chao, phó giám đốc Ủy ban quản lý thành phố khoa học Zhongguancun và phó giám đốc quận Haidian, giới thiệu rằng ông đã đi đầu trong việc phát hành khái niệm khối trí tuệ nhân tạo đầu tiên trên thế giới, quy hoạch các khối trí tuệ nhân tạo trong không gian đô thị rộng 53 km vuông của Haidian theo mô hình ba vành đai ngang và hai vành đai dọc, và nỗ lực hết sức để xây dựng một cơ thể thông minh đô thị tích hợp công nghệ trí tuệ nhân tạo nói chung và đi đầu trong việc xây dựng một phòng mô hình cơ thể thông minh ở hai khu vực thí điểm của Wudaokou và Dazhong Temple.

Quận Hải Điền cũng đã công bố kế hoạch hành động ba năm để xây dựng một cao nguyên đổi mới tình báo thể hiện quốc gia, tập trung vào các mô hình lớn và máy móc robot, triển khai và thực hiện sáu hành động lớn, và phấn đấu bước đầu xây dựng một nguồn thông tin tình báo thể hiện ban đầu của quốc gia, một vùng cao mới để trình diễn ứng dụng và tích tụ tăng tốc công nghiệp vào năm 2026, và trở thành lực lượng nòng cốt để Trung Quốc tham gia vào cuộc thi tình báo thể hiện toàn cầu.

Diễn đàn / hội nghị chính của Diễn đàn Zhongguancun "Ngày chủ đề trí tuệ nhân tạo" được cung cấp

Phóng viên Wang Chenchen Biên tập viên Wang Chenchen Tổng biên tập Cheng Yan

Mô hình video "Sora-level" đầu tiên của Trung Quốc đã được phát hành

Đọc tiếp