OpenAI giới thiệu mô hình AI biến văn bản thành video
OpenAI giới thiệu mô hình AI biến văn bản thành video

OpenAI đã tiết lộ phần mềm có tên "Sora" hiện có sẵn cho đội nghiên cứu trải nghiệm, giúp xác định các lỗ hổng trong hệ thống AI, cũng như để các nghệ sĩ thị giác, nhà thiết kế và nhà làm phim sử dụng để nhận phản hồi về mô hình.

Tuyên bố cho biết: “Sora có thể tạo ra những cảnh phức tạp với nhiều nhân vật, loại chuyển động cụ thể và chi tiết chính xác về chủ đề và hậu cảnh”, đồng thời cho biết thêm rằng nó có thể tạo nhiều cảnh quay trong một video.

Ngoài việc tạo video từ lời nhắc bằng văn bản, Sora còn có thể tạo hoạt ảnh cho hình ảnh tĩnh, công ty cho biết trong một bài đăng trên blog.

Phần mềm tạo video này đi theo chatbot ChatGPT của OpenAI, được phát hành vào cuối năm 2022 và tạo được tiếng vang khắp GenAI với khả năng soạn email, viết mã và làm thơ.

Trong khi đó, nền tảng truyền thông xã hội khổng lồ Meta (META.O), đã tăng cường mô hình tạo hình ảnh Emu vào năm ngoái để bổ sung hai tính năng dựa trên AI có thể chỉnh sửa và tạo video từ lời nhắc văn bản.

Công ty mẹ Facebook cũng đang tìm cách cạnh tranh với Microsoft, Google của Alphabet (GOOGL.O) và Amazon (AMZN.O), trong vũ trụ AI sáng tạo đang biến đổi nhanh chóng.

Tuy nhiên, Open AI cho biết, Sora là một công việc đang trong quá trình hoàn thiện và công ty nói thêm rằng mô hình có thể nhầm lẫn các chi tiết không gian của lời nhắc và gặp khó khăn trong việc theo dõi quỹ đạo máy ảnh cụ thể.

OpenAI cho biết họ cũng đang phát triển các công cụ có thể phân biệt xem video có phải do Sora tạo ra hay không.