Головна Дозвілля ІІ може замінити акторів та режисерів: бот SORA робить неймовірно реалістичні відеоролики на основі текстових описів

The article has been automatically translated into English by Google Translate from Russian and has not been edited.

Переклад цього матеріалу українською мовою з російської було автоматично здійснено сервісом Google Translate, без подальшого редагування тексту.

Bu məqalə Google Translate servisi vasitəsi ilə avtomatik olaraq rus dilindən azərbaycan dilinə tərcümə olunmuşdur. Bundan sonra mətn redaktə edilməmişdir.

ІІ може замінити акторів та режисерів: бот SORA робить неймовірно реалістичні відеоролики на основі текстових описів

29.02.2024, 10:19 EST Автор: Ольга Феоктистова Підписуйтесь на ForumDaily в Google News

Відома у всьому світі своїм чат-ботом ChatGPT компанія OpenAI представила 15 лютого нову генеративну модель штучного інтелекту Sora. Вона дозволяє генерувати за текстовим описом відеоролики, реалістичність яких дивує. Forbes.

Фото: iStock.com/hapana Onphalai

Поява такого інструменту викликала ще більше побоювань щодо розвитку дипфейків (методика синтезу зображення, що ґрунтується на штучному інтелекті), а також того, існування яких професій Сора може поставити під загрозу вже зараз.

Експерти пояснили, як OpenAI вдалося створити таку модель, де її можна використовувати і чому ризики застосування такої моделі можуть бути перебільшені.

Чому Sora – не крок, а гігантський стрибок

Майже місяць тому Google анонсував роботу нейромережі Lumiere, яка вміє генерувати 5-секундні ролики з роздільною здатністю 512×512 пікселів. І тепер OpenAI зробила, здавалося б, неможливе – створила генеративну модель Sora з реалістичними хвилинними роликами.

За темою: Три професії з несподівано високою зарплатою у США

OpenAI навчав модель на відеороликах в оригінальній роздільній здатності, як FullHD (1920×1080), а не на коротких відео з роздільною здатністю 512х512, як це було прийнято. Тому Sora може створювати і вертикальні, і горизонтальні відео, а також уникати звичних квадратних генеративних роликів.

Успіх OpenAI у тому, що вони розробили нейромережу на основі підходу, аналогічного DALL-E 3 (третє покоління нейромережі Dall-E від Open AI, конкурента Midjourney та Stable Diffusion, дозволяє генерувати картинки у різних стилях). Спочатку вони навчають окремої моделі для написання короткого, але точного опису відео. Потім за допомогою GPT-4V (функція ChatGPT, завдяки якій нейромережа розпізнає зображення та враховує їх за відповіді) створюють деталізовані описи отримуючи велику кількість якісних та варіативних описів відео для навчання Sora.

Крім того, архітектура Sora дозволяє не просто генерувати окремі фрагменти відео, а й поєднувати їх у єдине ціле. Це відкриває можливості для створення довгих та зв'язкових відеороликів, раніше недоступних для AI-генерації. У результаті ми отримуємо реалістичні відео найвищої якості до однієї хвилини.

Страху немає

З появою такої потужної технології як Sora, звичайно ж, виникають ризики зловживання. Навіть до поточних генераторів картинок є багато питань щодо їхнього неправомірного використання — генерації фейкового та забороненого контенту. Наприклад, так було з Midjourney, коли люди почали генерувати реалістичні зображення з Дональдом Трампом чи татом Франциском. З відео все виходить на новий рівень, адже тепер можна згенерувати будь-який інфопривід і підкріпити його відеопруфом (фейком). OpenAI розуміє це та вживає заходів для захисту від потенційних ризиків. Так, згідно з інформацією на сайті компанії, вони розробляють інструменти виявлення фейкового та забороненого контенту.

Більш того, в AI research community активно ведуться роботи з маркування генеративного контенту - можливо, незабаром у кожному браузері будуть вбудовані generative-AI detectors. Важливу роль відіграє і просвітницька робота, адже саме люди створюють відео, а чи не сама AL/ML-модель. Потрібно навчитися розуміти нові технології та вміти ними користуватися, а не боятися їх.

Вплив на професію

Без сумніву, Sora вплине на індустрію відеопродакшну. Наприклад, можна буде за короткий термін створити якісні рекламні ролики (до хвилини). Але важливо розуміти, що у найближчій перспективі нейромережа не зможе повністю замінити професійні відеостудії та креаторів — на даному етапі Sora не навчена створювати, наприклад, фільми, а також подібний якісний та тривалий контент.

Як це було раніше з генерацією картинок та текстів, відеоконтенту зараз побільшає, а його якість у середньому погіршиться. Але ті, хто навчиться використовувати Sora професійно, залишаться затребуваними в індустрії.

Вам може бути цікаво: головні новини Нью-Йорка, історії наших іммігрантів і корисні поради про життя в Великому яблуці - Читайте все це на ForumDaily Нові Йорк

Що стосується стартапів, то Sora наочно показала: генерувати реалістичні відео більш ніж можливо. Якщо з'являться проекти text-to-video, які захочуть зайняти прибуткову нішу, це не викличе подиву. Але, як часто буває, успіх навряд чи буде тривалим. OpenAI у будь-який момент може анонсувати нові функції, яких раніше не було в Sora, і знову підвищити планку для конкурентів.

Вплив на рекламу

Історія AI-проривів показує, що будь-яка нова технологія стає загальнодоступною в open-source у наступні півтора роки після її появи: спочатку великі гравці ринку почнуть активно користуватися Sora (як це було з DALL-E та ChatGPT), а потім уже й усі інші .

Наприклад, Sora пропонує безмежні можливості для маркетингу. Можливість створювати персоналізований та високоякісний відеоконтент здатна радикально змінити підходи до реклами та контент-маркетингу – генеративна реклама може повністю захопити ринок, у тому числі YouTube.

Sora не лише задає нові стандарти якості відеовиробництва, а й змінює підходи до взаємодії з аудиторією. OpenAI вдалося продемонструвати потенціал розвитку штучного інтелекту. Цілком можливо, що на горизонті скоро з'являться й інші технологічні прориви, які нас здивують.

Читайте також на ForumDaily:

З якого штату найкраще спостерігати сонячне затемнення у квітні 2024 року

Коли можна побачити вогняний водоспад у Йосеміті: календар найкращих днів для відвідування знаменитого парку

У США можна в'їхати простроченою неімміграційною візою: як це зробити

Різне відео штучний інтелект Дозвілля

Підписуйтесь на ForumDaily в Google News

Хочете більше важливих та цікавих новин про життя в США та імміграцію до Америки? - Підтримайте нас донатом! А ще підписуйтесь на нашу сторінку в Facebook. Вибирайте опцію «Пріоритет у показі» і читайте нас першими. Крім того, не забудьте оформити передплату на наш канал у Telegram і в Instagram- там багато цікавого. І приєднуйтесь до тисяч читачів ForumDaily Нью-Йорк — там на вас чекає маса цікавої та позитивної інформації про життя в мегаполісі.