Как приложения Text-to-Video могут повлиять на индустрии развлечений

Некоторые пассажиры кидаются к спасательным шлюпкам, в то время как другие отчаянно цепляются за перила корабля. Камера приближается к крупному плану пассажиров, бегущих по палубе корабля, пытаясь избежать падения в воду.

Представьте, если бы Джеймсу Кэмерону для создания одной из самых душераздирающих и знаковых сцен в «Титанике» потребовалось просто дать такой текстовый запрос ИИ. Это могло бы сэкономить фильму несколько миллионов долларов на строительстве больших водных резервуаров в Baja Studios.

Если бы съемочная команда подождала немного дольше, возможно, около 25 лет, они бы обнаружили приложения text-to-video — то есть генеративные технологии ИИ, которые преобразуют текстовый запрос в видео.

Выпущенный 15 февраля 2024 года, Sora присоединился к другим моделям text-to-video, таким как Pika 1.0 от Pika Lab, Gen-2 от Runway и Stable Video Diffusion от Stability AI, чтобы открыть новые горизонты в генерации видео с помощью ИИ.

Хотя результаты работы этих старых моделей можно считать элементарными, гиперреализм Sora значительно продвинул возможности вперед, особенно для кино- и контент-индустрии.

Как выглядит запрос на Sora

Вот как выглядит запрос «фотореалистичное крупное видео о двух пиратских кораблях, сражающихся друг с другом, пока они плывут внутри чашки кофе» на модели text-to-video от OpenAI, Sora.

Должен ли Голливуд беспокоиться?

В интервью The Hollywood Reporter через неделю после того, как OpenAI выпустил кадры Sora, Перри заявил, что неопределенно приостанавливает свое предложенное расширение студии, проект, над которым он работал последние четыре года.

Хотя Перри еще в 2023 году узнал о возможном выпуске такой технологии, он никогда не представлял, что она будет выглядеть так. И если быть честными, мы тоже не представляли.

«Если я хочу написать сцену на Луне, это текст, и этот ИИ может создать её как ничего не стоило,» сказал Перри The Hollywood Reporter. «Мне не нужно ставить декорации на своей территории. Я могу сидеть в офисе и делать это с помощью компьютера, что для меня шокирующе.»

Но он не новичок в возможностях ИИ, поскольку уже нашел полезные приложения в двух фильмах, которые он скоро выпустит.

«Я смог использовать эту технологию ИИ, чтобы избежать необходимости сидеть часами в кресле для грима,» сказал он.

Но экономия нескольких часов в кресле для макияжа ничто по сравнению с полной перестройкой многомиллионных процессов производства фильмов, особенно в декорациях. Это, по его мнению, вызывает серьезные трудовые проблемы в отрасли, несмотря на множество преимуществ технологии.

«Это заставляет меня беспокоиться о всех людях в бизнесе. Потому что, когда я смотрел на это, я сразу начал думать обо всех в индустрии, кто будет затронут этим, включая актеров, и осветителей, и транспорт, и звук, и монтажеров, и смотря на это, я думаю, что это коснется каждого уголка нашей индустрии.»

Будучи владельцем студии, Перри убежден, что это новое развитие событий приведет к потере рабочих мест, особенно потому, что «Если можно потратить лишь часть стоимости на создание пилота, который стоил бы $15 миллионов или $20 миллионов…, компании выберут путь меньших затрат.»

Большие дебаты вокруг Text-to-Video приложений

За несколько недель до того, как OpenAI поделился Sora с общественностью, исследование воздействия GenAI на рабочие места в индустрии развлечений показало, что 90% из 300 опрошенных бизнес-лидеров считают, что GenAI будет играть большую роль в индустрии развлечений.

Более того, исследование показало, что целых 72% их креативных компаний уже используют программы GenAI в своих процессах, и это приводит к высокому потенциалу для генерируемых ИИ нарушений рабочих мест.

Влияние этой технологии, которая имеет случаи применения на всех уровнях цикла производства фильмов, стало источником разногласий среди многих лидеров индустрии и креативщиков.

В 2023 году Гильдия сценаристов Америки (WGA) провела забастовку, длившуюся рекордные 148 дней.

Почему? Они зарабатывали копейки на отличной работе. Великой работе, которую, как они опасались, студии могут передать ИИ. Следовательно, их требования к прекращению забастовки включали дополнительные меры защиты от того, как студии могут использовать ИИ.

Гильдия актеров экрана и Американская федерация телевидения и радиохудожников (SAG-AFTRA) также присоединились к забастовке по очень схожим причинам.

В их случае технология и предложением уже существуют для сканирования исполнителей и дублирования их образа — и как сказал Дункан Крэбтри-Айрлэнд, главный переговорщик SAG-AFTRA, «…использовать его навсегда в любом проекте с их согласия и без компенсации.»

Вопросы о будущем

Теперь, с технологией как Sora, у многих людей на уме вопрос, является ли ИИ здесь, чтобы помочь или захватить.

«Это первый раз, когда я почувствовал, что земля под ногами была немного неустойчивой или земля начинала жить, как это чувствовали иллюстраторы несколько лет назад. Это тревожно,» сказал Пол Трилло, многодисциплинарный художник, писатель и режиссер, известный своим изучением ИИ в кино, в статье, опубликованной Yahoo.

Во время двойных забастовок, режиссерка Жюстин Бейтман также называла ИИ в Голливуде «экзистенциальной угрозой,» которая может привести к замене креативщиков «франкенштейновскими ложками их собственной работы.»

Тем не менее, как справедливо признался Трилло, трудно не быть взволнованным этой технологией.

Видеоролики длиной в минуту, которые Sora сейчас достаточно создать, живые и реалистичные, благодаря дизайну модели, чтобы «понимать не только то, что пользователь запрашивает, но и как эти вещи существуют в физическом мире.»

Это значит, что если вы попросите Sora создать фотореалистичное видео о кошке, которая рассержена на своего хозяина, видео может показать кошку с прищуренными глазами, готовую бросить взгляд смерти на своего хозяина.

Мнение экспертов

Однако, кажется, есть консенс, что несмотря на впечатляющие возможности ИИ, он никогда не заменит человеческий творческий труд, который вкладывается в создание фильмов, которые мы любим.

Бинду Редди, генеральный директор и сооснователь Abacus AI, вместо этого выдвигает аргумент о том, как эта технология только поможет сделать фильмы и видеоигры намного лучше. Но помимо этого, руководитель продукта скептически относится к ее влиянию на рабочие места.

«Sora не будет заменой кинофильмов,» пишет она в X. «Да, возможно, что ее можно использовать для создания TikToks или рекламы, но я подозреваю, что будет трудно заставить её создать именно то видео, которое вы ищете.»

Тед Сарандос, генеральный директор Netflix, отразил это чувство на подкасте Роб Лоу «В буквальном смысле!»

«Возможно, что ИИ может воспроизводить или подражать этим вещам, но есть нечто такое в аутентичности и реальности человеческого опыта, что люди видят, и они также могут увидеть, когда это не аутентично,» сказал он.

Он продолжает, «Люди будут пытаться использовать ИИ для сокращения человеческого опыта, и правда в том, что нет ни одного сокращения к человеческому опыту.»

Перспективы индустрии

Помимо производства фильмов, существуют еще большие опасения для индустрии стоковых видеоматериалов.

В партнерстве с Shutterstock в 2023 году OpenAI получил доступ к библиотеке Shutterstock и связанным метаданным для обучения своих моделей ИИ.

Что доказывает партнерство OpenAI-Shutterstock, так это то, что инновации систем поставщиков наследных медиа для отражения текущих технологических реалий могут быть именно тем, что удержит их в бизнесе, так как с каждым днем ИИ становится все лучше в создании фотографий и видео, более настроенных под предпочтения пользователей.

Учитывая, сколько стоят стоковые видео, вопрос, который задает Джим Макос, у всех в голове.

Куда идет Голливуд отсюда?

В завершении забастовок WGA и SAG-AFTRA, оба союза достигли соглашений с Альянсом продюсеров кино- и телевидения (AMPTP), которые не полностью исключили ИИ из их процесса.

Вместо этого, соглашения дали человеческим творцам больший контроль над их искусством и тем, как они выбирают его производить.

Если что-то, это еще раз доказывает, что ИИ пришел, чтобы остаться. Но как призвал Перри, Голливуду потребуется «объединить один голос в движении, чтобы помочь сохранить и защитить индивидов в индустрии.»

Надеемся, что для достижения этого крайне важного консенсуса не потребуется очередная забастовка.

Может пройти долгое время, прежде чем ИИ сможет создавать кадры, достаточно качественные для кино, но учитывая, как одержимо технология движется к еще большему интеллекту, невозможно точно сказать, как скоро это может произойти.