OpenAI запускает текстово-видео AI модель Sora

Sora — это AI модель, созданная OpenAI, которая может генерировать высококачественные видео длиной до одной минуты на основе текстового запроса. «Sora способна генерировать сложные сцены с несколькими персонажами, определёнными типами движений и точными деталями предмета и фона», написала OpenAI в своем блоге. «Модель понимает не только то, что пользователь запросил, но и как эти элементы существуют в физическом мире.»

Проблемы Sora

Но у Sora есть и проблемы. OpenAI утверждает, что модель может испытывать трудности с правильным отображением причинно-следственных связей. Например, если она показывает кого-то, пьющего воду из стакана, уровень воды может не понижаться с каждым глотком. Инженеры OpenAI также продолжают работать над улучшением понимания пространства, таких как лево и право или движение вперёд. Вот пример, предоставленный OpenAI, где Sora показывает кого-то, бегущего на беговой дорожке, но вместо того, чтобы бежать лицом к машине, бегун бежит в противоположном направлении.

Доступность и меры предосторожности

Модель пока не доступна для широкой публики, и компания не поделилась датой релиза. В настоящее время она находится на стадии ред-тиминга, где специализированные пользователи будут проверять её на потенциальный ущерб. Когда объединяешь AI и видео, опасность огромна. Мы недавно видели, как быстро распространяются дипфейк изображения и насколько они могут быть тревожными. Видео значительно повышает ставки.

Вот некоторые меры предосторожности, которые OpenAI уже ввела или планирует ввести:

  • Инструмент обнаружения, который может уведомлять пользователей, когда видео было сгенерировано Sora.
  • Метаданные C2PA для отслеживания происхождения видео.

Sora также разработана для отклонения запросов, нарушающих политику содержания OpenAI — например, контент, иллюстрирующий насилие, сексуальное поведение или злоупотребление, а также публичные фигуры. Кроме ред-тимеров, команда визуальных художников, дизайнеров и кинематографистов также получит доступ к Sora, чтобы дать обратную связь по поводу того, как она может способствовать творческой работе.

Восхищение и страх

Модель вызвала как восхищение, так и страх, как и все, что связано с AI. Некоторые воодушевлены возможностями как для бизнеса, так и для частных лиц, чтобы создавать качественные изображения по простым запросам. Для бизнеса с ограниченными творческими ресурсами это может стать переломным моментом. Однако, некоторые беспокоятся о влиянии на рынок труда для творческих профессий, таких как дизайнеры и аниматоры. Станут ли их роли теперь избыточными?

Хотя это маловероятно, этот страх всегда возникает, когда появляется новый инструмент. Слишком рано судить, особенно учитывая, что модель пока не доступна для широкой публики. Настолько ли хороша, как кажется из промо OpenAI? Нам остается только ждать, чтобы узнать.