Ведётся много разговоров о том, кого ИИ может заменить и когда, но такие инструменты, как Invoke, похоже, возвращают власть в руки дизайнеров. Это инструмент генерации изображений на базе ИИ профессионального уровня, созданный для упрощения творческих процессов дизайнеров. Подобно Photoshop, он обладает сотнями функций и его использование охватывает такие отрасли, как игры, телевидение, розничная торговля, архитектура и дизайн продуктов.
Как Invoke даёт дизайнерам больше контроля
Я поговорил с CEO и основателем Invoke, Кентом Кирси, и он поделился:
Как Invoke даёт дизайнерам больше контроля, чем другие генераторы изображений. Как этот инструмент помогает защитить бизнес от проблем с авторскими правами. Что не так с видением, которое другие компании продают о ИИ.
Вопросы и ответы
- Этот продукт появился в то время, когда люди пытаются понять, как использовать ИИ для своих творческих начинаний. Имея опыт в управлении продуктами, что вдохновило вас создать Invoke?
Я всегда был немного nerd’ом с креативным духом. Мой отец был архитектором, мой дедушка тоже был архитектором. Я вырос среди инструментов CAD и дизайна и имел значительное уважение к творческим начинаниям. Я играл с Photoshop и Macromedia и всеми этими инструментами, когда рос. Я тот продуктовый менеджер, который в случае необходимости может быстро зайти в файл Figma и внести изменения.
В августе 2022 года (это было до ChatGPT) был выпущен открытый модель под названием Stable Diffusion. Это была первая открытая модель, которая действительно произвела большое впечатление на мир. И я наткнулся на неё.
У меня есть компьютер, который может запускать это локально, поэтому я посмотрел в интернете и нашёл небольшой репозиторий с открытым исходным кодом для интерфейса командной строки, который был создан главой адаптивной онкологии Онтарио Института Раковых Исследований. Он написал скрипт. Я скачал его и подумал: «Блин, это здорово. Мне так весело с этим играть.» Это стало моим хобби — вносить вклад в этот проект, и я подошёл к этому с точки зрения управления продуктами.
Это эволюционировало из очень «хакерского» интерфейса командной строки в приложение. У нас был фронтенд-разработчик, который сказал: «Эй, я думаю, я могу построить приложение, которое интегрируется с этим, и мы можем сделать его действительно хорошим.» У нас были правильные люди в комнате, общающиеся друг с другом и реализующие это.
Несколько месяцев спустя мы, вероятно, были одними из первых в отрасли, кто внедрил идею холста, на котором можно было рисовать, редактировать, манипулировать и использовать.
Мы начали взаимодействовать с крупными компаниями в этой области. Мы общались со Stability, они были заинтересованы в том, чтобы пригласить нас в свою команду. Мы разговаривали с крупными производителями чипов, и все начали сходить с ума по поводу ИИ, потому что вышел ChatGPT.
В этот момент я оказался перед выбором: у меня была возможность продолжать расти в роли CEO, но я проводил своё свободное время, исследуя эту область креативности.
Мы строили инструменты, о которых люди говорили, что они дают им художественную творческую свободу. Они чувствовали себя более уверенно, используя то, что мы создавали, чем что-либо другое, и я подумал: «Я просто буду это делать.»
Таким образом, я фактически рискнул и мне повезло получить ранние инвестиции от некоторых людей из моей сети. Мы получили наш стартовый раунд в июне и начали разрабатывать корпоративный продукт, действительно сосредоточенный на предоставлении этого типа решения в масштабах для проблем, с которыми столкнутся бизнесы.
Отношения с ИИ
- Каковы были ваши отношения с ИИ до этого? Вы с детства играли с инструментами дизайна, но в плане ИИ, был ли он вам знаком до бум-эры ИИ?
Я внимательно следил за областью машинного обучения на протяжении десяти лет, наблюдая за происходящим. Моя степень в экономике, и она сильно зависит от статистики. Машинное обучение тоже основано на статистике. Поэтому это всегда имело смысл для меня.
Что я видел за эти годы, так это то, что очень немногие компании, с которыми я работал, умели хорошо применять машинное обучение к своим проблемам.
Многие наши конкуренты и большая часть индустрии в целом продают видение ИИ, которое в некотором смысле — по крайней мере сейчас — является ерундой. Говорят такие вещи, как «Это решит каждую проблему» или «Вам никогда не придется поднимать палец».
С самого начала мы придерживались мнения, что человеческие творцы будут нужны. Вам нужен человек, чтобы управлять этим.
Есть много людей, которые думают: «Ну, у меня есть вкус. Я просто напечатаю свой запрос и создам изображение, и оно будет хорошим.» А потом вы видите те ужасные работы, которые заполняют LinkedIn, и понимаете, что вы, безусловно, сгенерировали картинку, но она довольно низкого качества, и все могут сказать, что это ИИ.
Когда вы передаете это в руки художника и даете ему контроль, который мы предлагаем, они могут сделать так много классных вещей.
Вы общаетесь с художником, который сначала делает набросок, а затем рендерит его в Photoshop. Даже с цифровыми инструментами на финальную работу уходит около 100-150 часов. [С помощью Invoke] один из художников, с которыми мы работали, может сократить это время до четырех-восьми часов.
Мы не являемся заменой Photoshop. Мы компаньон для этого типа интерфейса редактирования изображений.
Кривая обучения
- Это отличная подводка к моему следующему вопросу. Вы сказали, что в Invoke есть около 1000 рычагов, которые помогают творцам достичь желаемого. Если я дизайнер, который никогда не использовал инструмент ИИ, или те, которые я использовал, были такими, как DALLE, где я просто вводил запрос и получал один результат, каков будет кривой обучения?
Я бы хотел, чтобы ответ был универсальным. Думаю, это зависит от личности, но приведу вам аналогию для размышления. Если бы вы никогда не видели Photoshop, сколько времени вам понадобилось бы, чтобы научиться им пользоваться?
Но скажу так: вы можете быстро перейти с нуля на один. Мы разместили много образовательных материалов в интернете. Вы можете начать с некоторых основ довольно легко. Это одна из тех вещей, которые легко начать, но сложно освоить.
Потолок навыков для этого очень высок, потому что таковыми и должны быть творческие инструменты.
Мы принимаем очень рискованный подход в создании этих инструментов, потому что все остальные строят простую текстовую строку, куда вы вводите запрос, и он сам понимает, что вам нужно.
- У вас, возможно, есть один-два ползунка, и вы получаете очень аккуратный диапазон, где вам никогда не разрешают создавать плохое изображение, верно? У Invoke нет ограничений.
Вы можете генерировать совершенно ужасные вещи так же, как и создавать то, что вы никогда не смогли бы сгенерировать с помощью других инструментов, потому что у вас нет контроля, чтобы этого достичь. Мы пытаемся сделать это доступным, но мы также находимся на более сложном конце спектра, потому что создаем инструмент профессионального уровня.
Мы не пытаемся создать потребительское приложение. Мы не пытаемся создать что-то, что вы дадите своему стажеру по маркетингу, и это просто будет работать.
Итеративный процесс
- Вы упомянули, что использование Invoke — это итеративный процесс. Как бизнес может помочь инструменту понять визуальный язык вашего бренда?
Это как обучение нового сотрудника. Они не знают вашего бренда, не знают правил. Что вы делаете? Вы показываете им примеры, где ваш бренд следует правилам, и помогаете им развить понимание, рассматривая материалы.
Так выглядит процесс обучения модели ИИ. Вы создаете набор данных, вы можете сделать это с помощью всего 15 изображений для обучения некоторой концепции.
Как и с кем угодно, если у него всего 15 примеров, он будет менее хорош в этом, чем если бы у него было тысяча примеров. Процесс фактически заключается в написании подписи к этому изображению, чтобы сказать: «Это концепция, которую я обучаю, а вот некоторые другие вещи в изображении, которые не относятся к этой концепции.»
Давайте используем цвет бордо как пример. У вашего бренда есть конкретное представление о том, что такое бордо, у вас есть 20 продуктов, которые все выполнены в бордово, и это конкретный оттенок.
Вы собираетесь показать модели ИИ 20 изображений. Это шапка бордового цвета, это свитер бордового цвета. Она скажет: «Хорошо, я вижу, как бордо или этот конкретный оттенок бордо отличается в каждой из этих ситуаций.» Вы фактически обучаете её связи между этой концепцией и всеми остальными вещами.
Часть процесса — показать примеры в разных контекстах и дать достаточно вариаций, чтобы она могла сказать: «Я действительно понимаю, как эта вещь применяется независимо от других контекстов.»
Вот где это становится полезным, потому что теперь вы можете обобщить эту концепцию и сказать: «Ну, мы никогда не делали обувь — давайте посмотрим, как будет выглядеть бордовая обувь.»
Она понимает эту концепцию независимо от предмета одежды, поэтому теперь она может применить эту концепцию к этому.
Авторские права и интеллектуальная собственность
- Я хочу немного углубиться в вопрос авторских прав и интеллектуальной собственности. Очевидно, что это большая проблема для многих творцов, и мне интересно, как вы помогаете брендам это понять и как защитить свою интеллектуальную собственность?
Часть этого — образование и помощь нашим клиентам в понимании реалий того, где находятся инструменты сегодня и где находятся риски.
Существуют два больших вопроса об авторском праве: что вошло в эти модели и что выходит из этих моделей.
В 2023 году Бюро авторских прав США выпустило заявление о том, что всё, что генерируется ИИ через базовый текстовый запрос, независимо от того, насколько трудоемко вы это вводите, не получает авторских прав на выходные данные. Их позиция заключается в том, что человеческий запрос недостаточен как выражение, чтобы контролировать результат.
Мы проделали много работы, чтобы улучшить управляемость внутри нашего инструмента, чтобы предоставить этот уровень человеческого выражения, чтобы вы могли утверждать, что это заслуживает авторских прав.
Мы помогаем собирать каждую каплю этой информации в встроенном метаданных стандарте, который мы внедряем в изображение. Таким образом, каждое изображение, которое вы генерируете с помощью нашего инструмента, имеет все параметры, которые вошли в его создание, включая такие вещи, как ваши контрольные изображения, ваши эскизы и т.д.
Мы верим, что наш стандарт метаданных будет полезен для поддержки и демонстрации требования о авторских правах на выходные данные.
Мы также помогаем организациям подумать о таких вещах, как демонстрация того, что вошло в ваше обучение, например: происхождение и журналы, чтобы вы могли продемонстрировать, что эта модель была обучена на этой концепции, и мы сформировали это слово, чтобы означать это, и так мы используем это как инструмент, чтобы в конечном итоге вы имели этот уровень видимости и контроля.
Риски создания защищенных авторским правом активов
- Что насчет риска создания защищенных авторским правом активов?
Вы подвергаетесь гораздо меньшему риску, если у вас есть кастомная модель и вы используете человеческое выражение.
Мы предоставляем дополнительный уровень на это, предоставляя рекомендации о том, как использовать эти инструменты таким образом, чтобы уменьшить этот риск.
С точки зрения мониторинга, мы оцениваем, где будет потребность организаций в дополнительном мониторинге. Мы сотрудничаем с организацией под названием Vera — стартапом на ранней стадии, основатель которого является членом Национального консультативного комитета по ИИ при Белом доме — чтобы помочь нам решить риски с нашей стороны.
Одно из вещей, которые мы делаем с точки зрения креатива, это то, что мы не блокируем запросы клиентов. Мы не мониторим запросы и не говорим: «Вы ввели это слово, и мы не будем генерировать это изображение.»
Это рискованный подход — причина в том, что мы работаем со студиями игр и кино. У нас есть художники, которые хотят показать другую сторону человечества, и они хотят, чтобы это было в их искусстве. И мы не будем цензурировать художника.
Будущее
- Теперь, глядя вперед, OpenAI поразила всех своим релизом Sora. Планируете ли вы расширение в видео?
Горизонт постоянно меняется, мы сейчас переходим к созданию медиа с помощью ИИ или с помощью ИИ-поддержки.
Мы являемся ключевым игроком в этом уравнении и будем разбираться, как помочь художникам и творцам добиться лучших результатов, будь то через партнерство или создание собственных решений.
Когда мы смотрим на то, что нас ждет, 3D пока не на повестке дня. Видео тоже еще не готово. Мы понимаем, что быть лучшим местом для контроля генерации изображений будет важно в этих мирах.
Мы сосредоточены на том, чтобы предложить лучший и наиболее комплексный набор инструментов для процесса генерации изображений, чтобы занять хорошую позицию для перехода к следующему поколению инструментов.
Воздействие Invoke на креативную индустрию
- Какое воздействие, по вашему мнению, Invoke окажет на креативную индустрию?
Я надеюсь, что мы сможем предоставить следующее поколение творческих инструментов и сделать их доступными для людей, чтобы они могли владеть своей интеллектуальной собственностью, что, на мой взгляд, под угрозой.
Существует множество платформ генерации изображений, которые фактически просто обучаются на данных своих клиентов, верно? И они делают свои модели ИИ лучше.
Вы можете загружать свой контент и обучать модель. Но вы никогда не сможете действительно взять это и использовать навсегда, верно? Это не ваше. Вы арендуете доступ к своему собственному визуальному языку, своему собственному ИИ-модели.
Существует целый возможный мир, где люди могут обучаться на этих базовых моделях и владеть этим для себя как творцы или как бизнес. Они могут использовать это как актив, который будет поддерживать их генеративные возможности в будущем.
Я на стороне того, чтобы сделать ИИ доступным для людей и дать им возможность извлекать из этого выгоду, не обращаясь к одному централизованному источнику, который имеет полный контроль и не дает вам никакой собственности. И именно это пытается создать Invoke.