Одним из наибольших опасений, связанных с генерацией изображений ИИ, является безопасность и авторские права. Open AI решила эту проблему, запрограммировав DALL-E на отказ в создании изображений публичных фигур или в стиле живущих художников. Художники также могут предотвратить использование их искусства Open AI для обучения моделей генерации изображений. Это произошло после множества судебных исков к компании от более чем десятка авторов за «возмутительные и вредные» нарушения авторских прав.
Кроме того, у DALL-E есть крутая новая функция: он интегрируется с ChatGPT. Вместо того, чтобы беспокоиться о создании лучшего запроса, пользователи теперь могут воспользоваться помощью ChatGPT, сказав чат-боту, что они ищут. ChatGPT затем создаст детализированный запрос, оптимизированный для модели изображения.
Что нового в ChatGPT?
Что касается самого чат-бота, теперь он может искать в Интернете в режиме реального времени. До этого важного изменения знания ChatGPT были обрезаны к сентябрю 2021 года. Это было одним из преимуществ Bard от Google над Open AI, но теперь у ChatGPT есть новая функция под названием «Browse с Bing».
И это еще не все – ChatGPT также выпускает новые голосовые и изобразительные возможности, которые позволят пользователям чаще использовать чат-бот в повседневной жизни. Пользователи вскоре смогут общаться с помощью изображений и/или голосовых запросов, таких как «Посмотри на мой холодильник и скажи, какие рецепты я могу приготовить» или «Расскажи мне о художнике, который создал этот памятник». Более того, ChatGPT также может отвечать голосовыми заметками, после партнерства с актерами озвучивания для создания аудио, максимально приближенного к человеческому.
Чем занимается Google?
Когда конгломерат впервые выпустил Bard, консенсус заключался в том, что он не был так хорош, как ChatGPT. Поэтому они работали над тем, чтобы изменить это. Bard теперь интегрирован в приложения и сервисы Google, включая YouTube, Gmail и приложения Google Workspace, что увеличивает его потенциал использования.
Google также скоро выпускает Gemini, свою последнюю и лучшую модель языка (LLM), которая, как ожидается, будет поддерживать Bard. Одним из их основных преимуществ было то, что их модель будет мультимодальной, но Open AI опередила их, добавив новые мультимодальные функции в ChatGPT. Однако у Google по-прежнему есть одно большое преимущество: их обширные наборы данных.