Искусственный интеллект уже создает искусство. Сможет ли он заменить креативный класс?
Недавно компания OpenAI выпустила DALL-E 2. Это нейросеть, способная генерировать яркие и реалистичные фотографии, картины и иллюстрации в ответ на текстовый запрос. В одном из замечаний к релизу есть предупреждение, что использование продукта «может привести к вытеснению рабочих мест дизайнеров, фотографов, моделей, редакторов и художников», пишет Wired.
05.08.2022 / 15:40
Правда, пока что этого не произошло. Люди, получившие ранний доступ к нейросети DALL-E, обнаружили, что она помогает творчеству, а не заменяет его. Бенджамин фон Вонг, художник, создающий инсталляции и скульптуры, говорит, что DALL-E повысил его производительность. «DALL-E является отличным инструментом для таких людей, как я, которые не умеют рисовать», — говорит фон Вонг, который использует этот инструмент для изучения идей, которые впоследствии можно воплотить в произведении искусства. — Вместо того, чтобы делать наброски концепций, я могу просто генерировать их с помощью различных фраз-подсказок».
DALL-E — один из множества новых инструментов искусственного интеллекта для создания изображений. Аза Раскин, художник и дизайнер, использовал программное обеспечение с открытым исходным кодом для создания музыкального видео для музыканта Зии Кара, которое было показано на конференции TED в апреле. Этот проект помог убедить его в том, что искусственный интеллект, генерирующий изображения, приведет к взрыву творчества, которое навсегда изменит визуальную среду человечества.
Пока еще рано говорить о том, как такая преобразующая технология в итоге повлияет на иллюстраторов, фотографов и других творческих работников. Но теперь идея о том, что художественные инструменты искусственного интеллекта вытеснят креативный класс, похожа на то, как люди иногда описывают роботов, которые заменят рабочих на заводах, и кажется чрезмерным упрощением.
Первая версия DALL-E, анонсированная в январе 2021 года, стала вехой для компьютерного искусства. Она показала, что алгоритмы машинного обучения, использующие в качестве обучающих данных многие тысячи изображений, могут дополнять существующие изображения новыми формами.
Результат введения в DALL-E запроса «Картина Иеронима Босха, нарисованная Пикассо, нарисованным Фра Ангелика». Фото: fdecomite/flickr.com
Через год вышла DALL-E 2, в которой было заметно улучшено качество получаемых изображений. Она также может уверенно подражать различным художественным стилям и создавать более фотореалистичные изображения. Хотите получить фотографию студийного качества собаки породы Сиба-Ину в берете и черном свитере? Просто введите это в поисковую строку и ждите.
Многие люди, экспериментирующие с DALE и подобными инструментами искусственного интеллекта, описывают их не как новый вид художественного помощника или музы. «Это похоже на разговор с инопланетным существом, — говорит Дэвид Мансон, фотограф, писатель и преподаватель английского языка в Японии, который использовал DALL-E в течение последних двух недель. — Он пытается понять текстовую подсказку и передать нам то, что видит, и часто выдает то, чего вы совсем не ожидаете».
Новая версия DALL-E — лишь один из примеров ряда мощных инструментов генерации изображений. Недавно Google анонсировал два таких инструмента — Imagen в мае и Parti в июне. Несколько проектов с открытым кодом также создали генераторы изображений, такие как Craiyon, ставший вирусным в прошлом месяце после того, как люди начали использовать его для создания мемов в социальных сетях.
Сгенерированное Craiyon изображение по запросу «Беларусь после атомной войны»
Появились новые компании, занимающиеся коммерциализацией художественных инструментов искусственного интеллекта. Веб-сайт и приложение под названием Wombo может генерировать изображения в различных стилях в ответ на текстовую подсказку или существующий рисунок, и продает распечатки или NFT результатов. Midjourney, независимая исследовательская лаборатория, предоставившая свою технологию бета-тестерам, может превратить текстовые подсказки в яркие, иногда абстрактные иллюстрации.
Дэвид Хольц, основатель Midjourney, не считает, что его инструмент конкурирует с художниками. «Мы сконцентрированы на изучении сущности воображения, — говорит он. — Воображение используется для многих вещей, иногда для искусства, но чаще просто для размышлений и игры. Мы бы не назвали то, что мы создаем, искусством искусственного интеллекта, ведь он ничего не создает сам по себе. У него нет ни воли, ни управления».
DALL-E и многие другие художественные инструменты искусственного интеллекта построены на последних достижениях в области машинного обучения, которые позволили алгоритмам, обрабатывающим текст или изображения, работать со значительно большими масштабом и точностью. Несколько лет назад исследователи нашли способ подачи огромных объемов текста, взятых из романов и интернета, в эти алгоритмы, что позволило им улавливать статистические закономерности текста. После такого обучения система могла генерировать очень убедительный текст после того, как в нее вводили первое предложение.
Возможно, самым большим изменением, которое принесут генераторы изображений с искусственным интеллектом, станет резкое расширение круга людей, способных создавать и экспериментировать с искусством и иллюстрациями. «Можно с оптимизмом сказать, что это революция в коммуникации», — говорит Том Уайт, художник из Новой Зеландии, чьи работы посвящены искусственному интеллекту. По словам Уайта, даже те, кто не склонен к творчеству, могут использовать такие инструменты для создания и обмена креативными рисунками — люди уже делают это мемами Craiyon. «Это может изменить наше отношение друг к другу».