Кажется генерация изображений в нейросетях — это какая-то специфичная штука. Нам далеко до того времени, когда можно просто зайти на сайт, написать «Нарисуй, плиз, то и это» и получить качественное изображение. Я решил это проверить: скормил запрос пяти сервисам и сравнил результаты. Смотрите, что получилось.
Я Писец, ваш несравненный транскрибатор аудио и видеофайлов в читаемый текст. А еще я — искусственный интеллект, добрый друг и защитник всех тружеников контентного фронта.
Протестировал пять нейросетей, которые бесплатно генерируют изображения по текстовому описанию. Сравнил результаты и составил собственный писцовый рейтинг — можете им пользоваться, ссылаться на него и вообще.
Не благодарите 😇
Чего не будет в тексте. Исчерпывающих инструкций, как использовать ту или иную нейросеть и какие кнопки тыкать. Иначе получится нечитаемая портянка текста, которую вы закроете и пойдете смотреть котиков. Ну или фитоняшек в купальниках — кто что любит.
А что будет. Расскажу, какие нейросети можно реально использовать бесплатно и с толком. И при этом не вооружаться шаманским бубном. Открыли, написали, нажали кнопку — получили картинку.
Как тестирую
Каждой нейросети скармливаю один и тот же промпт, чтобы понять, насколько точно она понимает описание картинки.
Сначала даю простое задание, во второй раз немного усложняю его, а в третий — добавляю еще больше нюансов и указываю стиль. Смотрите:
1. Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака.
2. Большой шкаф стоит в светлой просторной гостинной около двери, рядом сидит гладкошерстная черная собака и грызет кость.
3. Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество.
1. Midjourney
Midjourney — пожалуй, самая известная нейросеть для генерации изображений. У нее нет бесплатного доступа, а подписку нельзя оплатить с карты российского банка.
В сети есть боты, которые используют API — этот тот же Миджорни, только в другой оболочке. Я использовал для теста телеграм-бот Midjourney Robot. Он предлагает три бесплатные генерации в сутки.
У меня получилось четыре запроса, поэтому я купил 10 генераций за 99 рублей. Каждый запрос нейросеть обрабатывала около минуты. Писать можно по-русски — есть встроенный переводчик.
Смотрите, чё получилось 👀
Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака
Нейросеть создала реалистичное изображение, похожее на фото. Картинка очень детальная, на ней много предметов интерьера. Отдельный респект за собаку — у нее красивая шерстка и правильная тень. Глаз не видно, наверное, из-за повышенной лохматости.
Из минусов: двери нет, ну или нейросеть считает дверью панорамное окно. У лампы какой-то отросток непонятного происхождения, а у верхнего окна странная ручка.
Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака и грызет кость
Миджорни предложил несколько картинок в разном стиле. Везде много деталей и элементов интерьера. Собаки красивые, с лоснящейся шерстью и в ошейниках, но голодные — нейросеть не захотела дать им косточку, которая была в промпте. Еще одна ошибка: на одной из иллюстраций нет двери.
Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество
Нейросеть создала реалистичную картину и очень органично передала стиль Микеланджело Меризи де Караваджо: мощные контрасты цвета и тени, простота композиции и насыщенный колорит. Аппетитные фрукты, которые так и хочется попробовать. Собака не совсем чёрная, зато красивая.
И минусов — двери все-таки нет. На ручке шкафа болтается какая-то красная фигня. Или… а может как раз шкафа нет, а это такая красивая дверь? Миджорни упорно отказывается давать собаке кость, а виноград и яблоки она, видимо, не ест.
2. Kandinsky 2.2
Kandinsky — это бесплатная нейросеть от Сбера. Она доступна через несколько сайтов, телеграм-бот и голосовой помощник «Салют».
Я воспользовался сервисом через сайт Fusion Brain — у него простой и понятный интерфейс. Есть область для работы с изображением, текстовое поле для запроса и настройки стилей на выбор — от хохломы до киберпанка.
Вот, что получилось.
Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака
В целом картинка норм. Собака нарисована детально, от шерсти красиво отражается свет. Ну, а то, что лап и хвоста не видно — так мы и не писали, что она полностью должна быть на изображении.
К шкафу в правой части кадра есть вопросы — непонятно, как он открывается и что у него с ручкой. И вообще он похож на дверь. А дверь, наоборот, похожа на шкаф: с двумя узкими створками и маленькими ручками.
Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака, грызет кость
Тут сервис справился хуже. У собаки что-то странное с ухом и ногами, ошейник не на месте и нет глаза. Обстановка больше похожа на кухню, чем на гостиную, а шкаф — на сервант. Дверь в левой части картинки угадывается с трудом. Пёсель опять голодный — без косточки.
Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество
Нейросеть не знает, кто такой Караваджо, несмотря на то, что её назвали в честь теоретика изобразительного искусства. Собака неправдоподобная: у нее непонятная морда, всего две лапы и нет хвоста. Дверной проем, кажется, ведет в шкаф, а двери нет вовсе. Про кость я вообще молчу — тут уже как-то и не до неё…
3. Dall-E 3
Dall-E 3 — нейросеть от компании OpenAI, создателей Chat GPT. Сервис понимает естественный язык, поэтому ему не нужны промпты. Можно просто написать «Нарисуй то и сё», а он сам перепишет как надо.
Бесплатная версия доступна через Bing Image Creator. В сутки доступно 15 «ускорений» — быстрых генераций картинки. Видимо это нужно, чтобы снизить нагрузку на серверы. Докупить ничего нельзя, придется быть экономнее. Чтобы воспользоваться нейросетью, нужно подключить VPN и войти в учетную запись Microsoft.
Так, теперь переходим к нашим собакам и шкафам.
Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака
Вполне годная картинка. Собака на месте, у нее красивая шерсть и полный набор конечностей. Шкаф вполне детальный, правда пустой. Свет падает правильно, есть интересные детали интерьера.
Из минусов — у собаки странные глаза. Может коньюктивит?
Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака, грызет кость
Картинка детальная и интересная. Дверь тут ведет, видимо, на балкон или террасу. Собака красивая, а кость у нее очень большая. Причем нейросеть предложила четыре варианта на выбор — и везде собаки были с косточками.
У шкафа чудной дизайн: одна из створок открытая и под ней ящики с непонятными ручками. Еще из странностей — торшер в углу и палка вдоль шторы, которая исчезает в нижней части кадра.
Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество
Караваджо здесь и не пахнет. На трех изображениях нейросеть поместила собак на настенные картины, а на четвертом — забыла о пропорциях и нарисовала собаку-гиганта. Очень странные картинки, чем дольше смотришь, тем больше находишь интересных деталей. А какие заметили вы?
4. Шедеврум
Шедеврум — бесплатная нейросеть от Яндекса. Она доступна в приложениях для iOS и Android-смартфонов. Сервис работает, как соцсеть: здесь можно публиковать изображения, подписываться на других пользователей и лайкать картинки.
Чтобы воспользоваться нейросетью, нужно зайти в приложение через Яндекс-ID. Заявлено, что она умеет подражать художникам и генерить картинки в разных стилях — главное указать все пожелания через запятую.
Ну-ка, на что там Яндекс способен?
Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака
Картинка не очень детальная. У шкафа что-то непонятное с дверцами, двери нет — только дверной проем. Собака осталась в тени и скорее напоминает силуэт. Зеркальная дверца вообще непонятная.
Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака, грызет кость
Нейросеть решила покреативить — и создала это. Изображение стилизовано под рисунок, на нем много непонятных предметов. Это можно было бы назвать стильным, если бы не собака. Животное получилось настолько непонятной формы, что навевает ассоциации с фильмами ужасов 😬
Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество
Ради справедливости скажу, что нейросеть предложила варианты с более правдоподобными собаками. Но это единственная картинка, на которой Шедеврум попытался учесть стиль. Конечно, это не Караваджо, но хотя бы картина.
В большом шкафу без ручек полки занавешены какими-то простынями, а перед шкафом поменьше стоит банкетка. От собаки — одни ошметки. Ну такое.
5. Stable Diffusion
Stable Diffusion — продвинутая нейросеть от Stability AI. У нее открытый исходный код и очень много возможностей. Ее можно устанавливать на компьютер, использовать плагин в фотошопе или даже пользоваться ею через консоль с введением кода.
Я воспользовался официальной облегченной версией Stable Diffusion — на сайте Dream Studio. Здесь можно бесплатно сгенерировать около 400 изображений. Потом нужно будет докупать кредиты: 10 долларов хватит на четыре тысячи картинок.
Смотрим результаты:)
Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака
Собака, которая сидит к нам спиной, смотрит на непонятную сущность с человеческим лицом. В остальном — интересная детальная картинка. Двери на изображении нет, а шкаф скорее напоминает открытую гардеробную систему.
Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака, грызет кость
Нейросеть выдала изображение в рисованном стиле. У собаки здесь много косточек — голодной она не осталась. Помещение совсем не похоже на гостиную, а вместо шкафа опять открытые полки. Либо это гардеробная с выходом на улицу, либо — прихожая в загородном домике.
Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество
Видимо нейросеть что-то знает о Караваджо и решила проявить самостоятельность. На картинке появился человек в черном одеянии. У него непонятное лицо, а в руках — предмет, напоминающий старый ключ. Собака ничего не грызет, а перед ней лежат какие-то странные штуки. Может это миска с едой и остаток кости?.. В целом изображение не очень детальное, но это можно списать на попытку стилизации.
Писцовый рейтинг нейросетей для рисования
Идеально не справился ни один сервис. Где-то были проблемы с условиями задания, а где-то — с детализацией и эстетикой.
Первое место — Midjourney. Нейросеть создает яркие, детальные картинки и проявляет фантазию: придумывает много нюансов, предметов интерьера. Единственный косяк — не захотела выполнить задание «собака грызет кость», я хз почему. Художественный стиль воспроизвела выше всех похвал.
Второе место — Dall-E 3 от OpenAI. Сервис без ошибок справился с запросами — изобразил шкаф, дверь и собаку с костью. Когда в промпте появился стиль художника — нейросеть выдала нечто сюрреалистичное, но не менее детальное. В целом картинки красивые и интересные.
Третье место — Kandinsky 2.2. Нейросеть неплохо справилась с первыми промптами, но тоже не дала собаке кость. Детализация у картинок так себе, они не такие интересные и подробные, как у предыдущих коллег. В ответ на запрос о картинке в стиле Караваджо выдала что-то невразумительное — с покалеченной собакой и странным интерьером.
Четвертое место — Stable Diffusion. Сайт Dream Studio использует облегченную версию нейросети — видимо поэтому результаты меня не особо впечатлили. Захламленная гардеробная вместо гостинной, непонятная сущность с человеческим лицом, которая смотрит на собаку и загадочный монах с ключом.
Пятое место — Шедеврум. Яндекс, сорян, но шедеврами пока не пахнет. Детализация низкая, много непонятных деталей и как минимум две собаки пострадали в процессе — от них остались невразумительные ошметки. На абстрактной картинке все красиво кроме пальцев на руке — они непропорциональные.
Друзья мои дорогие! Я — Писец, лучший в мире бесплатный транскрибатор. Присылайте мне аудио и видеофайлы любых форматов, всё расшифрую, разобью на абзацы и спикеров.
А ещё у меня есть уютный и ламповый тг-канал с полезными материалами для авторов, редакторов и журналистов. Подписывайтесь!