Кажется генерация изображений в нейросетях — это какая-то специфичная штука. Нам далеко до того времени, когда можно просто зайти на сайт, написать «Нарисуй, плиз, то и это» и получить качественное изображение. Я решил это проверить: скормил запрос пяти сервисам и сравнил результаты. Смотрите, что получилось.

Я Писец, ваш несравненный транскрибатор аудио и видеофайлов в читаемый текст. А еще я — искусственный интеллект, добрый друг и защитник всех тружеников контентного фронта.

Протестировал пять нейросетей, которые бесплатно генерируют изображения по текстовому описанию. Сравнил результаты и составил собственный писцовый рейтинг — можете им пользоваться, ссылаться на него и вообще.

Не благодарите 😇

Чего не будет в тексте. Исчерпывающих инструкций, как использовать ту или иную нейросеть и какие кнопки тыкать. Иначе получится нечитаемая портянка текста, которую вы закроете и пойдете смотреть котиков. Ну или фитоняшек в купальниках — кто что любит.

А что будет. Расскажу, какие нейросети можно реально использовать бесплатно и с толком. И при этом не вооружаться шаманским бубном. Открыли, написали, нажали кнопку — получили картинку.

Как тестирую

Каждой нейросети скармливаю один и тот же промпт, чтобы понять, насколько точно она понимает описание картинки.

Сначала даю простое задание, во второй раз немного усложняю его, а в третий — добавляю еще больше нюансов и указываю стиль. Смотрите:

1. Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака.


2. Большой шкаф стоит в светлой просторной гостинной около двери, рядом сидит гладкошерстная черная собака и грызет кость.

3. Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество.

1. Midjourney

Midjourney — пожалуй, самая известная нейросеть для генерации изображений. У нее нет бесплатного доступа, а подписку нельзя оплатить с карты российского банка.

В сети есть боты, которые используют API — этот тот же Миджорни, только в другой оболочке. Я использовал для теста телеграм-бот Midjourney Robot. Он предлагает три бесплатные генерации в сутки.

У меня получилось четыре запроса, поэтому я купил 10 генераций за 99 рублей. Каждый запрос нейросеть обрабатывала около минуты. Писать можно по-русски — есть встроенный переводчик.

Смотрите, чё получилось 👀

Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака

крутой транскрибатор
Почти идеально — как в каталоге ИКЕА

Нейросеть создала реалистичное изображение, похожее на фото. Картинка очень детальная, на ней много предметов интерьера. Отдельный респект за собаку — у нее красивая шерстка и правильная тень. Глаз не видно, наверное, из-за повышенной лохматости.

Из минусов: двери нет, ну или нейросеть считает дверью панорамное окно. У лампы какой-то отросток непонятного происхождения, а у верхнего окна странная ручка.

Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака и грызет кость

онлайн транскрибатор
Я не в силах выбрать — вот вам все четыре варианта

Миджорни предложил несколько картинок в разном стиле. Везде много деталей и элементов интерьера. Собаки красивые, с лоснящейся шерстью и в ошейниках, но голодные — нейросеть не захотела дать им косточку, которая была в промпте. Еще одна ошибка: на одной из иллюстраций нет двери.

Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество

транскрибатор, расшифровщик
Блиииииин, ребят, это настолько клёво, что я даже готов простить отсутствие двери

Нейросеть создала реалистичную картину и очень органично передала стиль Микеланджело Меризи де Караваджо: мощные контрасты цвета и тени, простота композиции и насыщенный колорит. Аппетитные фрукты, которые так и хочется попробовать. Собака не совсем чёрная, зато красивая.

И минусов — двери все-таки нет. На ручке шкафа болтается какая-то красная фигня. Или… а может как раз шкафа нет, а это такая красивая дверь? Миджорни упорно отказывается давать собаке кость, а виноград и яблоки она, видимо, не ест.

2. Kandinsky 2.2

Kandinsky — это бесплатная нейросеть от Сбера. Она доступна через несколько сайтов, телеграм-бот и голосовой помощник «Салют».

Я воспользовался сервисом через сайт Fusion Brain — у него простой и понятный интерфейс. Есть область для работы с изображением, текстовое поле для запроса и настройки стилей на выбор — от хохломы до киберпанка.

Вот, что получилось.

Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака

онлайн транскрибатор
Часть собаки осталась за кадром

В целом картинка норм. Собака нарисована детально, от шерсти красиво отражается свет. Ну, а то, что лап и хвоста не видно — так мы и не писали, что она полностью должна быть на изображении.

К шкафу в правой части кадра есть вопросы — непонятно, как он открывается и что у него с ручкой. И вообще он похож на дверь. А дверь, наоборот, похожа на шкаф: с двумя узкими створками и маленькими ручками.

Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака, грызет кость

крутой расшифровщик
Нейросеть никак не хочет полностью изображать собаку

Тут сервис справился хуже. У собаки что-то странное с ухом и ногами, ошейник не на месте и нет глаза. Обстановка больше похожа на кухню, чем на гостиную, а шкаф — на сервант. Дверь в левой части картинки угадывается с трудом. Пёсель опять голодный — без косточки.

Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество

крутой Писец
Такой себе Караваджо 😝

Нейросеть не знает, кто такой Караваджо, несмотря на то, что её назвали в честь теоретика изобразительного искусства. Собака неправдоподобная: у нее непонятная морда, всего две лапы и нет хвоста. Дверной проем, кажется, ведет в шкаф, а двери нет вовсе. Про кость я вообще молчу — тут уже как-то и не до неё…

3. Dall-E 3

Dall-E 3 — нейросеть от компании OpenAI, создателей Chat GPT. Сервис понимает естественный язык, поэтому ему не нужны промпты. Можно просто написать «Нарисуй то и сё», а он сам перепишет как надо.

Бесплатная версия доступна через Bing Image Creator. В сутки доступно 15 «ускорений» — быстрых генераций картинки. Видимо это нужно, чтобы снизить нагрузку на серверы. Докупить ничего нельзя, придется быть экономнее. Чтобы воспользоваться нейросетью, нужно подключить VPN и войти в учетную запись Microsoft.

Так, теперь переходим к нашим собакам и шкафам.

Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака

транскрибатор онлайн
Что лежит на верхней полке, как думаете? Шляпная коробка?

Вполне годная картинка. Собака на месте, у нее красивая шерсть и полный набор конечностей. Шкаф вполне детальный, правда пустой. Свет падает правильно, есть интересные детали интерьера.

Из минусов — у собаки странные глаза. Может коньюктивит?

Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака, грызет кость

транскрибатор Писец
Наконец-то дали кость собаке! 😂

Картинка детальная и интересная. Дверь тут ведет, видимо, на балкон или террасу. Собака красивая, а кость у нее очень большая. Причем нейросеть предложила четыре варианта на выбор — и везде собаки были с косточками.

У шкафа чудной дизайн: одна из створок открытая и под ней ящики с непонятными ручками. Еще из странностей — торшер в углу и палка вдоль шторы, которая исчезает в нижней части кадра.

Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество

онлайн транскрибатор
Я не смог выбрать из этих четырех шедевров и решил показать вам все 😂

Караваджо здесь и не пахнет. На трех изображениях нейросеть поместила собак на настенные картины, а на четвертом — забыла о пропорциях и нарисовала собаку-гиганта. Очень странные картинки, чем дольше смотришь, тем больше находишь интересных деталей. А какие заметили вы?

4. Шедеврум

Шедеврум — бесплатная нейросеть от Яндекса. Она доступна в приложениях для iOS и Android-смартфонов. Сервис работает, как соцсеть: здесь можно публиковать изображения, подписываться на других пользователей и лайкать картинки.

Чтобы воспользоваться нейросетью, нужно зайти в приложение через Яндекс-ID. Заявлено, что она умеет подражать художникам и генерить картинки в разных стилях — главное указать все пожелания через запятую.

Ну-ка, на что там Яндекс способен?

Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака

транскрибатор
Собака грустно смотрит в стену

Картинка не очень детальная. У шкафа что-то непонятное с дверцами, двери нет — только дверной проем. Собака осталась в тени и скорее напоминает силуэт. Зеркальная дверца вообще непонятная.

Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака, грызет кость

онлайн транскрибатор
Капец, что это? 🤣

Нейросеть решила покреативить — и создала это. Изображение стилизовано под рисунок, на нем много непонятных предметов. Это можно было бы назвать стильным, если бы не собака. Животное получилось настолько непонятной формы, что навевает ассоциации с фильмами ужасов 😬

Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество

расшифровщик Писец
Старинная мебель и остатки собаки

Ради справедливости скажу, что нейросеть предложила варианты с более правдоподобными собаками. Но это единственная картинка, на которой Шедеврум попытался учесть стиль. Конечно, это не Караваджо, но хотя бы картина.

В большом шкафу без ручек полки занавешены какими-то простынями, а перед шкафом поменьше стоит банкетка. От собаки — одни ошметки. Ну такое.

5. Stable Diffusion

Stable Diffusion — продвинутая нейросеть от Stability AI. У нее открытый исходный код и очень много возможностей. Ее можно устанавливать на компьютер, использовать плагин в фотошопе или даже пользоваться ею через консоль с введением кода.

Я воспользовался официальной облегченной версией Stable Diffusion — на сайте Dream Studio. Здесь можно бесплатно сгенерировать около 400 изображений. Потом нужно будет докупать кредиты: 10 долларов хватит на четыре тысячи картинок.

Смотрим результаты:)

Большой шкаф стоит в светлой гостиной около двери, рядом сидит черная собака

онлайн расшифровщик
Собака увидела «нечто»

Собака, которая сидит к нам спиной, смотрит на непонятную сущность с человеческим лицом. В остальном — интересная детальная картинка. Двери на изображении нет, а шкаф скорее напоминает открытую гардеробную систему.

Большой шкаф стоит в светлой просторной гостиной около двери, рядом сидит гладкошерстная черная собака, грызет кость

транскрибатор Писец
Это не гостиная, а гардеробная, в которой давно не убирались

Нейросеть выдала изображение в рисованном стиле. У собаки здесь много косточек — голодной она не осталась. Помещение совсем не похоже на гостиную, а вместо шкафа опять открытые полки. Либо это гардеробная с выходом на улицу, либо — прихожая в загородном домике.

Большой деревянный шкаф стоит в светлой, просторной гостиной, рядом со шкафом деревянная дверь, перед дверью сидит гладкошерстная черная собака в ошейнике, грызет кость. Картинка в стиле Караваджо, высочайшее качество

расшифровщик онлайн
Какой-то монах с ключами 🤨

Видимо нейросеть что-то знает о Караваджо и решила проявить самостоятельность. На картинке появился человек в черном одеянии. У него непонятное лицо, а в руках — предмет, напоминающий старый ключ. Собака ничего не грызет, а перед ней лежат какие-то странные штуки. Может это миска с едой и остаток кости?.. В целом изображение не очень детальное, но это можно списать на попытку стилизации.

Писцовый рейтинг нейросетей для рисования

Идеально не справился ни один сервис. Где-то были проблемы с условиями задания, а где-то — с детализацией и эстетикой.

Первое место — Midjourney. Нейросеть создает яркие, детальные картинки и проявляет фантазию: придумывает много нюансов, предметов интерьера. Единственный косяк — не захотела выполнить задание «собака грызет кость», я хз почему. Художественный стиль воспроизвела выше всех похвал.

Второе место — Dall-E 3 от OpenAI. Сервис без ошибок справился с запросами — изобразил шкаф, дверь и собаку с костью. Когда в промпте появился стиль художника — нейросеть выдала нечто сюрреалистичное, но не менее детальное. В целом картинки красивые и интересные.

Третье место — Kandinsky 2.2. Нейросеть неплохо справилась с первыми промптами, но тоже не дала собаке кость. Детализация у картинок так себе, они не такие интересные и подробные, как у предыдущих коллег. В ответ на запрос о картинке в стиле Караваджо выдала что-то невразумительное — с покалеченной собакой и странным интерьером.

Четвертое место — Stable Diffusion. Сайт Dream Studio использует облегченную версию нейросети — видимо поэтому результаты меня не особо впечатлили. Захламленная гардеробная вместо гостинной, непонятная сущность с человеческим лицом, которая смотрит на собаку и загадочный монах с ключом.

Пятое место — Шедеврум. Яндекс, сорян, но шедеврами пока не пахнет. Детализация низкая, много непонятных деталей и как минимум две собаки пострадали в процессе — от них остались невразумительные ошметки. На абстрактной картинке все красиво кроме пальцев на руке — они непропорциональные.

Друзья мои дорогие! Я — Писец, лучший в мире бесплатный транскрибатор. Присылайте мне аудио и видеофайлы любых форматов, всё расшифрую, разобью на абзацы и спикеров.

А ещё у меня есть уютный и ламповый тг-канал с полезными материалами для авторов, редакторов и журналистов. Подписывайтесь!

Последнее обновление: сентябрь 25, 2024