Чи відберуть нейромережі роботу в дизайнерів і художників — роздуми ІТ-менеджера

Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!

Мене звати Сергій Гузенко, я засновник та CEO херсонської IT-компанії WEZOM. Поговорімо про хайп навколо нейромереж DALL·E 2 та Midjourney, які навчилися компетентно малювати зображення на основі тексту чи ключових слів. Блогери та експерти вже називають ці інструменти «вбивцями» таких професій як дизайнер, художник, ілюстратор.

Як IT-менеджера мене дуже зацікавило, чи зможе штучний інтелект за якихось 5-7 років малювати нам макети дизайну та інтерфейсів без участі людини? Аби скласти власну думку з цього приводу, я вирішив трохи попрацювати з Midjourney самостійно та оцінити результати через призму свого 20-річного досвіду в індустрії.

Думаю, мої висновки щодо розвитку «художніх» нейромереж можуть бути цікавим моїм колегам — розробникам, дизайнерам та художникам. Вони також дадуть поживу для роздумів усім, хто має намір спробувати себе в цих професіях.

Як це працює

Перша ж спроба скористатися інструментами для генерації зображень може викликати дитяче захоплення навіть у найчерствішої людини. Це схоже на магію: ви друкуєте у текстовому полі кілька будь-яких ключових слів, а вже за кілька секунд алгоритм видає вам непогану картину, яку досвідчений ілюстратор малював би нагабато довше.

Ми не будемо обговорювати технології та принципи роботи нейромереж, а зосередимося на прикладній частині. Найбільш хайповою нейромережею для ілюстрацій на сьогодні є Midjourney. Її почали навчати у лютому 2022 року, а вже у серпні мережу заполонили перші ілюстрації «авторства» MJ.

Midjourney перетворює друкований текст на зображення, до того ж робить це дуже швидко й на гідному рівні. Алгоритму потрібно лише кілька слів (бажано англійською мовою), щоб розпочати роботу над картинкою. Сьогодні ця нейромережа перебуває на стадії відкритого бета-тесту, випробувати її може кожен. Потрібен лише обліковий запис у месенджері Discord, через який можна під’єднатися до бота Midjourney.

Я не маю досвіду ані в малюванні, ані в роботі з нейромережами. Але всього за 10 хвилин роботи з ботом я зміг отримати від нього кілька симпатичних, хоча й трохи похмурих зображень. Чим не альтернатива фотобанкам?





Під час роботи слід пам’ятати про обмеження сервісу. По-перше, це власне обмеження на операції для нових користувачів. У Midjourney кожному на безоплатній основі доступно лише 25 операцій: сюди входить як генерація нових зображень, так і апскейлінг чи ітерування вже згенерованих. Команда проєкту пояснює це тим, що змушена обмежувати користувачам GPU-хвилини через надмірне навантаження на сервери.

По-друге, задля кращого результату слід формулювати лаконічні й однозначні ключові слова, уникаючи зайвої образності. Якщо вам важлива точність, то не треба вбивати в бота Midjourney щось на кшталт «чорний кадилак шурхотів мокрими шинами на трасі посеред глухого лісу». Краще введіть ключові слова «чорна машина, дорога, йде дощ, ліс».

Чи замінять нейромережі людей

Художники та дизайнери тут справедливо заперечать, що отримані вище ілюстрації не підходять для використання у реальних масштабних проєктах. Це швидше макети, які потребують суттєвої обробки у фоторедакторі. Тобто людину з процесу виробництва контенту виключати ще зарано. Але тут важливо наголосити на кількох нюансах.

По-перше, процес розробки Midjourney лише розпочався й перебуває на ранній стадії. Можна лише уявити, як працюватиме ця технологія за кілька років, якщо її не закинуть. Нині подібні проєкти розвиваються як відкриті або некомерційні, великі інвестори лише придивляються до них.

Але все дуже швидко може змінитись. Наразі над Midjourney працюють всього 11 людей, це незалежний проєкт. Та уявіть собі продукт бізнес-класу, який можуть створити на основі подібних алгоритмів десь в Adobe або Google.

По-друге, мої результати було отримано буквально протягом лічених хвилин, без ніякої професійної чи спеціальної підготовки. З точки зору будь-якого бізнесу та будь-якої розробки, в певних випадках краще отримати 50 макетів зображень просто зараз, ніж чекати на десяток ескізів від ілюстратора наступного тижня. У цьому випадку співвідношення «якість/ кількість» вже не грає на користь людини.

По-третє, якість зображень нейромережі безпосередньо залежить від того, як її налаштувати та які їй вказати параметри. Ви легко знайдете в мережі масу високоякісних й навіть шедевральних ілюстрацій Midjourney, які були отримані ентузіастами. Навіть новачку сьогодні доступні тонкі налаштування та безліч опцій генерації зображень.

Крім того, кожне зображення можна проганяти крізь різні ітерації та апскейлінг — доти, доки користувач не отримає бажаного результату.

Ці портрети нейромережа згенерувала під проводом ентузіастів

І все це наштовхує нас на важливий висновок: професії дизайнерів та ілюстраторів справді зазнають серйозних змін. Щонайменше, їм доведеться опанувати налаштування та керування машинними алгоритмами, ставати «арт-інженерами».

Як зміниться професія

Донедавна ніхто серйозно не сприймав перспективу такого розвитку подій. Декілька років тому одіозного російського дизайнера Артемія Лебедєва буквально висміяли, оскільки його студія малювала відверто провальні логотипи, а він пояснював це таємними випробуваннями дизайн-нейромережі на ім’я «Ніколай Іронов» (примітно, що «Ніколая» все ж не закинули і сьогодні він продовжує розвиватися).

Водночас дизайнери вже багато років спираються у своїй роботі на штучний інтелект, часто навіть не усвідомлюючи цього. Скажімо, чимало функцій Adobe Photoshop в останніх його версіях зав’язані на машинні алгоритми.

Існують сервіси для автогенерації реалістичних пейзажів й навіть людських облич (на кшталт Сanvas та StyleGAN від Nvidia). Ба більше, постобробка фотографій в iOS та Android давно не обходиться без штучного інтелекту.

Це означає, що всі професії, пов’язані з виробництвом візуального контенту, в осяжній перспективі вимагатимуть базового знання інструментів Machine Learning, а іноді навіть експертизи в них. І це стосується не лише ілюстраторів та художників, а й дизайну UX.

Нейромережу цілком можна навчити збирати інтерфейси, просто навчивши її на готових проєктах та поширених сценаріях використання сервісів. По суті UX-дизайнер й сам робить те саме — дивиться кейси й референси, вивчає сценарії користувача та фідбек. Просто нейромережа може виконувати цю частину роботи швидше.

Чи зникнуть дизайнери

Певна річ, що ні! Людський досвід, здоровий глузд та естетичний смак навряд чи можна буде замінити чимось штучним в осяжній перспективі. Нейромережа може згенерувати сотні зображень, але хтось має налаштувати саму генерацію та надати картинкам адекватну оцінку. Врешті, алгоритми добре працюють там, де не потрібна адресність та надмірна деталізація. Живі дизайнери та художники усе ще будуть вирішувати специфічні творчі завдання набагато краще.

Однак, не можна заперечувати того факту, що ці професії відчутно зміняться через чергову tech-революцію. Цілком імовірно, що через 5-10 років ми побачимо на ринку дизайнерів-операторів нейромереж, чимало з яких навіть володітимуть навичками кодингу.

При цьому дизайнерів не замінять ані програмісти, ані розробники алгоритмів, адже такий фахівець усе ще має добре розумітися на основах композиції та принципах створення інтерфейсів, володіти художнім хистом і талантом.

Парадокс, але штучний інтелект сьогодні набагато швидше вчиться малювати та писати художні тексти, ніж кодити на Python або верстати вебсторінки. Але про це ми поговоримо вже якось іншим разом.

👍ПодобаєтьсяСподобалось6
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Відбере конвейер у нас роботу чи ні — гадали працівники авто майстерень дивлячись на винахід Генрі Форда...

Дослідивши частотність словосполучень можна створити ще й AI графомана.

Чи відберуть нейромережі роботу в дизайнерів і художників — роздуми ІТ-менеджера

Навряд чи нейромережі.
Але якщо IT-менеджери знайдуть спосіб докучати дизайнерам і художникам своїми недолугими мітингами — то відберуть в них не стільки роботу, скільки можливість нормально її виконувати.

якщо буде вміти генерувати порно, то в технології є майбутнє :))

Прогрес генеративних мереж вражає. Але генерувати вони можуть лише те на чому вони навчалися і лише один раз. Це накладає відповідні обмеження на використання результатів. Тобто, стилістично це завжди буде мішанина, і ви ніколи не зможете примусити нейромережу намалювати той самий результат але в іншому контексті. Тобто, комікс не намалює. Навіть, фірмовий стиль не намалює. Бо це звісно дуже великі функції, але на тлі людської уяви вони не помітні. Окрім того я спробував згенерувати зображення за допомогою Midjourney і ти самі слова «black car, road, raining, forest» просто згодувати гуглу і результат був якісно та кількісно значно кращім. Ці результати навіть порівнювати неможливо.
Коротко це все можна назвати так — безмежною генерацією якісного сміття на базі плагіату.
Тем не менш, дизайнерам варто опановувати цей інструмент. Він значно безпечніший і продуктивніший, ніж спроби намалювати спогади про свій кислотний тріп )
media.discordapp.net/...​9dd-9349-0ab5445c2744.png

ви тупо не розумієте, ніхто не каже про повну заміну. Навіть в вашому прикладі з машинним перекладом — це зменшило на порядки попит в перекладачах, багато в яких випадках був потрібний приблизний переклад. висококваліфікованих перекладачів воно не замінило, але тисячі робочих місць для «простих» перекладачів воно знищило. те саме відбудеться з дизайнерами.

Торренты никто не регулирует, так же и будет с цифровыми рисунками, созданными на ИИ.
Авторское право и интернет всегда не дружили друг с другом.

Штучний інтелект вплине на вартість послуг митця.
Я думаю буде попит на щось типу цифрового замку (той що на дверях) щоб не давав авторського права подібним програмам легально навчатись на малюнках які мають такий «замок».
А в програмах має бути легальний обмежувач доступу до таких зображень.
Але це типу думки.
Коротше ще стало видніше що цифровий світ треба регулювати.

focus.ua/...​urse-hudozhniki-v-yarosti

Історично, цифровий замок на витворах мистецтва нічого не може змінити. DRM в свій час зробив підмур’я для торгівлі поцупленим контентом. Тобто, коли аудіо валяється на кожному кроці, то лавку не відкриєш. Позбавлення аудіо ріпа легальності, надання аудіо запису якогось замка, надало перевагу сміливим підприємцям, торгівцям краденого контенту. Поки боротьба зупинилась на ідеї суперскейлити лавко-бізнес, тим самим видавлюючи малих нелегальних гравців з ринку за рахунок переваг великих. Але, великий гравець має важіль не тільки проти конкурентів, але й проти постачальників. І от то виявилось бідою для митців.

Як перемножения матриць, векторів та операції над тензорами дійдуть до рівня, що зможуть замінити дизайнерів, боюсь нас чекає сценарій з циклу фільмів Термінатор, а потім вже і Матриця. Треба певно написати научпоп статейку, принаймі щоб народ розумів, що може machine learning — а чього ні, чи ще ні. P.S. Насправді те, що ми бачимо на зображеннях — це витвір людини за допомогою класифікатора на базі штучної нейронної сітки. Ця сітка не вміє сама собі завдання ставити, по типу вивчати всесвіт і будтя — задля цього здійснити політ к Марсу, чи збудувати величезну комічну обсерваторію тощо.

чи зможе штучний інтелект за якихось 5-7 років малювати нам макети дизайну та інтерфейсів без участі людини?

Звісно зможе korzik.net/...​osts/2022-10/17299978.jpg

Так про програмістів такі самі анекдоти ходять. Що, дружина спитала сходити в крамницю за хлібом, а як будуть добрі яйця — то купити десяток і той прийшов додому із десятьма буханками хліба. Бо формалізм — наше усе.

Підписатись на коментарі