Поширені міфи про AI/ML — та чому вони залишаються міфами
Привіт і Слава Україні! Мене звати Богдан Питайчук, я СІО AI HOUSE та Deep Learning Researcher у Reface. Працюю розробником в індустрії машинного навчання протягом п’яти років.
Я дуже чітко пам’ятаю період, коли вперше почув про AI. Суперінтелект. Сфера, яка є «the new electricity». Прорив, що не ставався з часів появи інтернету. Звичайно, я швидко захотів пов’язати своє життя зі штучним інтелектом.
Чим далі я розвивався у сфері, тим чіткіше бачив різницю між тим, що пишуть у світових медіа, і тим, чим є технологія насправді.
Виявилося, що увесь світ розмовляє про штучний інтелект. Проте лише невеликий відсоток людей справді розуміє, що ці слова означають. Тому вирішив зібрати найпоширеніші міфи в одну публікацію, аби розвінчати їх раз і назавжди.
Почнемо.
AI захопить увесь світ
Гадаю, ви помічали, що зазвичай медіа малюють AI, як бездушного робота, який ось-ось захопить всесвіт і буде ним керувати, враховуючи лише свої інтереси.
Є декілька причин цього misconception. Візьмемо для прикладу формулювання однієї з нещодавніх новин, яка завірусилася:
«Google створив систему LaMDA — AI, що має свідомість (is sentient)»
Так вже склалося, що медіа люблять подавати новини щодо AI занадто фаталістично.
Звісно, це підвищує охоплення, збільшує кількість лайків у соцмережах, зрештою залучає ширшу аудиторію. Ось, наприклад, статистика Google Trends по запиту «Has Google created Sentient AI», яка досягає піку інтересу.
Саме це і спокушає видавців подавати інформацію під кутом, який орієнтований на кількість кліків. А не правдиве розкриття інформації. Навіть у цій статті використовується термін AI, хоча професії AI-розробника не існує. Є Data Science, Machine Learning Engineer, Deep Learning Engineer.
Якщо коротко, то AI — це технологія, яка дозволяє системі імітувати людську поведінку. Вищеописані професії лише допомагають цього досягнути. Надалі я вживатиму термін AI, щоб у вас не кипіла голова від різноманітності термінів, але знайте, що це — певна апроксимація назви для зручності.
Друга причина хибного уявлення про AI — нерозуміння принципу роботи штучного інтелекту. Пропоную закрити це питання раз і назавжди:
Якщо говорити максимально спрощено, то те, що ми називаємо AI, — це набір алгоритмів, які здатні знаходити патерни в даних.
Дитина знаходить патерни, за якими відрізняє різні види тварин (котика від собаки, білку від бобра тощо). Лікар знає залежності, які дозволяють визначити захворювання з огляду на результати аналізів або зображення рентгенівського знімка. Досвідчений трейдер орієнтується в метриках, які спричиняють зростання чи зниження цін на акції компанії.
Навіть митець, що створює картини чи музику, може мати свій особливий «почерк». Виходить, що стиль теж є шаблоном, який можна помітити та відстежити.
Проте чим далі від шаблонності — тим складніше AI. Взяти, наприклад, здатність керувати автомобілем. Задача не елементарна, але реальна. Практично кожна людина може цьому навчитися, причому 98% часу за кермом водії виконують автоматичні дії за однакових візуальних умов.
Чому ж тоді найбільш креативні й розумні люди зі всього світу ще не створили систему, що була б повністю автономна і підходила б для будь-яких доріг в різних місцевостях? Челендж криється саме у нешаблонних ситуаціях.
Ось показовий кейс, взято з Twitter:
Будь-яка людина без проблем побачить, що перед нею вантажівка, що перевозить світлофори.
Людині очевидно, що у цьому разі світлофори будуть рухатися, так само як і вантажівка, що їх везе. Проте AI-система під час навчання розпізнавала лише світлофори, які знаходились на статичних стовпах і рухалися крізь авто. Все це призвело до смішних, але показових результатів.
Способи вирішення? Зараз у світі ітерується багато гіпотез, як можна вирішити проблеми сфери. Як на рівні нових архітектур, так і покращення самих даних, способу їх компонування та «сприйняття» мережі алгоритмами.
Отже, як AI «сприймає» навколишній світ? AI працює, як людський мозок. Наступну історію я почув в одному з інтерв’ю з Demis Hassabis, CEO компанії DeepMind:
1997 рік. Йде запекла боротьба між двома шахістами. Але один з них — це Deep Blue. Алгоритм, що дуже якісно навчився грати у шахи. Після боротьби машина таки здобуває перемогу.
Але не це вразило Деміса. Він знав, що комп’ютер має змогу вираховувати більше можливих комбінацій шахових фігур. Здивувало його те, що людина здатна настільки якісно протистояти алгоритму.
Все, що вміє даний алгоритм, — лише грати в шахи. Він не розуміє мови, не може бачити, сприймати та взаємодіяти з нашим світом у всій його багатогранності.
Це і є Artificial Narrow Intelligence. Хоча ми рухаємося у бік «розширення» частини Narrow, поки AI станом на зараз все ще Narrow.
Так, є свіжі прориви. Наприклад, єдиний алгоритм, що може грати в будь-яку настільну гру. Або мультимодальні архітектури, які можуть працювати з даними різних доменів: зображення, текст тощо. Але навіть ці відкриття і близько не наближаються до можливостей людини.
У чому ж причина?
Що ще варто знати про різницю між нами та AI
Головне — це спосіб сприйняття світу. У нас є 5 основних способів сприйняття світу. Розберемо деякі з них — зір, слух.
Як людина бачить? Комплексна система. Є орган сприйняття — зіниця ока. Вона вловлює фотони світла і передає сигнал в головний мозок. До речі, ви знали, що очі — це, по суті, «видавлений» з черепа шматок мозку? Отакої.
Мозок, зі свого боку, «рендерить» зображення таким чином, аби ми могли бачити, що відбувається навколо.
Візьмемо слух. Вухо, у якому є барабанна перетинка, вловлює хвилі коливання. Потім трансформує їх у певні сигнали, які наш мозок здатен розпізнати.
Мозок — це складна біологічна структура, нейронні зв’язки якої працюють у складних хімічних взаємодіях. Структура нашого мозку — динамічна, тобто вона постійно змінюється, запам’ятовуючи та забуваючи. І хоча людство досить далеко просунулося в розумінні всіх цих процесів, треба визнати — наразі ми не маємо стовідсоткового уявлення, як працює наш мозок. Красива візуалізація роботи мозку, взята з Twitter:
Що ж до сприйняття світу AI. Спосіб сприйняття — цифровий. Виходить, що системі варто трансформувати світ з людським сприйняттям у світ чисел.
Кожній літері відповідає певний набір чисел. Навіть зображення — це набір цифр (RGB пікселі від 0 до 255).
А найбільш робоче, що (поки) придумали для репрезентації музики під час тренування нейронних мереж, — це зображення її спектрограми.
Структура — статична, наперед визначена людиною. Причому ця людина і є «розробником штучного інтелекту», яка задає структуру в залежності від даних та задачі, що треба виконати.
Спосіб «спілкування» — також банальні цифрові коефіцієнти. Не суперскладна хімія синаптичної взаємодії, яка залучає велику кількість різноманітних хімічних речовин, а звичайна десяткова цифра.
Чи буде цього достатньо, щоб створити Artificial General Intelligence (тип Intelligence), що повністю повторюватиме свідомість та поведінку людини?
Питання відкрите, навіть філософське.
Покладаючись на власні міркування та дискусії серед AI-спільноти, думаю, що система буде здатна мімікрувати/ симулювати, але все ж таки не відтворювати людське сприйняття.
Спілкуватися, проте не усвідомлено, а відповідати фразами, які використовувалися найчастіше в тих даних, на яких навчали AI.
AI прийде і замінить усі професії
Насправді слабкі та сильні сторони має як людина, так і алгоритм. Правда, як завжди, криється у колаборації, співпраці цих двох світів.
Ось, наприклад, цікавий ресурс, де показується ймовірність заміни вашої професії штучним інтелектом. З цікавості можна перевірити не лише свою сферу діяльності, але й зробити висновки, які спеціальності будуть більш-менш актуальними, затребуваними та оплачуваними.
Якщо у вашій роботі багато рутини, ймовірність автоматизації АІ-шкою вкрай висока. Але чи це погано? Насправді автоматизація відбувається протягом останніх 100 років. Заміна упряжки з кіньми на автомобіль, створення персонального комп’ютера та розвиток мережі Інтернет лякали людство не менше.
І хіба сьогоднішній світ став гіршим?
Індустріальна революція не зупиняється. Людська еволюція продовжується. Так, певні види зайнятості зникнуть, але з’являться нові спеціальності, що будуть потребувати нових унікальних навичок, про які зараз ми й не здогадуємося.
Приклад нової навички — prompt engineering для дизайнерів. У чому її сенс? Остання новинка — бум text-2-image алгоритмів (приклад: Dalle-2). Ти пишеш текст — а нейронка генерує відповідне зображення.
Але для того, щоб отримати те, що треба, потрібно вводити правильну комбінацію слів і дивитися фідбек. Звісно, кожна нова генерація коштує грошей.
І от приходить новий спеціаліст — гуру prompt-інжинірингу, який може швидше і з меншою кількістю генерацій створювати те, що треба, водночас заощаджувати кошти компанії. Як на мене, це сильний пункт, щоб продати себе. Чи не так?
Висновок
Обережно фільтруйте клікбейтні заголовки з терміном AI. Пам’ятайте, що технологія — це лише можливість знаходити шаблони серед набору даних. До того ж ці дані слабше передають навколишній світ, ніж його сприймає сама людина. AI хоч і мімікрує людський мозок, але система дуже далека від його копії.
Якщо ви хвилюєтеся, що AI забере вашу роботу — переходьте на згаданий вище ресурс «Will Robots Take My Job?» і дізнайтеся, чи обґрунтовані ваші побоювання. Розслабтеся, нарешті, та працюйте спокійно, але слідкуйте за новими навичками та професіями.
Не гайте час і залишайтеся у курсі всіх трендів. Зміни — це про нові можливості, а не знищення старого життя. До речі, я регулярно розкриваю деталі та новинки індустрії у своєму telegram-каналі, долучайтеся, якщо цікаво.
32 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів