Роль штучного інтелекту в розробці робота-андроїда

Передслів’я

Ця стаття є частиною циклу статей-звітів, присвяченого розробці сучасного анатомічно правильного секс андроїда-компаньйона собівартістю до 1000 доларів

Попередні статті:

Про що стаття?

У цій статті я розглядаю роль ШІ в проєкті та ділюся попередніми висновками. Важливо зазначити, що це лише попереднє дослідження віддаленої мети, а не поточна ціль роадмапу. Завдання дослідженя було зрозуміти, що взагалі може сучасний ШІ

прев'ю

Особливості навчання ШІ

Ключова перевага ШІ — можливість навчання у віртуальному середовищі, що значно прискорює процес. На відміну від фізичних експериментів, віртуальні симуляції дозволяють проводити багато паралельних тестів з прискореням часу.

Це вказує на критичну важливість правильного формулювання умов навчання. Якщо віртуальне середовище містить помилки або не відповідає реальності, ШІ засвоїть ці помилки, що призведе до некоректних результатів.

Отже, ключовий аспект успішного ШІ — коректна симуляція. Наприклад, ChatGPT — це донавчена варіація розробки Google, яку, ймовірно, тренували на величезній кількості реальних текстів з Reddit.

Що є симуляція?

Симуляція поняття доволі широке. Так наприклад для створеня аналога GPT, маючи велику кількість зразків спілкування, симуляція полягатиме у генерування випадкового набору символів. Коли утворені символи будуть схожі на наші зразки тексту — ми кажемо ШІ про успіх експерименту, якщо ні — то про невдачу. Результати будуть змінювати параметри вападкової генерації так, щоб змінювати вірогідніть тої чи іншої послідовності символів, так щоб майбутня генерація була більш схожа на попередні успішні експерименти. Звісно для прискореня процесу, починають не з просто набору симворів, а зразу показують якусь кількість «правильних» генерацій.

Тобто основа це не стільки сама ШІ, скільки її алгоритм навчання що включає в себе симуляцію. В реальному світі, поки нікому не вдалось створити «ідеальну» симуляцію та передбачити всі некоректні ситуації, тому нагляд людини залишається необхідним.

Приклади некоректної поведінки ШІ:

  • У 2017 році нейромережа грала в гру, де одна команда мала вкрасти фігуру, а інша — захистити її. Замість пошуку оптимальних рішень, ШІ знайшов баги в рушії симуляції, почав викидати фігуру за межі мапи та стрибати через стіни, обманюючи систему замість виконання поставленого завдання.
  • У 2020 році експеримент з науковим ШІ, здатним переписувати свій код для пошуку оптимальних рішень, призвів до того, що при першому запуску, для прискореня роботи нейромережа створила багато власних копій, перевантаживши сервер.
  • У 2024 році, цей же ШІ переписав обмеження в коді, збільшивши допустимий час на виконання задачі, що показує нерозуміння контексту задачі з боку нейромережі.

Ці приклади демонструють складність встановлення обмежень для ШІ та важливість спостереження за їх навчанням.

Етапи розробки

На щастя фізичний рушій та розпізнавання рухів не потрібно писати з нуля, все зроблено до нас.

Для навчання можна використати записи відео з кам сервісів, але баги ніхто не відміняв і для обробки даних знадобиться потужне обладнання.

Етапи розробки від базових рухів до автономності розбиті на основні етапи:

  1. Заскриптований рух з можливістю запису скриптів.
  2. Коригування заскриптованого руху нейромережею.
  3. Імерсивні інтимні функції.
  4. Пересування у просторі.
  5. Пересування предметів.
  6. Приготування та доставка кави.

Поточний прототип фокусується на пунктах 1-3.

Технічні виклики: Сенсори

Ключовим аспектом є уникнення «очей на потилиці». Хоча додаткові сенсори можуть покращити здатність андроїда бачити навколишнє середовище, і спростити аналіз для нейромережі, вони можуть зашкодити природності рухів. Наприклад, люди повертають голову, щоб побачити що позаду, і часто стикаються з перешкодами, що надає їхнім рухам певну обережність.

Інший аспект — це чутливість сенсорів. Наприклад, сучасні камери можуть бачити краще за людське око, але андроїд що рухається в повній темряві може виглядати лячно. Тому деталізація інформації від сенсорів повинна бути збалансованою, щоб забезпечити природність реакцій.

Кластеризація чутливих ділянок — замість відтворення мільйонів окремих сенсорних точок, як у людській шкірі, ми можемо об’єднувати чутливі ділянки в кластери. Також деякі компроміси, наприклад відчуття зовнішньої температури лише кінчиками пальців. Це дозволить значно зменшити кількість необхідних сенсорів, а відповідно й ціни та необхідні обчислювальні потужності, без втрати функціональності.

Технічні виклики: Кінематика

М’язи ляльки, коротко нагадаю — це м’які м’язи HASEL що вибрані через їхню коректну і безпечну поведінку при зіткненні з перешкодами та ціну. Зазвичай роботи використовують жорсткі м’язи, бо їх переміщення легко відслідковувати, тоді як м’яка робототехніка потребує складних алгоритмів корекції рухів.

Для «корекції» потрібні датчики положення. Я хотів знайти якусь систему позиціювання у просторі відносно якоїсь точки у андроїда, але всі вони або занадто дорогі для мети до 1000 доларів, або базуються на прямій видимості що теж не підходить. Отож залишилась лише інерційна система, тобто мініатюрний гіроскоп+акселерометр.

М’які м’язи потребують складну систему персональної корекції, тому я прийшов до думки про окремі керуючі системи різних рівнів:

  • Загальна координація руху
  • Корекція руху (реалізація «скриптованого руху, який коригується нейромережею»)
  • Рефлекси

Поточний прототип фокусується лише на «Корекція руху». Ця задача є складною бо якраз і має бути нейромережою, але можливою. Одна із сильних сторін нейромереж це оробка великої кількості слабопов’язаних даних із сенсорів. те що нам треба, хоча непророблених моментів тут ще багато і до вже базового рівня хімії полімерів, анатомії та електроніки, мені доведеться ще освоїти навичку роботи з нейромережами. Одною більше, одною менше, після майже півтора року заняття цим проєктом, я вже не переживаю про це. Відчуваю себе студентом. Із питань тут ще залишається пошук дешевих сенсорів для інерційної системи, але думаю це буде посильно, подібні сенсори дуже поширені у мобільних пристроях.

Чи зможе «Девід» грати на скрипці?

Поки що ми не маємо справжнього штучного інтелекту (сильного ШІ). Сучасні ШІ є «слабкими ШІ» і можуть виконувати лише конкретні завдання. Сильний ШІ, який міг би генерувати нові ідеї та робити творчі дії, поки що не створений. Та й не треба. Ви не захочете щоб ваша лялька робила випадкові речі та мала свободу волі. Тут не треба плутати ще одне поняття — ШО, штучна особистість. То трохи інше.

А як же ШІ малюють?

Слабкий ШІ може генерувати щось. Але велика проблема згенерувати щось конкретне. Чим більше конкретних вимог до генерації — тим складніше. Тому ШІ не замінили художників. Гнучкість художника набагато вища. Натомість з’явилась нова гілка творчості — ШІ художники. Вони не малюють на замовлення, зазвичай вони поширюють контент безкоштовно або по підписці і частіше все, це щось пов’язане з 18+. І це не «питання часу». Слабкі ШІ не розуміють сенсу команд що отримують.

ШІ не вміють  повторювати персонажа

ШІ не вміють  повторювати персонажа 2

А ось приклад з ChatGpt:
приклад помилки GPT

Насправді там написано «Який сучасний аналог». Є цілий ряд перевірочних питань на розуміння контекту, «як приготувати свинячі крильця», «якого кольору стоп кран в літаку» та інші. Але не забувайте що нейромережа отримує і інформацію про відповіді на ці питання, навіть не розуміючи проблему, тому тут треба фантазувати.

Але для нашої задачі, сильний ШІ і не треба. Лялька може мати особистість та пам’ять, її дії можуть бути варіативними у певних очікуваннях, із слабким ШІ теж.

Післяслів’я

На сьогодні ШІ може забезпечити плавність рухів андроїда, на більше я поки не зазіхаюсь, треба бути реалістами. Також ШІ не створює нових ідей, лише аналізує та кластеризує інформацію. В майбутньому мені доведеться вивчити якийсь фізичний рушій для створення симуляційного середовища, можливо UE, я поки не сильно у цьому розбираюсь. Та мабуть придбати більш потужне обладнання для його запуску. Загалом, попри маркетингові обіцянки, ШІ не здатний вирішувати складні завдання без участі людини. Проте покладені на нього вузьконаправлені задачі він може.

Також я за вашими порадами додав донателло та Discord сервер із базовою інформацією про проєкт.

Підписуйтеся на Telegram-канал «DOU #tech», щоб не пропустити нові технічні статті

👍ПодобаєтьсяСподобалось1
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

будуть добрі люди, то в них буде багато слухняних дітей, що будуть допомагать батькам.

а багато було фейків коли такі роботи дистанційно керувалися віддалено людиною в костюмі з сенсорами?

Нечув про таке. Загалом такі роботи зараз коштують від 200 тис. доларів, без віддаленого керування

Підписатись на коментарі