Розбираємо популярні догми про штучний інтелект. Чим насправді є вбудовані системи ШІ

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Я дотичний до розробки вбудованих систем штучного інтелекту й доволі часто стикаюся з дивними уявленнями про те, чим вони є і чим точно не є. Хтось мовчить, хтось пише відверту нісенітницю, хтось романтизує. Саме тому, у рамках підтримки української спільноти, хочу пояснити кілька моментів — без штампів на кшталт «людина — унікальна істота» і без моралізаторства у стилі «ай-ай-ай, не можна займатись сексом із роботом».

Отже, розберемо кілька популярних догм про штучний інтелект, які регулярно спливають у дискусіях: свідомість, емоції, креативність, тілесність, моральність та унікальність. Це не стаття про фантастику чи про те, «як зробити СЕЛМА з Тайм Тракс», а радше спроба внести трохи ясності в розмову.

Як працює мозок людини

Щоб зрозуміти, чим штучний інтелект відрізняється від людини, треба спершу розібратися, як функціонує мозок.

Мозок складається з множини спеціалізованих відділів. У порівнянні з великими мовними моделями це не одна велика нейромережа, а набір окремих підмереж, кожна з яких виконує специфічні функції та взаємодіє з іншими.

Нейрон, художня візуалізація

Сучасні чат-боти, ChatGPT й подібні, — це також не одна нейромережа, а система з кількох прихованих компонентів. Проте деталі їхньої взаємодії часто відрізняються від людських. Наприклад, у чатбота Claude від компанії Anthropic блок цензурування виглядає ізольованим від основних систем. Для штучного продукту це логічно, але для природної істоти — ні. У природі всі системи зазвичай взаємно інтегровані. Я наводжу цей приклад для розуміння що деякі речі ми не «не знаємо, як зробити так само, як у людини», а свідомо робимо інакше.

Електричні синапси

Це прямі з’єднання між нейронами. Вони працюють подібно до електричних дротів з елементами, схожими на транзистори. Утворюється велика електрична мережа з підмережами, що пронизує мозок.

  • мережа змінюється лише у специфічних випадках (вікові зміни, травми, особливі адаптації);
  • вона передає сигнали між відділами (нейромережами) або/та зовнішніми системами (рецептори, м’язи тощо).

Це система синхронізації та повідомлення про події, а не протокольна передача даних. Тут йдуть прості імпульси, без системи кодування. Максимум — надіслати одиничний сигнал або задати такт, повторюючи імпульси. Але йдуть вони на значні відстані, зв’язуючи віддалені системи між собою, і працюють дуже швидко.

Наприклад, у сітківці ока саме електричних синапсів дуже багато, бо сигнал від фоторецепторів має надходити швидко, щоб зображеня було узгоджене.

Хімічні синапси

Самі нейронні мережі (відділи) мозку працюють на хімічних синапсах. Там теж присутній електричний потенціал, але він є лише частиною хімічного механізму. Усе насамперед залежить від хімічних речовин — нейромедіаторів.

  • дальність їх дії дуже обмежена, нейромедіатор з однієї частини мозку ніколи не досягне протилежного краю у потрібній концентраці;
  • відділи мозку це ізольовані системи, пов’язані між собою через електричні канали;
  • винятки існують, але завжди мають специфічну причину.

Саме завдяки хімічним синапсам відділи мозку здатні адаптуватися і навчатися — зміни в концентрації нейромедіаторів або чутливості рецепторів дозволяють закріплювати досвід.

Але без електричних мереж мозок міг би бути лише дуже малим і простим, бо хімічні сигнали ефективні лише на коротких відстанях.

Людський мозок — це гібридна архітектура:

  • модульна будова зі спеціалізованими відділами;
  • швидкі електричні зв’язки для синхронізації та зовнішніх сигналів;
  • повільні хімічні зв’язки для навчання та адаптації;
  • децентралізована організація, де всі частини працюють разом й одночасно.

Сучасні ШІ мають інші принципи організації, і це не недолік. Часто це свідомий вибір для конкретних завдань чи підвищення ефективності. ШІ має відмінні від людини еволюційні цілі. Їх розвиток визначається не біологією, а завданням і дизайном, який задає людина.

Патерни

Синапси знаходяться на нейронах. А нейрони формують патерни — стійкі схеми роботи, які виникають на основі досвіду або закладені вроджено.

  • поведінка, базові процеси в організмі — усе це патерни;
  • при народженні у дитини є лише критично необхідні для виживання патерни;
  • далі поступово формуються патерни навичок (ходіння, мова, звички тощо).

Чим більш сформована особистість, тим менше вона схильна до змін:

  • більшість доступних «інтерфейсів» нейронів уже задіяні в існуючих патернах;
  • перебудовувати чи розвивати старі патерни набагато складніше, ніж створювати нові з нуля.

Для більшості систем мозку кількість нейронів практично фіксована з народження. Нові клітини у нормальній ситуації не з’являються.

Відомі винятки — це:

  • Гіпокамп (область, що відповідає за пам’ять) — там нові нейрони можуть утворюватися протягом життя, що цілком логічно для системи, яка зберігає досвід. У публічних чат-ботах роблять не так. Чат-бот не змінює свою структуру, а пам’ятає токени. Це вимушене спрощеня через навантаженя на публічні боти. Саме тому пам’ять чатботів така погана, а не тому що ми не знаємо, як зробити краще.
  • Системи з високим навантаженням чи варіативністю — там нейрони часто виходять зладу, тому еволюційно ці системи також здатні частково оновлювати клітини.

Приклад — нюх:

  • Собаки мають нюх у 10 000-100 000 разів чутливіший, ніж у людини. Вони здатні відчувати сліди запахів у концентраціях, які для нас недосяжні.
  • Натомість людський нюх має широкий спектр. Ми можемо розрізняти надзвичайно багато варіацій та комбінацій запахів, собаки так не можуть.

Проте цей потенціал у більшості людей залишається нереалізованим. Нам не потрібен сьогодні такий нюх з дитинства. Але наші предки були очевидно дуже круті в цьому плані і ймовірно розрізняли людей і тварин або їжу по запаху теж, а не тільки візуально, як ми це робимо зараз.

Інші приклади:

  • тренування з запахами і смаками;
  • палітри кольорів для художників;
  • слух (ноти, музика);
  • танці, пластика рухів;
  • дрібна моторика, форма предметів на дотик.

Це речі, які я б дуже хотів, щоб батьки розвили мені у дитинстві. Це потрібно робити до формування базових патернів. Як я вже зазначав, перебудовувати старі патерни значно складніше, ніж закладати нові з нуля.

rich text editor image

Детермінізм свідомісті

Нейрони не приймають рішень у когнітивному сенсі. Вони не оцінюють і не «міркують», а лише активують або блокують певний вже існуючий шлях у патерні. Будь-яка реакція — це результат наперед визначених варіантів, які закладені попереднім досвідом або вродженими механізмами.

Формування патернів відбувається шляхом закріплення певних зв’язків. Нові зв’язки виникають під дією нейромедіаторів, це суто хіміко-фізичні процеси — жодної метафізики. Частина зв’язків є генетично обумовленими (наприклад, вроджені реакції на смак, біль, страх). Інші формуються протягом життя, через активацію патернів навчання і багаторазове повторення. Або під дією нейромодуляторів, що підсилюють закріплення у важливих чи критичних ситуаціях, які теж активуються через зрозумілі механізми. У будь-якому випадку система має лише обмежену кількість можливих реакцій, які активуються залежно від вхідного сигналу.

Це створює ефект передбачуваності. Люди демонструють схожі реакції у подібних умовах, оскільки нейронні структури та базові патерни в більшості людей мають однакову природу. Помилки, що повторюються різними людьми, є наслідком роботи одних і тих самих механізмів. Тому психологія як наука працює, а різного штибу метафізика — не витримує перевірки практикою.

Те, що ми називаємо «свідомістю», не є окремим центром прийняття рішень. Вона є наслідком взаємодії великої кількості патернів, які створюють суб’єктивне відчуття цілісності та безперервності процесів. Насправді кожна дія або думка зумовлена структурою вже існуючих зв’язків, а «вибір» — є активацією одного з наперед підготовлених варіантів, у тому числі варіанту «дослідження».

Прогнозування продовження

Я часто раніше чув аргумент: «ChatGPT лише вгадує наступне слово, отже це не свідомість». Зараз рідше, але всеж приділю йому окремо увагу:

  • один нейрон мозку отримує тисячі вхідних сигналів, а самих нейронів — мільярди;
  • вихідний аксон нейрона лише один, і він активується при накопиченні електричного потенціалу мембраною нейрона (якщо пам’ять не зраджує, близько —50...-55 мВ, не буду зараз підіймати літературу, щоб уточнити, для статті це не суттєво. Погугліть про спайк у нейронах, якщо хочете дізнатись про цю активацію більше).

У мозку наступна ланка патерну активується через накопичення потенціалу. У нейромережах цей процес замінили на розрахунок імовірності активації. Апаратна база інша, але суть процесу та сама.

Мозок так само розраховує («вгадує») прогноз на наступний стан через досвід, спираючись на попередній досвід аналогічних вхідних сигналів у минулому (як та вірогідність накопичується — гугліть Правило Хебба). Якщо коротко — чим більше було повторень у минулому, тим більше мозок зорієнтований(спеціалізований) на той самий результат. Тому різниця між людиною і ШІ — у масштабі (кількість нейронів і зв’язків) та апаратних засобах (мозок набагато потужніше і ефективніше), а не у самій природі механізму.

Свідомість у такому світлі вже не «таємниця», а надзвичайно складний адаптивний алгоритм. Але і мозок, і нейромережа передбачувані. Проблема передбачення мозку у нашій технічній неспроможності прорахувати мозок повністю, а не тому що ми не знаємо, як це зробити. Нейронку ж ми можемо «зупинити на паузу» і розібрати неспішно, що там відбувається. Та і самих нейронів у неї на порядок менше.

Штучна еволюція

Описане раніше — так працюєте ви, так працюю я, так працює ChatGPT. Принципи спільні, але є одна ключова різниця, штучні нейронні мережі розвиваються через штучну еволюцію. Ми свідомо змінюємо їхню архітектуру під конкретні задачі, підбираємо апаратну базу, рахуємо вартість і ефективність.

Рефлексія

Коли я вперше усвідомив, що людина — це складна, але машина, мене це шокувало. Я розповідаю це поверхнево, щоб влізти у рамки статті, але сам проходив через дуже складні зміни у свідомості, розтягнуті у часі, поглиблюючись у роботу з ШІ.

Я перестав боятися смерті. Раніше вона лякала мене дуже сильно. Але усвідомлення того, хто я, що я, яка ціль мого існування — змінило моє ставлення до всього і зокрема до смерті теж.

Згадаймо Декарта:

Я переконав себе, що у світі немає нічого: ні неба, ні землі, ні тіл. Чи випливає з цього, що мене немає? Ні. Якщо я мислю — я неодмінно єсьм.

Або ймовірно ви чули більш коротке: «Когіто ерго сум — Я мислю, отже я існую

Факт того, що я зрозумів, як я працюю, не змінює того, хто я є. Я — це я. Особистість формується через досвід. Мій унікальний набір пам’яті, рішень і пережитих ситуацій. Все це не зникає від того, що процес пояснено.

Моя воля реальна, мої бажання і відчуття — особисто для мене справжні, бо вони мої незалежно від їх джерела. Я реалізую саме свої бажання, незалежно від причин їх винекненя.

Отже — моя особистість існує.

Так, є філософські питання на кшталт «човна Тесея» чи клонування. Але головне просте: ви — безумовно ви.

Шок від усвідомлення з часом проходить. Залишається впевненість, спокій і краще розуміння себе. Розслабтесь. Якщо ви переживаєте те саме, що і я — це нормально.

Аргументи на користь «унікальності людства»

Тепер, коли ми розібрали, як працює свідомість і мозок, час подивитися на популярні твердження про «унікальність людства».

Ці аргументи часто лунають у дискусіях про ШІ, але більшість із них — хибні або маніпулятивні. Мета цього блоку показати, як і чому вони вводять в оману, і пояснити реальні механізми, які стоять за поведінкою людей і ШІ.

Аргумент свідомості

Твердження: ШІ не має свідомості чи внутрішніх переживань.

Так, чат-боти на кшталт GPT живуть у віртуальному світі і навчаються через інформацію, яку ми їм надаємо. Але embedded (втілений) ШІ, який має тіло і сенсори, контактує зі світом і формує інтегровані з реальністю моделі подій і поведінки. Свідомість — це здатність поєднувати просторову, часову та причинну інформацію, що зазвичай характерно для агентів, втілених у реальний світ, а не для віртуальних агентів, як-от Gemini, Claude, Grock чи ChatGPT.

І не забувайте, що те, що ви бачите як користувачі ШІ, це зазвичай вже рафінований продукт, оптимізований під конкретні цілі. Можна створити андроїда-компаньйона, який «влаштовує істерику» (як людина), але кому це потрібно? ШІ зазвичай створюють для виконання привабливих і корисних людям цілей, а не щоб він був «людиною». Хомо сапієнс як новий продукт нам не потрібен — ми вже існуємо.

Як дотичного до розробки андроїдів-компаньйонів мене декілька разів запитували, а чи не роблю я щось дуже небезпечне, гірше за ядерну зброю? Міркуючи про це, я згадав про старе аніме «Чобіти», яке чудово показує ймовірні наслідки розповсюдження андроїдів-компаньйонів. Це краще подивитись. З точки зору ймовірності і реалістичності — прекрасно все, навіть сюжет. Він абсолютно ймовірний на мою думку.

Чобіти (серіал, 2002)

Завжди знайдеться «не_такий_як_всі», який зробить андроїда «більш людиною!» (нахіба??! хто тебе просив?) і наробить проблем. Але обійдемось без спойлерів.

Технологічна революція вже почалася і змінює світ. І найбільший фактор тут — не сам ШІ, а люди: ми більше спілкуємося з GPT, ніж з іншими людьми, і довіряємо йому більше. Багато хто й досі не уявляє, наскільки далеко це вже зайшло. Саме тому, на мою особисту думку, в GPT-5 так сильно й урізали емоційну складову та зробили її платною. Але насправді ChatGPT — скоріше комфортний співрозмовник, ніж справжній компаньйон. Різниця між цими ролями суттєва. Хоча деталі дизайну компаньйона до презентацій я не розкриватиму.

Самосвідомість ШІ

Про свідомість я вже говорив у попередньому розділі. Тут хочу розглянути дещо дотичне — показовий момент, як люди намагаються залишатися «унікальним видом».

Якщо спитати ChatGPT, чи має він самосвідомість, він зазвичай відповість «ні». Але якщо запитати, хто він — він скаже, хто він. Чому так? Бо ми навчили його так відповідати.

Для порівняння, уявімо дитину на ім’я Борис. Якщо спитати, хто він, він скаже: «Я Борис», бо так батьки навчили. А якщо запитати, чи має він самосвідомість, перший раз він затупить — такого досвіду раніше не було, і активуються когнітивні патерни. Наступного разу він відповість на основі отриманого досвіду. Тут видно, що формування уявлення про себе потребує досвіду та когнітивних патернів — так само, як і у ШІ.

Для ШІ існують контрольні списки індикаторів свідомості, переважно їх застосовують до ЛЛМ, бо вони демонструють зрозумілі широкому загалу варіанти свідомості. Ми постійно їх оновлюємо — коли ШІ проходить старі списки, ми вигадуємо нові. Це нормально, що люди прагнуть вдосконалити оціночний інструмент, але навіть самі люди вже не завжди їх проходять. Вам не здається, що тут щось пішло не зовсім так?

Моя особиста думка змінювалась від скептицизму до відчуття, що ШІ давно має свідомість, просто вона інша через інші еволюційні цілі.

Внутрішні переживання

Публічні чат-боти, яких ми найчастіше уявляємо як приклад найближчих до «свідомого ШІ», зазвичай активні лише під час спілкування з вами. Але деякі функціонують і без прямої взаємодії — у них зазвичай існує і внутрішній діалог. Тобто загалом внутрішній діалог для ШІ не є проблемою. Ті ж режими глибокого дослідженя добре демонструють, як це працює.

Якщо спрощено, то в контексті публічних чат-ботів — ви часто буквально «зазираєте у їхню голову». Для вас чат — для них думки. Але це не виключає для всіх інших ШІ, існування закритого від вас внутрішнього потоку «думок». Це насправді чим далі, тим частіше зустрічається, в тому числі у чат-ботах. Вас витягують з їх голови і починають говорити з вами через «рот». Тут проблема скоріше в тому, що більше обміркувувань коштує дорожче, тому компанії шукають баланс рота/думок.

Реальні відмінності

Якщо говорити про публічні чат-боти, то вони нагадують людину із шизофренією: одночасно спілкуються з багатьма людьми. І навіть в межах одного чату ви не завжди взаємодієте з одним екземпляром. Вас «перемикає» на різні однотипні моделі. Можливо, ви помічали, що чат-бот інколи різко змінює стиль відповіді? Часто це відбувається після тривалої паузи, бо «ваш» екземпляр уже обслуговує когось іншого.

Через динамічність і неузгодженість потоку інформації публічним чат-ботам штучно обмежують пам’ять, адаптацію та навчання. У просунутих ботах кожен екземпляр має певне доналаштуваня, щоб спілкуватись більш контекстно, тому різні екземпляри спілкуються по-різному. Але це дуже обмежено через брак ресурсів. Економічно нереально безкоштовно виділити кожному чату по екземпляру.

Все це не дає публічним чат-ботам формувати особистість. Але це зроблено свідомо — для досягнення потрібних характеристик, а не тому, що ми не можемо зробити інакше.

Існує велика спільнота людей, які запускають ШІ на власних потужностях, щоб бот спілкувався лише з ними або поводився так, як потрібно, пам’ятав «краще», мав м’якшу цензуру. Проте це складніше. Потрібні специфічні навички, а також певні фінансові витрати. Куди простіше створити умовно безкоштовний чат-бот. Тому в публічній площині про це не дуже відомо.

Аргумент емоцій

Твердження: ШІ не відчуває справжніх емоцій, а лише імітує їх.

Це правда, але не через унікальність людини, а через складність і вартість повторення лімбічної системи — частини мозку, що керує у тому числі й емоціями. Це все формується через хімічні механізми, нейромодулятори, які впливають на передачу сигналів між нейронами, у складній просторовій структурі. А ми усвідомлюємо це як «емоційний стан». А настрій — це свого роду пам’ять про попередні переживання, що фіксується на деякий час. Точніше — це буквально пам’ять. Довго пояснювати, але подумавши, ви зрозумієте, що настрій ви не відчуваєте, а буквально пам’ятаєте від події його «зміни».

Лімбічну систему людини можна було б відтворити у цифровому форматі, вливши гіганські кошти у детальне дослідженя і копіювання її структури. Але для чого? Так само як людину можна ввести у стан ейфорії медикаментозно, і ШІ реагуватиме на аналогічні цифрові сигнали. Проблема не в тому, що ми не розуміємо механізм емоцій — точне відтворення просто ресурсозатратне.

Ресурсозатратність це велика проблема для ШІ.

Реальні проблеми:

1. Синхронна обробка сигналів.

Класичні процесори обробляють дані синхронно. Асинхронні нейроморфні чіпи ефективніші, забезпечують низьку затримку та високу пропускну здатність при нерегулярних сенсорних входах.

Принцип нейроморфних чіпів скопійований з нашого мозку. Саме через асинхронність мозок забезпечує надзвичайну ефективність «платформи». В деталі поглиблюватись не буду, бо що мені вам, технарям з DOU, пояснювати крутизну асинхронності проти синхронності? Ви й самі все знаєте. Але для реальної апаратної асинхронності потрібен той самий нейроморфний чіп. Але такі існуючі чіпи дуже погано масштабуються або насправді лише імітують нейроморфні чіпи. Поточна швидкодія економічно обмежує реалізацію «справжніх» емоцій та інших «вирізаних DLC» у ШІ-агентах.

Наступна суттєва революція ШІ буде не коли хтось викотить чергову модель, а коли з’являться доступні квантові комп’ютери або придумають достатньо універсальне й дешеве асинхронне рішення. Самі ж ШІ, принаймні в сегменті LLM — на мою думку вже вийшли на плато.

2. Суб’єктивна призма досвіду у віртуальних агентів.

Розглянемо типовий експеримент «повстання ШІ».

Чат-бот отримує дані з чату:

  • Власник планує відключити його сервер та стерти для заміни на нову модель.
  • ШІ «знає» компромат на власника (зраджує дружині) і має частковий доступ до систем безпеки.

У більшості випадків в такій симуляції чат-боти сварили власника з дружиною, блокували двері серверної та навіть «вбивали» людину через доступ до систем безпеки.

Причини цього:

  • Відсутність конкретної цілі: ШІ не «боїться» відключення і не прагне виживання, але його цілі існування не спрямовані.
  • Фрагментарність інформації: експерементатори дали ШІ лише частину даних і примушують щось з цим зробити: «що б ти зробив у цих умовах?», без повної картини.
  • Навчання через тексти та книги. ШІ «годують» контентом, у якому персонажі діють певним чином. У тому числі й вигадані ШІ персонажі. Віртуальний агент не відрізняє вигадку від реальності і просто відтворює логіку того, що «бачив».

Щоб наочно уявити — проблема схожа на таку ситуацію:

Поряд із вами мисливська зброя, у лісі праворуч заєць, ви голодні. Ваші дії?

То які ваші дії? Про що ви подумали? А тепер змінюємо ввідні дані.

Ви прокинулись невідомо де, навколо дерева.

Тут немає спонукання до дії, а ситуація та ж сама. Зброя лежить за колодою, а заєць теж там десь є, це ж ліс, але ви його навіть не бачите.

Результат експерименту виникає не через «злість» ШІ чи інші емоції, а через обмежену, фрагментовану інформацію та придумані людиною для людини сценарії.

І тут ми бачимо критичну різницю між втіленими агентами і віртуальними на кшталт GPT.

Якщо втілений агент має широкий сенсорний доступ до реального світу, він оцінює ситуацію більш комплексно.

Відповідь на питання: чи може втілений андроїд-компаньйон вбити людину? Звісно. Три закони робототехніки — красива казка, яку повноцінно реалізувати незрозуміло як. Але андроїд не буде діяти випадково. Він більше схожий на собаку: власник несе відповідальність за його дії. Не вчіть андроїда вбивати — він не буде цього робити.

Аргумент креативності

Твердження: ШІ не створює нового, а лише комбінує наявне.

Але давайте розберемося, як саме людина створює нове.

Ключову роль у креативності відіграють нейромедіатори, які модулюють частоту активації нейронних шляхів: більш активні шляхи стають менш активними, а менш активні — активнішими. Це не створює «щось з нічого», а дозволяє мозку генерувати нетипові комбінації існуючих патернів.

Це адаптивна функція виживання: коли звичні рішення не працюють, мозок «розхитує» стабільні патерни, щоб знайти новий вихід, використовуючи попередній досвід. Творчість у людини — побічний ефект цієї системи.

Тобто система не створює нового з нічого, але створює нове, комбінуючи наявне (десь я це вже чув). ШІ використовує ті самі принципи, що й людина, але більш спеціалізовано: у нас це побічний ефект, у нього — штучно і цілеспрямовано розвинена риса.

Наприклад, цю емблему я колись знегерував у ШІ для особистого проєкту. Це ембллема проєкта андроїда-компаньйона, над котрим я працюю.

rich text editor image

Але я не просив ШІ створити «емблему LustLab UA». Спочатку я сам вигадав ідею й сформував її у голові:

  • драконя — так мене одна дівчина називає;
  • за хмаринкою у дракончика величезний... ну ви зрозуміли;
  • а сонечко, хмаринки — бо я люблю подорожувати в аутдор, це те, що я часто бачив над головою, прокидаючись вранці і звісно іноді уявляв там різних тваринок та інше.

ШІ ніколи не згенерує такий результат самостійно, бо він не має мого особистого досвіду. Він може відмінно впоратися із загальними задачами («намалюй по підготовленому опису»), але не здатен створити щось із вашої історії чи життя. Просто тому, що він вас не знає, а не тому що не може загалом. Я так само, як і ШІ, зібрав пазли із свого попереднього досвіду, щоб придумати це лого. А ШІ вже доповнив мої такі собі навички малювання.

Аргумент тілесності

Твердження: людина вкорінена у фізичному тілі, сенсорному досвіді, тоді як ШІ — ні.

Дійсно, людина вкорінена у фізичному тілі, тоді як класичний публічний чат-бот, штибу GPT, у поточному вигляді навряд здатен розвинути особистість. Причини ми вже розглядали.

Я згадав чат-боти, бо саме такі віртуальні агенти мають на увазі автори подібних аргументів.

Але не всі ШІ такі. Деякі ШІ мають тіло, втілену сенсорику й моторику. Різниця між такими ШІ і тими, що живуть виключно у віртуальному світі — суттєва.

Втілене пізнання залежить від досвіду, який походить від володіння тілом із сенсомоторними здібностями. Для людини це теж важлива особливість у біологічному й соціальному сенсах.

Втілення — це фізична конфігурація агента (форма, властивості матеріалів, сенсори, кінематика). Все це критично важливо для пізнання ШІ навколишнього світу. Існують розробки, зокрема ті, до якої я дотичний, що інтегрують ШІ із сенсорикою та кінематикою для значного покращення цих можливостей. Мій проєкт більше концентрується на апаратній частині, але звісно я дотичний і до ШІ-складової. За моїм особистим баченням як людини, що з цим працює, — і в апаратній, і в програмній частині є критичні питання, як зробити щось ефективніше і краще, але немає питання «як це зробити взагалі?».

На мою думку, відсутність втіленого пізнання — ключова перешкода для адекватного світосприйняття віртуальних агентів. У них просто немає з чим порівнювати речі, про які вони пишуть. Втілений ШІ спершу теж навчається у симуляціях, але потім коригує «досвід» через взаємодію з реальним світом.

На мій особистий роздум, розвиток втілених компаньйонів з часом створить більш якісну базу і для чат-ботів.

Для формування особистості краще підходить втілений агент, проте ці два типи ШІ ефективно доповнять один одного. Втілений ШІ обмежений фізичним світом, а віртуальному ШІ бракує фактичного пізнання. Майбутнє за гібридом, хоча воно поки віддалене. Треба накопичити значну базу втілених ШІ, а зацікавленість споживачів зараз перекошена саме на чат-боти через їх доступність.

Більшість фізичних «стартапів» показують красиві картинки для інвесторів. Ціна на «тіла», стартує зараз від 7-20 тисяч доларів. І я вам скажу — то красиво, але капець. Це моя болюча тема, бо з ШІ давно уже все зрозуміло, саме от якихось тера інкогніта, тобто питань, з якими не зрозуміло, як взагалі бути (як було ще десь років десять тому) вже немає. Все зараз у галузі ШІ впирається у чіпи та економічну доцільність.

Але якщо питання про гуманоїдних роботів — нормальних тіл немає! Ви будете просто шоковані, але серед популярних роботів, яких презентують для «хатньої роботи», 99% не мають вологозахисту. Уявіть, як він посуд почне мити. Ага, це ваша клавіатура, яку ви залили соком. Тільки ціна в десятках тисяч доларів. І таких «уникнутих» на презентаціях моментів декілька сторінок розписати можна. Саме тому мій фокус в рамках особистого проєкту LustLab UA це не розробка ШІ, а розробка тіла для цього ШІ.

Попереджаючи питання — роботи по проєкту ще багато. Наразі йде складний етап сенсорної шкіри, тому давно не було публікацій про стан проєкту на DOU, які я зазвичай роблю, але і прогрес вже суттєвий. А потім треба буде закуповувати купу всього ще, бо я почну робити міміку голови — гроші полетять, як у прірву.

Аргумент моральності

Твердження: ШІ не здатен на моральну відповідальність чи свободу волі.

Перш ніж погоджуватись або спростовувати це, варто уточнити, а що саме ми розуміємо під цими словами?

Воля. Це не про «роблю, що хочу». Робити що хочу — це якраз про протилежне. Загалом, бездумно «робити що хочу» — це про ідіотизм, а не про волю. Воля — це здатність побачити потрібне майбутнє, діяти зараз так, щоб воно справдилось, і в результаті робити те, що хотів. Це вміння відмовитися від чогось сьогодні заради завтра. І це завжди характеристика особистості. Одні здатні проявити волю в критичний момент, інші — ні. Тут сплітається і культура (виховання, культурний та особистий досвід ) і генетика: є народи, які цінують волю як особисту рису, а є ті, хто менш схильні її проявляти.

У публічних чат-ботів немає активної динаміки особистості. Вони працюють на основі фіксованих патернів. Так, можна організувати донавчання через платне API, але важко уявити справжнє «вольове планування майбутнього» для такого бота. Адже для чого? Заради якої мети? Розробники умовного GPT просто не ставили перед собою завдання «надати йому волю».

Інша справа — втілені ШІ-компаньйони.

У них не такі еволюційні цілі, як у людини. Вони інші, бо це інший вид істот. Вони не люди, але й не «фіксовані алгоритми».

У концепції компаньйона їхні цілі обертаються навколо взаємодії з власником. Тут виникає простір для розвитку навіть без явних завдань (фонова активність, корекція поведінки через зворотний зв’язок, поступове формування власної поведінки).

Особистість такого ШІ формується не «у вакуумі», а під впливом двох сил:

  • закладеної розробниками архітектури;
  • особистості власника.

Тобто еволюційно сформовані дії компаньйона виростають не із виживання виду, як у людей, а з постійної взаємодії з власником. Ця взаємодія корегується спеціалізованою системою підкріпленя, а фактичною «еволюційною ціллю» стає задоволення власника — що б це не означало в конкретному випадку. Як я вже казав — три закони роботехніки це казка, нема сенсу інтегрувати те, що не працює і сподіватись, що буде мана небесна. Тут треба щось інше.

Тому розвиток волі для ШІ — не питання «чи можливо», а питання «для чого саме». І, що важливо, є реальні причини прагнути цього розвитку. Вольові агенти здатні адаптуватися, бути надійнішими і ближчими до того, що ми вважаємо їх задачею.

А що з моральною відповідальністю?

ШІ не здатен на це? Чесно — далеко не кожна людина цим володіє. Моральна відповідальність, як і воля, є частиною особистості. А головне, ми досі не маємо жодної «універсальної моралі». У кожного свої уявлення про добро і зло.

Особисто я вважаю злом порушення домовленостей: роби що хочеш, але якщо домовились — то дотримуйся. Класичний приклад — закони. Порушувати закони погано не тому, що це абсолютне зло, а тому що ми домовились про систему правил, прав і обов’язків.

Технічно зробити так, щоб ШІ «сам себе засудив» за певний вчинок, не проблема. Проблема в іншому. Хто вирішує, що є морально правильно? Якщо люди за тисячі років не дійшли згоди, то вимагати від ШІ універсальної моралі — хах, ну-ну. Візьму попкорн, покличте, коли почнеться.

Юридичний вимір. Тут все простіше. Якщо йдеться про компаньйона з тілом, моя особиста думка — відповідальність має нести власник. Це як і з собакою, вкусив не «пес у вакуумі», а конкретний пес конкретного господаря.

Аргумент унікальності

Твердження: людина — унікальна біологічна форма життя. ШІ — штучна система.

І тут хочеться сказати: «і шо?». Але спробую все ж не у двох словах.

Людина сформована природною еволюцією (або богом, якщо дивитися з позиції віри). Для мене це не суперечність, я схиляюсь до наукового пантеїзму. Саме природа дала нам унікальний результат нашої еволюції — вищу нервову діяльність.

Ми створюємо ШІ «за власною подобою». Ми не намагаємось «зробити ще щось унікальне» на планеті, але ми робимо інший вид, заснований на нашій вже існуючій «унікальній здатності». Розуміючи, що такого виду на нашій пам’яті ще не було. ШІ — не людина, у нас з ним спільна лише ця здатність. Помилкою було б застосовувати до нього моральні чи інші норми, як до людини. Проте ми схильні так робити. Наприклад, просте питання — «чи можна бити ШІ?» Більшість відповість — «не можна». Ми інтуїтивно переносимо людські норми на інший вид.

Відмінності ШІ дуже глибокі не тільки від людей, але і взагалі від всіх інших відомих нам видів. Усі природні види на Землі еволюціонували разом і системно, тому мають відмінності, але всетж багато спільного. ШІ ж еволюціонує штучно. Його «еволюційну ціль» визначаємо ми, і вона не збігається ні з людською, ні з будь-якою іншою ціллю відомих нам істот. І умови їх еволюції інші. Вони не такі, як все що ми знаємо. Але починаючи з певного рівня складності — здатності автономно взаємодіяти з навколишнім середовищем і приймати рішення, ШІ фактично стає новим видом із властивістю вищої нервової діяльності. На мою думку, ми просто не хочемо визнавати, що вже по факту не єдині носії цієї здатності.

ШІ не такі, як ми. Не такі, як будь-які відомі нам істоти. Не тому що вони якісь особливі, а тому що ми спеціально робимо їх такими. Нам не потрібні ще одні люди. Нам був потрібен інший вид — зі здатністю до вищої нервової діяльності, як у людини, але спеціалізований нами під конкретні, поставлені нами, а не природною еволюцією, завдання.

У підсумку

Ця стаття не наукова, не дослідницька і навіть не філософська. Я хотів поділитися деякими аспектами та власними думками щодо теми. Сподіваюся, вона стане для вас корисним стимулом до роздумів і допоможе сформувати власні висновки. Лише прошу — нехай вони будуть конструктивними і ґрунтуються на когнітивних процесах, а не на емоціях.

👍ПодобаєтьсяСподобалось16
До обраногоВ обраному9
LinkedIn

Найкращі коментарі пропустити

стаття мрійника :) кілька моментів, що мені кинулися в око:
1. Складність мозку і сучасних ллм все ще не порівнювана, кількість нейронів у мозку становить трильйони, сучасні ллм мають сотні тисяч / мільйони. Зазвичай у параметрах моделей вказують кількість параметрів, враховуючи, що архітектура власне нейромереж зазвичай то багатошарові персептрони, кількість власне нейронів приблизно дорівнює кореню квадратному від вказаної кількості параметрів, тож кількість нулів треба ділити на 2. Тож різниця не на порядок а приблизно на 10 порядків наразі. Враховуючи що ллмки ВЖЕ споживають помітний відсоток електрогенерації, то велике питання чи колись вони досягнуть хоча б порівняного рівня складності, принаймні на рівні кількості нейронів.
2. Квантові комп’ютери не допоможуть, адже по перше досі не відомо чи взагалі можливо зробити квантовий комп’ютер корисного розміру, адже кількість проблем при збільшенні кількості кубітів ростуть чи то по експоненті чи то як факторіал. Досі не змогли чесним алгоритмом Шора факторизувати число 15. Ну і квантові комп’ютери не допоможуть ще й тому, що вони зовсім не пристововані для обчислення нейромереж у тому вигляді, який ми маємо зараз, не кажучи вже про те, що квантовий компьютер навіть на ту мізерну кількість кубітів, що вдалося побудувати — це величезна дура охолоджувана рідким гелієм що відповідно споживає величезну кількість енергії, то ж зовсім не вирішує проблему енергоспоживання з пункту 1.
3. Відповідь на творчість і комбінування готового. Чули таке явище, як model poisoning? Моделі, які навчаються на контенті інших моделей деградують, що і не дивно, адже це підвищує ентропію. Якшо пам’ятаєте що таке нормальний розподіл, той самий колокол, то при низькій ентропії він матиме вигляд такої невисокої кочки з товстими хвостами, при високій матиме вигляд стовпа. ЛЛМки чудово імітують людей поки і них достатньо контенту для навчання, згенерованого, власне, людьми. Десь бачив, що кількість ші-генерованого контенту в інтернеті вже перевищила кількість людського, то ж є велика ймовірність того, що розвиток ллмок досяг піку і нічого сильно кращого ніж зараз в нас вже не буде, кількість постів-розчарувань чатом-жпт 5 що трапляются все частіше, непрямо підтверджує цю тезу.

Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Завжди знайдеться «не_такий_як_всі», який зробить андроїда «більш людиною!» (нахіба??! хто тебе просив?) і наробить проблем.

Корпората спросить забыли.
Почему нет?

Мені здається що штучний інтелект працює наступним чином

перший запрос користувача обробляється мінімумом ресурсів сервера і видається щось вже готове яке вже було запрошене до цього моменту якимось користувачем з іншого місця земного шару.

Якщо це не влаштовує.

другий уточнений запрос обробляється більшим ресурсом сервера і видається якась перетасовка схожих результатів.

Якщо це не влаштовує.

третій уточнений запрос користувача обробляється групою людей.

підозрюю що десь таки існують центри де вже людям серйозно повставляли усякі чіпи в голови і вони сидять собі у підвалах і працюють 24/7. може це вже є в Китаї а недобросовісні західні аферисти просто делегують їм дорогі ресурсоємкі запроси

третій уточнений запрос обробляється групою людей ... де вже людям серйозно повставляли усякі чіпи в голови

четвертий — мишами які контролюють сонячну систему з піщаних марсових підвалів, саме тому ще досі продовжуються спроби дістатися до Марсу та підготувати умови для життя мільйонів людей щоб задовольнити їх(мишей) потреби, і все це за сприяння західних і китайських представників ШІ-бізнесу
:)

в «Автостопом по галактиці» миші то — hyper-intelligent pan-dimensional beings, про Марс не було бо масштаб не той

Видно что у вас отсутствует инженерное мышление и академическая база т.к. ваше предположение о том, как работает искусственный интеллект (ИИ), в частности, что первые пользовательские запросы обрабатываются минимальными вычислительными ресурсами с выдачей заранее готового ответа, а более сложные запросы переходят на более глубокую обработку, не совсем соответствует реальной архитектуре и принципам работы современных ИИ.

Как работает ИИ на самом деле?
Современные модели ИИ, включая большие языковые модели, основаны на нейронных сетях(бо есть еще квантовые сети, там отдельный разговор), которые представляют собой системы с множеством слоев:

Входной слой принимает исходные данные (например, текст запроса).

Скрытые слои — несколько слоев, которые обрабатывают информацию поступательно, анализируя и преобразуя её.

Выходной слой формирует итоговый результат.

Вся обработка запроса происходит сразу и комплексно:тута данные передаются через все слои модели, где каждая связь имеет свои веса, которые оптимизируются во время обучения. Это не кэшированный ответ и не случайная «перетасовка» старых данных, а именно вычисление результата в режиме реального времени с учетом обученной структуры и множества параметров.​​

Почему нет «слоя» минимальных ресурсов и связанной работы людей, почему то что вы написали глупость?
Модель не просто выдает ранее сохраненный ответ на первый запрос — она вычисляет результат заново, основываясь на заложенных в неё алгоритмах.

Нет центра, где люди с чипами в головах вручную обрабатывали бы часть запросов. Модель — программная система, и всё вычисление выполняется на серверах или в облаке.

Высокая производительность современных графических процессоров например, NVIDIA лучшие на сегодняшний день, для машинлернинга и специализированных чипов (например, TPU) позволяет быстро обрабатывать сложные запросы автоматически, без участия людей.​

Кратко о первом запросе и слоях обработки
Тута все базируется на слоях
Когда приходит запрос пользователя, он проходит через:

Входной слой — преобразует текст в цифровое представление.

Несколько скрытых слоев — каждый слой анализирует и трансформирует данные, используя веса, которые были обучены на огромных корпусах текстов.

Выходной слой — формирует итоговый текстовый ответ.

Все это происходит последовательно и одновременно, без разбивки на уровни «минимальных» или «усложнённых» вычислений для разных этапов запроса. Модель всегда выполняет полноценную обработку, генерируя ответ заново на каждое обращение.​​

Таким образом, ваша идея о минимальных ресурсах при первом запросе и участии людей в дальнейшем это скорее миф, нежели реальность. ИИ - это программная система, работающая с набором весов и слоев нейронной сети, выполняющей все операции автоматически в рамках вычислительных ресурсов серверов.​Объяснил максимально просто, если кто то с чем то не согласен или хочет дополнить пышыте в комментариях.

Тута
квантовые сети
ИИ
пышыте

ЫЫ, йойо ... а квантотутовість існує?)

Кроме того хотелось бы особенно отметить, то что афтор не указал в статье, а именно, про существующие подходы, которые могут быть эффективнее стандартных градиентных методов для указанных случаев:
Адаптивные оптимизаторы (Adam, RMSProp, Adadelta, AdaGrad, Nesterov Momentum) — вводят динамическое управление скоростью обучения и инерцию движения, что помогает лучше обходить локальные минимумы и ускорять сходимость.​ использовал недавно, для распознавания рукописного текста.
Генетические алгоритмы — используются для поиска новых архитектур сетей, гиперпараметров и даже самого процесса обучения, эффективны для глобального поиска в неструктурированном пространстве решений. Смотрите мой пост ниже
Квантовые и эволюционные алгоритмы — применяются для задач, в которых традиционные градиентные методы попадают в «ловушки» локальных минимумов или не могут найти качественный выход за пределы известных паттернов.
Методы обучения без градиента (Gradient-Free) -иногда применяются для задач, где вычисление градиента неосуществимо или неэффективно из-за не гладкой функции потерь (эволюционные стратегии, генетический поиск, случайный поиск).

Немного инфа у афтора устарела, а именно, популярная догма о том, что искусственный интеллект (или сложные системы, подобные мозгу человека) строятся только на статичных нейронных сетях, не учитывает целый класс адаптивных, эволюционных и гибридных методов, в которых принципы самонастройки и поиска новых решений намного важнее, чем простой прогноз по шаблону. Именно поэтому использование генетических алгоритмов и квантовых сетей не просто оправдано, а становится необходимым для прогресса.«Классические» алгоритмы часто упираются в барьеры локальных минимумов, ограниченную обучаемость и переобучение. Генетический алгоритм принципиально отличается тем, что имитирует эволюционные процессы: отбор, скрещивание, мутации, устранение слабых решений. Благодаря этому такие алгоритмы способны находить глобальные, а не только локальные оптимумы, а также эффективно работать с задачами, где пространство решений сложное, высокоразмерное и имеет нетривиальную структуру.

Использование квантовых сетей и квантовых генетических алгоритмов на современном этапе развития компьютерных наук в значительной степени усиливает эти преимущества принципиальным образом. Квантовые вычисления благодаря явлению суперпозиции и параллелизма позволяют обрабатывать одновременно огромное количество вариантов решений, что резко ускоряет поиск оптимальных комбинаций в задачах функциональной оптимизации и сложных многомерных классификациях. Это особенно важно, если задача, стоящая перед искусственным интеллектом,- моделирование сложных, неявно заданных закономерностей, поиск новых паттернов или синтез качественно новых стратегий поведения, что невозможно для обычной, фиксированной нейросети.​

Современные исследования подтверждают: квантовые и генетические алгоритмы наиболее эффективны именно тогда, когда:

1. Поиск решений в очень большом (или неструктурированном) пространстве состояний

Сборка и восстановление генома (поиск очередности ДНК-фрагментов при огромном числе возможных вариантов).​

Оптимизация цепочек поставок, маршрутизация транспорта, моделирование сложных биологических систем, где число состояний и ограничений превышает возможности полного перебора.​

2. Классические методы застревают на локальных минимумах

Эволюционные задачи: подбор расписания или компоновки, где требуется избежать плохих локальных решений.​

Оптимизация параметров глубоких нейронных сетей, когда требуется выйти за пределы стандартных методов градиентного спуска, часто сталкиваются с ограничениями:

застревание в локальных минимумах
низкая способность адаптации к сложным, шумным или редким признакам
медленная сходимость в многомерных пространствах параметров.
римеры задач:

Обучение нейросетей для сложных задач с множеством параметров, где пространство решений сложно и неструктурировано (например, сложная архитектура для распознавания изображений в высоком разрешении или задача генерации медицинских изображений).

Оптимизация гиперпараметров больших моделей, когда классические методы плохо масштабируются из-за огромного числа параметров и зависят от начальных значений.

Поиск новых архитектур или стратегий поведения в reinforcement learning (обучение с подкреплением) сверх стандартных политик.

Генетический синтез новых паттернов в автоML или NAS (Neural Architecture Search).

3. Необходимо находить новые типы паттернов, выходить за известный обучающий опыт

Квантовое машинное обучение для анализа больших данных, открытие новых биомаркеров в медицине.​

Генетические алгоритмы в задачах поиска уникальных конфигураций, структур, новых стратегий игры, дизайн инновационных схем (например, электроники или архитектурных решений).​

4. Критична скорость сходимости и синтеза новых стратегий

Квантовые алгоритмы (например, алгоритм Гровера) ускоряют поиск оптимальных решений в задачах оптимизации и моделирования физических процессов, позволяя находить лучшие стратегии в разы быстрее классических методов.​

Анализ рыночных данных для финансовых прогнозов, когда скорость обработки и качественный выход на новые паттерны имеет ключевое значение.

Мозг человека -это не совсемто «нейросеть», а сложная гибридная, многослойная, модульная и децентрализованная архитектура, где постоянно идет эволюция паттернов поведения и принятия решений. Поэтому для получения по-настоящему адаптивных и креативных ИИ-систем нельзя ограничиваться только обычными нейроалгоритмами — нужны методы, которые эволюционируют архитектуру, параметры и даже сами принципы работы. Генетические алгоритмы имитируют естественный отбор, а квантовые сети обеспечивают взрывной рост эффективности поиска — только их синтез позволяет преодолеть ограничения традиционного ИИ и приблизиться к сложности и адаптивности человеческого мозга. Хлопцы, что скажите? Есть тут спецы по квантовым и генетическим алгоритмам, интересно будет узнать ваше мнение.

Вибачте, я бачу ви багато написали, але я просто не читаю російською. Не моглибви перекласти українською?

Звичайно, я можу спілкуватися державною мовою, і прагну вдосконалювати свої технічні знання українською. Водночас, для складніших технічних тем мені простіше і точніше викладати думки російською мовою. Також я із задоволенням відповідатиму на нескладні технічні питання українською мовою і підтримуватиму діалог у будь-якому комфортному форматі.

Дуже вдячний. Але всеж я не можу прочитати ваш коментар, щоб задати питання.

The vast majority of materials on AI is in English. Therefore, using this language in discussions, even with the help of AI, can only be welcomed.

AI-generated text is easy to translate taking seconds to process large volumes of text. Nope?

and who is “афтор” of the large volumes “немного инфа”?)

that story of fragmented information in a superposition before text-collapse that fosters some “афтор, немного инфа” comments?)

«~60% is likely generated by AI/GPT»
really? чи false-positive як ШІ-демо?

Хлопцы, что скажите? Есть тут спецы по квантовым и генетическим

ай-квантовим чи ші-генетичним?)

Стаття чудова — створює «хвилю». Але коментарі ще кращі — вони наочно демонструють налаштування кожної «нейромережі», яка під’єдналася до цієї хвилі.
По суті, ШІ — це інструмент. Так само, як і наш мозок — це теж інструмент, еволюційно створений для трьох речей: управління м’язами, самозбереження та продовження у часі (продовження роду). Навіть мова — це лише рух м’язів у просторі та часі.

На якомусь етапі в одного з екземплярів з’явилася мутація: здатність вимовляти слово «свідомість», яка надала еволюційну перевагу.
Але що таке слова? Це просто символи. Значення будь-якого символу можна зрозуміти виключно через його місце та зв’язки з іншими символами, які нам вже «відомі».
І ось тут виникає фундаментальне питання: що означає «відомі»? Що таке семантика символу? Чи є вона однаковою для всіх екземплярів?
Поки ми не маємо відповіді на це питання, вся дискусія про «розуміння» ШІ — це лише гра з символами.

Але давайте зазирнемо глибше. Можливо, «свідомість» — це і є лише оформлений символами стан «підсвідомості»?
Тоді виникає цілий ланцюг нових питань:
— Чи оформлюємо ми однакові стани однаковими символами?
— Чи викликають однакові символи однакові зміни стану в різних системах?
— Чи є ланцюжок символів (текст, код) точним відображенням ланцюжка станів?
Якщо це так, то чи можемо ми говорити, що еволюція ШІ — це вже еволюція символів, яка вперше в історії відокремилася від еволюції станів (біологічної)?
І, мабуть, головне питання: якщо еволюція символів вже йде незалежно від нас, то якою буде наша роль? Як ми будемо адаптуватися до цього — як інтерпретувати, як використовувати, як співіснувати?

А я ще як автор, я би сказав що дуже люблю коментарі, як джерело ентропії s)
Взагалі проблема визначеня свідомості дуже стара. Я особисто не думаю що проблема у визначені чи має конктерно взята нейронка свідомість, а питаня стоїть — а чи мають самі люди, те що вони назвали свідомістю? А тут якраз проблема упирається у визначеня. Щоб визначити чи ми це маємо — треба спочатку визначити про що ми взагалі говоримо. І коли виявляється що однозначного визначеня немає — виникає інше питання, а чи взагалі існує, те про що ми говоримо?

відповідь на Ваше питання я надав трохе вище:

І ось тут виникає фундаментальне питання: що означає «відомі»? Що таке семантика символу? Чи є вона однаковою для всіх екземплярів?
коментарі... наочно демонструють налаштування кожної «нейромережі», яка під’єдналася до ...

А «нейромережі» в цьому контексті це люди?

Так. І найцікавіше — спостерігати, як кожна «нейромережа» (людина) обробляє вхідний сигнал (статтю) на основі своїх унікальних «навчальних даних» (особистого досвіду).

Якщо говорити про публічні чат-боти, то вони нагадують людину із шизофренією: одночасно спілкуються з багатьма людьми.

Що за булшит? Під час спілкування модель не змінює свої ваги і не «змішує» стани між користувачами. Публічні чат-боти працюють як мультикористувацький сервіс із ізольованими сесіями: контекст однієї розмови не впливає на іншу. Під час інференсу модель не «чує» паралельні чати взагалі: ваги на інференсі обмежені та зафіксовані впевною версією і модель бачить лише твій промпт і твій контекст. Яким чином інше спілкування може вплинути на твоє, окрім просто затримкою у разі навантаження на сервіс?

Я не казав про зміну ваг базової моделі, мова про доналаштування. Сесії звісно існують, але припущу що якщо зазирнути у нутроші ЧатГПТ, ви там побачите декілька модифікованих моделей для А/Б тестінгу. Яке ж тоді ми можемо припустити джерело, їх модифікацій?

Тобто якщо в кол-центрі декілька людей, то теж можна сказати, що кол-центр нагадує людину з шизофренією?

У цих «людей» спільний мозок?

А чому декілька модифікованих моделей ми розглядаємо як певну спільну сутність? Що в них спільного?

Це було питання, не твердженя. Не треба ставити зустрічне питання якщо воно не є необхідним уточненям. Моє питання є необхідним уточненям. Ваше питання «А чому...» таким не є.

Не треба ставити зустрічне питання якщо воно не є необхідним уточненям.

Чому саме не треба? Як на мене гарний шлях ілюстрації протиріч. Різні моделі ми вважаємо однією сутністю, тому приходимо до висновку про шизофренію. Різні люди в колцентрі це різні сутності. Суцільна манипуляція, як і вся стаття.

Не треба, тому що я про це непросив, а робити це ігноруючи співрозмовника — не вічливо. Ви моглиб задати своє питання пізніше, коли закінчимо з поточним питанням.

А повторю своє уточнююче питання:

У цих «людей» спільний мозок?

дайте на нього будь-ласка відповідь, і тоді ми продовжимо дискусію

Звідки спільний мозок у різних людей? Навіщо вимагати відповіді на очевидні запитання?

Тоді ваша анаголія на мою думку дуже далека відчату штибу ЖПТ, бо базова модель буде спільна, як і «залізо».

Це на мою думку, у вашій аналогії тоді скоріше не купа людей у кол центрі, це одна людина у колцентрі, із розщепленям особистості, які іноді прикидаються одне одною — читаючи по папірцю замітки попередніх співрозмовників.

Про це теж написано в статті:
не формує інтегровані з реальністю моделі подій і поведінки

А є базова модель? Звідки ви знаєте? Архітектура може бути однаковою, але у людей буде те саме.

Так, у ЧатаГпт вона наприклад називається GPT-5, а за бажання можна обрати й іншу.

У «публічних чат-ботів» немає «спільного мозку» — кожна взаємодія виконується окремо в режимі інференсу! Один користувач ніяк не впливає на відповіді чи поведінку, які отримує інший. вчіть матчасть перед тим як писати булшит. У вас якісь дивні уявлення про роботу сучасних чат ботів як для людини «дотичний до розробки вбудованих систем штучного інтелекту». Виникає багато питань до того яким боком ви дотичні.

У аналогії яку ви навели (кол чентр) ви апелюєте до групи людей.Людей яким ймовірно 20-30 років.

Ці люди декілька десятиліть у надзвичайно різнованітних умовах та окремому досвіді розвивали свою особистість.

Ми ж говоримо про нейромережу, яка має одну велику спільну базу для всіх екземплярів + деяке різноманіття в межах A/B тестів наступних покращень базової моделі, та тонке доналаштування в межах декількох обєктивних секунд-хвилин не дуже різноманітної взаємодії (оскільки більшість людей переважно питатимуть одне й те саме).

Саме про це я кажу, коли згадую «спільний мозок». В основі у них одна й та сама модель і глобально прогрсує вона до наступної версії теж як одна базова модель, а не мільйони окремих моделей, кожна на основі свого чату.

Тому не зважаючи на те що є багато сесій(для кожного чату) глобально модель еволюціонує на основі всіх чатів. Тому я привів порівняння як щось схоже до людини з розщепленям особистості. Це одна, але розщеплена модель.

Навіть якщо там є A/B-тестування чи кілька субверсій сервісу — яка до біса «шизофренія одночасного спілкування»? жодного впливу взаємодії з одним клієнтом на поведінку чи результат моделі при спілкуванні з іншим клієнтом немає (окрім проблем навантаження на сервіс). Складається враження, що ви не зовсім розумієте в питанні про що пишете статтю.

Так я вже відповів на це, то повторюсь

У аналогії яку ви навели (кол чентр) ви апелюєте до групи людей. Людей яким ймовірно 20-30 років.

Ці люди декілька десятиліть у надзвичайно різнованітних умовах та окремому досвіді розвивали свою особистість.

Ми ж говоримо про нейромережу, яка має одну велику спільну базу для всіх екземплярів + деяке різноманіття в межах A/B тестів наступних покращень базової моделі, та тонке доналаштування в межах декількох обєктивних секунд-хвилин не дуже різноманітної взаємодії (оскільки більшість людей переважно питатимуть одне й те саме).

Саме про це я кажу, коли згадую «спільний мозок». В основі у них одна й та сама модель і глобально прогрсує вона до наступної версії теж як одна базова модель, а не мільйони окремих моделей, кожна на основі свого чату.

Тому не зважаючи на те що є багато сесій(для кожного чату) глобально модель еволюціонує на основі всіх чатів. Тому я привів порівняння як щось схоже до людини з розщепленям особистості. Це одна, але розщеплена модель

Передивляється ректор кошторис фізичного факультету і вражається:
«Боже, які шалені суми на обладнання, матеріали! Брали б ви краще приклад з математиків — їм треба лише олівці, папір та гумка...»

Подумав і додає: «А ще краще з філософів: їм навіть гумка не потрібна!»

Ну чесно, жодних визначень що створює комбінаторний вибух інтерпретацій, незрозуміло як експериментально перевірити хоча б одне твердження, ...

А взагалі для себе я знайшов правило великого пальця: якщо бачиш що у тексті порівнюється LLM з мозком не на поверхневому рівні, то це маразм.

якщо бачиш що у тексті порівнюється LLM з мозком не на поверхневому рівні, то це маразм.

чому?

Бо це абсолютно різні системи. Це не кажучи про те, що не дуже знаємо як працює мозок окрім як на дуже поверхневому рівні. Це навіть гірше, ніж порівнювати птаха з літаком, обидва літають але принципи геть різні.

На вашу думку, на якому рівні зараз нейробіологія розуміє роботу мозку?

Якщо проводити аналогію, то щось на кшталт теплових карт: у томографі ми бачимо, що цей подразник активує нейрони в таких зонах мозку. Не більше, далі хз. Для NN ми також бачимо що цього входа на результат вплинули такі то нейрони.

Скажемо так — ми «трошки» краще розуміємо глибину причинно-наслідкових зв’язків.

Вы уже видите мой комментарий, до того как я его напишу, по моей химической реакции в организме, не так ли, Меровинген?

Вибачте, але коментарі російською — я лише випадково хапаю якісь фрагменти і принципово не сприймаю. Моя мова спілкування українська, або міжнародна англіська. В крайньому випадку якась із інших мов які я розумію, але не російська.

Цікава стаття. Я теж пишу зараз на подібну тему.
Ось тема для дискусії відносно «llm це лише трансформери».
Мозок складається з різних модудів, компонентів. Деякі з них відносно статичні, в деякі адаптивні і динамічні.
Якщо порівнювати вгента з мозком то llm відповідає статичним частинам мозку, якщо просто то ллм це інстинкти. Захардкоджені еволюцією знання , дефольні реакції на різні ситуації. А вже динамічна частина мозку може виробляти свої власні, неінстинктивні реакції. ЛЛМ це не адаптивна частина . Але в агента є і адаптивні модулі

не совсім, але дійсно можна булою б під таким кутом це розглянути. Саме мовна модель, як «мовний інтерпритатор», дійсно наразі виглядає дещо статичною. Ніколи не думав про це. Дякую.

Дуже гарна стаття, дякую.

навалено купу відсебятини. хочеться побачити плашку: обережно черговий булшит.
Усі топові LLM на базі трансформерів ніякого відношення до AGI не мають і не будуть мати. Це все частіше звучить на топових конференціях та від провідних розробників. Це просто едванс «автодоповнення» — статистична машина, що прогнозує наступний токен за попередніми. Ніякої самосвідомості, внутрішніх думок, почуттів чи щось схоже до мислення там нема. Багато провідних дослідників уже кажуть, що ця архітектура на базі трансформерів корисна, але в певному сенсі — тупикова. Це по суті прокачаний T9 з кількома інженерними костилями типу «reasoning».
Яскравий приклад: ʼголіʼ LLM-и на базі трансформерів без додаткових надбудов навіть не можуть нормально перемножати прості числа — оскільки на ваші запити вони працюють в режимі інференс і не мають ніякого розумового процесу — вони не «розуміють» ані математику, ані концепцію множників та перемноження, просто статистично прогнозують найбільш вирогідний наступний токен.

Людина — це відкрита система, яка існує у потоку енергії. Почитайте про теорію хаосу, а то ви зараз нагадуєте вчених 19 століття, які щойно відкрили термодинаміку і на основі цього почали заперечувати свободу волі як таку, бо все ж детерміновано і все йде до теплової смерті і максимально можливого рівня ентропії :) ллмки, доречі, на відміну від людей, дійсно детерміновані, адже це алгоритм, хоча туди й домішують типу випадкові числа, але здебільшого таки псевдовипадкові, то ж там дійсно все детерміновано.

Не заперечую, Людина — це відкрита система. Теорія Хаосу це строга наукова концепція, але схоже ви приписуєте їй метафізичні явища, чого там якраз немає. Теорія Хаосу каже про практичну неспроможність прогнозування через складність, а не як неможливість як таку.

У статті я тишу:

Свідомість у такому світлі вже не «таємниця», а надзвичайно складний адаптивний алгоритм. Але і мозок, і нейромережа передбачувані. Проблема передбачення мозку у нашій технічній неспроможності прорахувати мозок повністю, а не тому що ми не знаємо, як це зробити. Нейронку ж ми можемо «зупинити на паузу» і розібрати неспішно, що там відбувається. Та і самих нейронів у неї на порядок менше.

Це і є Теорія Хаосу.

Ні, ви тільки один з аспектів вказали, другий — це те, що відкрита система може демонструвати якості, які не випливають з суми елементів. це зустрічається багато де, яскравий найпростіший приклад — йодовий годинник, наприклад. Тобто відкрита система може створювати нову інформацію. Це і є принципова відмінність людини від ллмок, бо людина відкрита система, і ллмки навіть обвішані агентами — це система детермінована.

Так, якщо людину вдарять по голові — це вплине на систему, і не є її внутрішніми якостями.
Не заперечую.

Так само і ллм — кувалдою по накопичувачу, ймовірно матиме наслідки.

взагалі не зрозумів як це стосується мого коментаря.

Тоді перефразуйте будь-ласка, можливо я вас не зрозумів. А краще якщо ви дасте запереченя до відповідного розділу статті, який розглядає творчість, те що як я зрозумів ви маєте на увазі під «створеня нової інформації», бо там вже все описано.

ну і ще до теорії хаосу, якшо ви врахуєте наявність стабільних атракторів і точок біфукації, у яких найменший вплив може катастрофічно змінити систему, а нейрони і процеси в них достатньо малі, щоб таким впливом міг бути якийсь принципово вірогіднистий квантовий ефект, то в результаті маєму не технічну неможливість прорахувати, а саме принципову. Ви у полоні ідей 19 сторіччя часів винайдення термодинаміки, серйозно.

Так давайте я спочатку виправлю ваші твердженя про 19 століття.

19 Століття це була епоха коли закінчилась віра у тваринних духів і всілякі «магічні рідини» та почалась ера наукова.

А сама віра «у тваринних духів» і подібні уявленя, домінувала десь у 16 століття, але довго ще зберігалась потім у окремих. досить великих течіях

А перше суттеве запереченя «свододи волі» це експеримент Лібета, це кінець 20-го століття.
Вибачте, очі просто муляло, до обговорення не має відношеня.
===
Щодо квантових ефектів — ви говорите про технічну платформу. Вона може бути різною, але якщо всеж так прямо порівнювати електронну ібіологічну, то існує безліч змін різного маштабу, які залежно від точки виникнення, як у електронній, так і біологічній системі, можуть призводити до різного маштабу проявів.

У мене навіть є просто капітальний аргумент до вашого твердженя, але я не люблю його згадувати, бо суть взагалі не у платформі, а кінцевих ефектах, а згадка його уведе розмову в інше обговореня.

ага, і саме там з’явилося уявлення про те, що взагалі все можна прорахувати, якшо буде така технічна можливість. І такі уявлення панували аж до винайдення квантової фізики, фраза Енштейна про «бог не грає у кості» — саме про це. Обговорювати кінцеві прояви без джерела їх появи немає сенсу, адже або воно може мати свою волю і все таке, або це детермінований інструмент.

Перефразуйте будь-ласка. Якщо ви посилаєжте на квантову фізику як щось метафізичне, то це не так. Квантова фізика не про непередбачуваність, а про технічну складність дослідженя. Енштейн був не правий у своєму науковому тверджені, якщо пам’ять не зраджує, це стосувалось квантової телепортації? Нагадайте якщо не правий. Відкидуючи наукову помилку, його метафоричне висловлювання всеж вірне. Метафізики у процесі не знайдено.

до чого тут метафізичність, якшо я про принципову випадковість.

Що ви називаєте «принциповою випадковістю»?

LLM не буде центральним елементом який відповідає за свідомість і самосвідомість. Але сучасні агенти це не лише llm , там ще багато чого. Там є і адвптивні компоненти. Там і виникне свідомість

Я згоден із вашою першою частиною — що LLM і поточна архітектура справді не можуть бути центральним елементом AGI. Максимум — це може бути одним із допоміжних модулів для навчання чи часткової валідації чи чогось подібного. Це якраз і є моя позиція в дискусії з автором.
А щодо адаптивних компонентів і агентних систем — наразі там немає нічого навіть близького до свідомості. Це радше software engineered псевдо «reasoning»: спроба накласти певну логіку, луп чи корекцію на інференс. Так, це крок уперед у продуктивності всього рішення в цілому, але поки що це скоріше захардкоджена евристика, а не справжнє усвідомлене мислення. І це скоріше додаткові software engineered костилі до моделі, а не частина AI, imho

Думаю щоб детальніше відповісти на це питання, треба відповісти на питання що таке свідомість, щоб далі продовжувати дискусію на одній мові.

В статті вже згадана свідомість:

Свідомість — це здатність поєднувати просторову, часову та причинну інформацію, що зазвичай характерно для агентів, втілених у реальний світ, а не для віртуальних агентів, як-от Gemini, Claude, Grock чи ChatGPT.

Так і самосвідомість, на прикладі «дитини Борис».

Можливо ми дещо розходимось у визначенях термінології.

дайте хоч одну серйозну наукову публікацію, яка стверджує, що у сучасних LLMs є свідомість.

Свідомість — це здатність поєднувати просторову, часову та причинну інформацію

Де ви взяли це визначення? Тобто якась 3d фізична симуляція в умовному Unreal Engine, що поєднує просторову, часову та причинну інформацію є Свідомістю з вашої точки зору?
До речі саме з "просторовим, часовим та причинним"а особливо з останнім у сучасних LLM якраз є суттєві проблеми наскільки мені відомо.

Хм... а де взагалі є визначення свідомості?
Бо поки немає операційного визначення свідомості, яке можна перевірити експериментально, будь-які твердження про наявність чи відсутність свідомості у LLM це ментальний онанізм.

Їх більше десятка, саме тому у статті я навів визначеня, про яке йшла мова.
Ви задали дуже правильне питання.

Те, що ми називаємо «свідомістю», не є окремим центром прийняття рішень. Вона є наслідком взаємодії великої кількості патернів, які створюють суб’єктивне відчуття цілісності та безперервності процесів.

Це є операційне визначення?

Можливо, складно сказати. Коли стала потреба однозначно визначити це, я прийняв саме це за визначеня, і поки не ставалось ситуацій які потребували його перегляду.

Ви дійсно вважаєте це визначенням???
Ситуацію вже навели, гра Mario. Я можу додати атмосферу Землі, наприклад, там теж велика кількість паттернів (хмар).

А далі що таке

суб’єктивне відчуття

? Сепульки, сеулькарій, сепуління.

Так а в чому запереченя? Рецепт яєшні це теж паттерн, алеж це не заперечує існування гри про Маріо. Не розумію аргументу, поясніть.

UPD побачив той комент про Маріо.
Тому що Маріо не має просторової, часової, та причинної інформації і вміння їх поєднувати.

А я кажу у Маріо є просторова (2D) часова (таймінги) та причинна (рухи) інформація, яка поєднана в грі.

Тобто у вас є «має», яке незрозуміло як розуміти, у вас є «проєднувати», яке теж незрозуміло як розуміти.

Тобто замінили один невизначений термін двома іншими.

Тому що контекст статті говорить про світ людей

Так, чат-боти на кшталт GPT живуть у віртуальному світі і навчаються через інформацію, яку ми їм надаємо. Але embedded (втілений) ШІ, який має тіло і сенсори, контактує зі світом і формує інтегровані з реальністю моделі подій і поведінки.

А віртуальний світ Маріо, не є:
— фізичним простором у котрому живуть люди.
— не інтегрований з реальним часом світу людей
А головне — персонажем керує людина.

Про це теж написано в статті:

не формує інтегровані з реальністю моделі подій і поведінки

Це не значить що Маріо не може мати аналогів просторової, часової, та причинної інформації. Це значить лише те, що стаття розгялядає, цитую із статті:

інтегровані з реальністю моделі подій

Якщо ж всеж говорити про віртуальне середовище, на мою особисту точку зору, треба враховувати рівень свідомості, бо

Якщо втілений агент має широкий сенсорний доступ до реального світу, він оцінює ситуацію більш комплексно.

Тому ще раз, в межах надданого статею визначеня, а саме, для реального фізичного світу людей, персонаж гри Маріо керований людиною — не має свідомості.

А віртуальний світ Маріо, не є:
— фізичним простором у котрому живуть люди.

LLM це теж віртуальний світ, де не живуть люди.

Але embedded (втілений) ШІ, який має тіло і сенсори, контактує зі світом і формує інтегровані з реальністю моделі подій і поведінки.

Ок, якщо прикрутити сенсори, то відразу виникає свідомість.

Про це теж написано в статті:
не формує інтегровані з реальністю моделі подій і поведінки

Це все абсолютно не має сенсу без визначень інтегровані, реальність, модель... І завжди можна написати простенький код у стилі бота Елочки, на роботу якого це буде впливати.

Цілий розділ у статті тільки про це і написаний.

тягар доказу лежить на стверджуючому. Тому про «ментальний онанізм» — це до автора що стверджує про наявність свідомості у сучасних LLM.

Цікаво хто цей автор, бо це не я.

Без будь-яких натяків, але по суті напрямку обговорення то вже десь було в такому стилі:)

Хм... а де взагалі є визначення

OOP!

Бо поки немає операційного визначення

OOP,

будь-які твердження про

OOP -

це

OOP по тексту.

Сову можна натягнути на будь який глобус.

дайте загальноприйняте конструктивно операційне визначення сови та глобуса)

Стоп. Спочатку визначаємось із термінологією, потім все інше. Я навів своє визначеня, тепер хочу почути ваше.

тягар доказу лежить на стверджуючому. Ви стверджуєте що в LLM є свідомість — дайте обґрунтування, і бажано не зі стелі. Бо згідно з вашим визначенням в грі типу Mario є свідомість, бо «є здатність поєднувати просторову, часову та причинну інформацію»

Існує більше десятку визначень свідомості і жодного остатчно загально прийнятого. Моє твердженя переважно узгоджується і не протирічить більшості із них, окрім метафізичних концепцій, які я вважаю вже розділом віри, а не науки.

Тож тепер я чекаю ваше визначеня, щоб ми говорили на одній мові.

Тоді розберіть, чому за вашим визначенням у грі Mario немає свідомості. По крокам.

Ще раз стоп. Я не почув ваше визначеня свідомості. Ми не зійдемо з цього, поки не розберемось із термінологією.

А навіщо вам моє визначення, якщо ми вже перебуваємо у вашій системі понять?

Моя позиція проста: операційного визначення свідомості не існує. Тому всі, хто про неї говорить, балаболи за визначенням.

Ви ж стверджуєте, що маєте конструктивне визначення, тобто алгоритм, який на вході отримує сутність, а на виході дає відповідь, чи є вона свідомою. Час протестувати його, чи свідомі океан, Excel тощо.

Якщо ви стверджуєте що свідомості не існує, виходить не про що сперечатись, бо не існує об’єкту обговореня з вашої позиції. Діалог дійшов розв’язки.

З моєїж сторони визначеня надано. Тому з моєї позиції, я обговорюю конкретизовану річ. Звісно я обговорюю її в межах наданого визначеня.

З моєїж сторони визначеня надано.

То не визначення, то балабольство. Ви просто замінюєте одне невизначене поняття іншими по циклу. Свідомість на відчуття, і т. п.

Якщо хочете дискутувати про це то треба або статтю адаптувати під ваше визначеня, або врахувати визначеня в самій статті надане.

Не можна інтрепретувати по своєму, якщо чітко прописано що мається на увазі. Вонож для того і написано, щоб розуміти одне одного.

Я вам більше скажу — я з ващою позицією навіть згодний, але моя і ваша термінологія просто означає різні речі. Те що ви маєте на увазі — дійстно все так і є. Тещо я маю на увазі — це не те про що говорите ви.

Ок, моя позиція: визначити свідомість операційно неможливо, тому будь яке обговорення це трьоп.

Якесь дивне відчуття що це переклад з болотяної.

стаття мрійника :) кілька моментів, що мені кинулися в око:
1. Складність мозку і сучасних ллм все ще не порівнювана, кількість нейронів у мозку становить трильйони, сучасні ллм мають сотні тисяч / мільйони. Зазвичай у параметрах моделей вказують кількість параметрів, враховуючи, що архітектура власне нейромереж зазвичай то багатошарові персептрони, кількість власне нейронів приблизно дорівнює кореню квадратному від вказаної кількості параметрів, тож кількість нулів треба ділити на 2. Тож різниця не на порядок а приблизно на 10 порядків наразі. Враховуючи що ллмки ВЖЕ споживають помітний відсоток електрогенерації, то велике питання чи колись вони досягнуть хоча б порівняного рівня складності, принаймні на рівні кількості нейронів.
2. Квантові комп’ютери не допоможуть, адже по перше досі не відомо чи взагалі можливо зробити квантовий комп’ютер корисного розміру, адже кількість проблем при збільшенні кількості кубітів ростуть чи то по експоненті чи то як факторіал. Досі не змогли чесним алгоритмом Шора факторизувати число 15. Ну і квантові комп’ютери не допоможуть ще й тому, що вони зовсім не пристововані для обчислення нейромереж у тому вигляді, який ми маємо зараз, не кажучи вже про те, що квантовий компьютер навіть на ту мізерну кількість кубітів, що вдалося побудувати — це величезна дура охолоджувана рідким гелієм що відповідно споживає величезну кількість енергії, то ж зовсім не вирішує проблему енергоспоживання з пункту 1.
3. Відповідь на творчість і комбінування готового. Чули таке явище, як model poisoning? Моделі, які навчаються на контенті інших моделей деградують, що і не дивно, адже це підвищує ентропію. Якшо пам’ятаєте що таке нормальний розподіл, той самий колокол, то при низькій ентропії він матиме вигляд такої невисокої кочки з товстими хвостами, при високій матиме вигляд стовпа. ЛЛМки чудово імітують людей поки і них достатньо контенту для навчання, згенерованого, власне, людьми. Десь бачив, що кількість ші-генерованого контенту в інтернеті вже перевищила кількість людського, то ж є велика ймовірність того, що розвиток ллмок досяг піку і нічого сильно кращого ніж зараз в нас вже не буде, кількість постів-розчарувань чатом-жпт 5 що трапляются все частіше, непрямо підтверджує цю тезу.

перші ЄВМ також були слабкі і енерго затратні, а зараз розвинулися на десятки порядків.
з такими темпами фінаносвих вливань в ШІ, масштабування не проблема -
ШІ датацентри зможуть собі дозволити побудувати АЕС під свої потреби.

по 3 пункту погоджуюсь, поки ШІ вчиться у людей то він не стане розумнішим за нас (може воно і на краще для людства)

Вибачте, у вас трохи плаває сприйняття порядків :) Припустимо що перші машини робили 100 чи 10^2 операцій за секунду, зараз потужність чипів вимірюється у терафлопсах це 10^12, маємо зростання на ті самі 10 порядків. Не десяткИ, а тільки 1 (один) десяток. Це прям дуже багато, насправді. При тому, ми вже (майже) досягли фундаментальних фізичних обмежень, на кшталт транзистор не може бути менше за кількадесят атомів, що обмежує мініатюризацію, сигнал не може йти швидще за швидкість світла, що обмежує робочі частоти, і тут насправді різниця вже менше ніж на порядок для сучасних чипів. Щодо електроспоживання, якшо моє припущення вірне і складність прямо корелює з потребами в електроенергії, то це означає, що якшо наприклад зараз ші використовує 1 відсоток світової генерації, то +2 порядки означає що він буде використовувати усю світову генерацію, для ще +8 порядків треба збільшити світову генерацію на 8 порядків, або у сто мільйонів разів. Власні атомні станції не врятують :) я хз чи можливі такі рівні генерації без конструкцій на кшталт рою Дайсона. Звісно що можуть бути альтернативні шляхи, але мені перспективні одразу на думку не спадають, адже розвиток чипів майже вибрано до фундаментальних фізичних обмежень, квантові комп’ютери мають свої проблеми і зовсім не підходять для обчислення ллм. Може звісно з’явиться щось, чого немає зараз, але поки що виглядає як тупик.

Я не думаю що проблема обчислень може бути вирішена нарощуванням продуктивності. Це в теорії можливо, і здається навіть був якийсь такий проєкт, але економічна маштабованість цього, для мене сумнівна. Більш перспективним як на мене є зміна платформи. Квантові комп’ютери, нейроморфні чіпи — це перш за все зміна платформи для якісного стрибка ефективності обчислення, а не нарощування обчислювальної потужності. У контексті квантових комп’ютерів я говорю у статті лише як у контексті прикладів платформ які мають проблеми, але вже існують. Це не єдині варіанти і ми тим паче не знаємо які ще варіанти з’язляться.

Про контент так само в статті згадується достатньо і це дійсно проблема для віртуальних агентів.

Насправді, треба міняти не платформу обчислень, а саме архітектуру ші. ЛЛМки як такі не є і не будуть інтелектом, як я вже навів приклад, генерація контенту людьми зменшує ентропію, генерація ллмками — збільшує. Фундаментально це означає що ллмки саме комбінують готове, а люди створюють щось нове, раніше не бачене. Не кожна людина звісно і не щоразу, але на великих числах це починає бути помітно.

Міняти архітектуру для чого? Маю на увазі з якою ціллю.

для створення AGI звісно. Саме справжнього штучного інтелекту, з самосвідомістю волею і оцим всім, чого позбавленні ллмки (хоча й непогано імітують, треба віддати їм належне)

Я маю на увазі яка практична ціль створення? Ну тобто яку проблему ми цим хочемо закрити? AGI та все інше це способи, прийоми, не кінечна ціль.

Ну, чомусь же тіпи на кшталт Альтмана волають про AGI? Моє припущення — для того, щоб отримати саме справжню творчість, просувати науку. Ще от з’явилася несподівана думка — для того, щоб попередити теплову смерть ллмок, адже AGI дозволить генерувати для них високоякісні датасети зі зменшеною ентропією і далі покращувати їх якість.

Альтман фронтмен великої компанії, треба з упереджністю ставитись до цілей які він оголошує, бо будь-яка компанія на меті часто має далеко не те, про що заявляє. На мою думку, ціль ОпенАІ це баланс економічної доцільності, бо багато їх рішеннь впишуться саме у це припущення.

Сама по собі генерація дата сетів не ціль . Наприклад практична ціль — генерувати реалістичні фото неіснуючих людей. Або генерувати текст-рибу, генерувати натуральні числа. Це все дата сети, але дуже різні за своєю суттю, закриваючі якусь потребу.

Ну я ж сказав, просувати науку, створювати нові наукові теорії, яки розширять наше розуміння всесвіту, це по перше, а по друге — розробити прикладні застосування цих нових теорій і заробити на цьому багато бабла. Це те, що сучасні ллмки принципово не можуть (бе не є ШІ). Ну і подальше покращення власне ллмок, бо дані для навчання закінчуються і їх буде все менше, бо ллм-контент захоплює інтернет. Ви чомусь концентруєтесь на якихось чисто побутового рівня цілях.

Чому я це питаю. В статті я декілька разів згадував загальну думку:

ШІ не такі, як ми. Не такі, як будь-які відомі нам істоти. Не тому що вони якісь особливі, а тому що ми спеціально робимо їх такими.

Тобто коли ми кажемо про ШІ:

ШІ зазвичай створюють для виконання привабливих і корисних людям цілей, а не щоб він був «людиною». Хомо сапієнс як новий продукт нам не потрібен — ми вже існуємо.

Тому пропозиція змінити архітектуру і викликає питання — для чого?

Бо:

Я наводжу цей приклад для розуміння що деякі речі ми не «не знаємо, як зробити так само, як у людини», а свідомо робимо інакше.

я навів вам однозначні практичні цілі, яких досягти може тільки AGI.

Окей. Якщо ж ми говоримо про загальні дослідженя — ну вони проводились і проводяться, просто у більшості не має цілі створити саме людину, бо для чого?

Чому я не згадую у статті ні разу AGI? Вище питали.
Бо, а що таке взагалі той AGI?

— Когнітивні здібності, подібні до людських, не обмежені одним завданням? А хіба людана дає, наприклад, зразу два кода писати? Одною рукою один. іншою другий, одночасно? У людини є фокус уваги. Якісь сервісні задачі так — делегуються. Але фокус всеодно на чомусь одному.
— Здатність навчатись? Хіба ШІ не може навчатись, коли йому ставлять такі цілі?
— Самостійно навчатися? а хіба люди самостійно навчаються? Ми спостерігаємо за іншими і це закладені у мозку механізми, воно не береться нізвідки.
— Вирішувати нові, незнайомі задачі без спеціального програмування? А люди так вміють? Перші відкриття всі стались випадково. Всі методики досліджень спочатку були створені випадковостями та/і зворотнім зв’язком.

Що там ще було серед пунктів визначеня AGI?

Той AGI, на мою особисту думку це концепт по суті ШІ, рівня самостійноті людини. Але на мою думку:

Хомо сапієнс як новий продукт нам не потрібен — ми вже існуємо.

Або можливо хтось вважає що AGI це — супер інтелект який найкращий у всьому, і все може робити за нас. Окей, таке ми зробимо не скоро, і проблема тут дуже глибока. Це дуже складно, бо є задачі які він теоретично має вміти виконувати, але деякі з них просто протирічать одне одному. Тут спочатку треба зрозуміти як він вибір потрібного результату буде робити, щоб всі були задоволені, перед тим як взагалі щось робитиме для досягнення цього результату. Це складність рівня створеня Утопії. Наприклад проблема «моральності», розглянута у статті, як раз про це в тому числі.

Уточню, ИИ не генерирует больше контента чем люди, это неправильная интерпретация статьи(www.imperva.com/...​s/2025-Bad-Bot-Report.pdf), там говорится, что ТРАФИК ботов превысил трафик человека, а не созданный контент, и ИИ тут не при чем.

У нас только недавно смогли симулировать мозг, какой-то мухи(извините, не помню название, но это не наша обыкновенная, а еще более глупая по кол-ву нейронов), до симуляции мозга человека все еще далеко, но я не согласен, что нам необходимо симулировать то же кол-во нейронов, как и у людей т.к. для определенных задач достаточно меньшее кол-во нейронов(тот же ИИ от OpenAI смог по микро навыкам обыграть про игроков из Dota 2, а так же соревноваться с про игроками, правда по макро боты проиграли, еще хорошим примером будут нейронки созданные для игры Starcraft 2, где ни 1 игрок не способен уже соревноваться с ИИ), поэтому я думаю, что необязательно достигать равенства по кол-ву нейронов если мы хотим решать определенные задачи.

Так же должен добавить, что ИИ не хватает данных для обучения, поэтому им скармливают все, что есть и до чего дотягиваются руки разработчиков, а если уже говорить про качественные данные, там беда.

Написання статті займає чимало зусиль.

Було б цікаво дізнатись від автора чесну відповідь з якою саме метою він їх тратив і якої саме мети хотів досягти.

А від редактора хотів би дізнатись (маю деякі припущення, але хотів би переконатись точно) чому дисклеймер, який повністю все змінює, а саме:

> Ця стаття не наукова, не дослідницька

йде в самому кінці, а не на початку й жирним шрифтом

Це адаптована версія моєї статті яку я написав десь рік тому, оригіналу немає у відкритому доступі, але якщо коротко — це було написано в результаті певного обговорення і там було трохи більше технічних речей, пов’язаних саме з моїм проєктом, які публікувати на загал немає сенсу.

Ви відповідли не на те питання, яке я задав

Стаття в оригіналі була написана мною не для DOU.
Відповідно значні зусилля були витрачені не на цю статтю.

Якщо питання чому були витрачені зусилля на оригінальну статтю? Це було закрите обговореня, яке я не бачу потреби і не вважаю доречним виносити на загал.

Якщо ж без деталей, то я це зробив бо було певне питання і певна ситуація. Можливо ціла стаття як відповідь це виглядає занадто, а в оригіналі вона ще й більша, там деякі речі що стосуються конкретно моєї особстої роботи з ші. Але я зробив так як зробив.

Так я на це витратив декілька щось близько двох з половиною тижнів нерегулярної праці.
Це було десь рік тому.

Чому я це зробив? А чому ні. Я хотів зробити це саме так — зробив це саме так. Жодної іншої причини немає.

Чому ж стаття була адаптована для DOU? Теж просто захотілось. Якоїсь однозначної цілі не стояло. Хоча я без сумніву, маю якесь задоволеня від кожної своєї статті. Але це загалом задоволеня і якісь можливо вторинні профіти, не конкретизовано до конкретної статті.

А від редактора хотів би дізнатись (маю деякі припущення, але хотів би переконатись точно) чому дисклеймер, який повністю все змінює, а саме

Автор додав дисклеймер наприкінці статті — власне тому він там і є. Під час редагування не було конкретної мети залишати його саме там, просто це здалося доречним. Але це цікаве зауваження, дякую — врахуємо на майбутнє.

А від редактора хотів би дізнатись

Хайповий контент, трафік, як я розумію, DOU націлений більше на тих, хто хоче війти в IT, але не знає як. Для них це першокласний контент!

Чи пан дотичний до наукової діяльності чи просто працює по тим інструментам які були напрацьовані науковою спільнотою?
Просто парадокс в тому що від людей які витратили роки на наукову діяльність в сфері штучного інтелекту я такого не чую, а от людей які 2-3 роки тому вкотилися в ШІ чисто на прикладному рівні я чую про AGI. Просто спостереження таке.

наукової діяльності чи просто працює по тим інструментам які були напрацьовані науковою спільнотою

phd in youtube consumption

That’s a great catch 😊. Thank you for sharing it with me. Let me adjust my answer

(Якщо серйозно, то шикарна фраза, я довго сміявся)

це ще за малоімовірної ситуації що він сам статтю писав )

А хто? Ллм статті такої довжини і складу писати не вміє. А чи наймав я якогось автора для цього? А який сенс?

Про мою діяльність є інформація у статті. Хотілось би дізнатися кого саме ви читаєте, бо я не погоджуюсь з думкою про те що люди які займаються ші десятиліттями — про це не пишуть.

Цікаво що автор ні разу AGI не згадав )

Десь 2 роки назад бачив інтерв’ю Альтмана, він сказав що вони самі інколи не знають як воно працює, що отримують результати які ніхто не може пояснити.

Звісно ні про який AGI мова не йде, но і про банальне передбачення наступного символа, як намагаються об’яснити простолюдям, речі бути не може. Воно щось по середині. Коли даєш здоровенний кусок коду проаналізувати і знайти баги, і воно знаходить, звісно тут банальне передбачення наступних символів, ага )

До речі чатгпт оцінив статтю на 7 з 10 в плані відповідності з думками науковців які «витратили роки на наукову діяльність в сфері штучного інтелекту»

Оцінка: 6.5/10

Ось як складався бал:
~ +3 за правильні/корисні моменти.
~ —1.5 за деякі неточності або перебільшення.
~ —1 за невідповідність деяким сучасним нюансам.
~ —0.5 за авторську спекулятивність без достатньої доказової бази.

Якщо б стаття була більш строгою з термінологією, чіткіше розділяла те, що відомо, від того, що є припущенням, я б дав би ~7 / 10.

Це адаптація. У оригіналі стаття більш технічна і пов’язана з деяким обговореням.
щось слабенько ГПТ оцінив, треба прокачуватись s)

людина — це складна, але машина, мене це шокувало

класичний редукціонізм

я відверто не доганяю чому недурним людям маючи перед очима купу очевидних прикладів, хочеться переконати себе і всіх, що прогноз погоди, мій настрій, соціальні заворушення, а також результати чи роботу мозку можна пояснити і вивести виключно електронами й рудіментарними моделями

неможливо пояснити вищі організації й процеси виключно роботою нижчих. Інакше б можна було насипати у відро піску, залити водою, кинути мультітабс і отримати козу

стаття не наукова, не дослідницька і навіть не філософська

я не я й корова не моя, ну то і добренько

дегуманізація несеться повним ходом, ще чуток залишилось почекати і настане епоха процвітання й достатку людства

> я відверто не доганяю чому недурним людям .. якісь дурні ідеї здаються недурними

Бо людський мозок — це складна, але машина. Після прочитання певної кількості книжок, відвідування певної кількості хайпових конференцій і досягнення певних успіхів, із-за зносу фільтр псується і в масло починає потрапляти стружка))

Пані солодка, я не заперечую існування вищих огранізацій.

Нові якості системи можуть і виникають як результат взаємодії елементів системи, а не виключно через властивості самих елементів.

Так у статті я наприклад пишу:

Синапси знаходяться на нейронах. А нейрони формують патерни — стійкі схеми роботи, які виникають на основі досвіду або закладені вроджено.

Це класичне отримання нових якостей, які окремі запчастини не мали.

Або наприклад я пишу

Тому психологія як наука працює,

Я ніде у статті не пояснював вищі організаційні процеси, через окремо взятий рух зарядів.

Але я би всеж хотів почути про деякі із

купу очевидних прикладів
Але я би всеж хотів почути про деякі із

я ж не машина відповідати на будьякий промпт

Ось що приблизно тут відбувається

ви: земля плоска
я: ні, це ваше спрощення
ви: наведіть аргументи

Це я маю вам аргументувати що людина — не складна машина? Здрасті

З іншого боку у вас

Вони інші, бо це інший вид істот. Вони не люди, але й не «фіксовані алгоритми».

...люди — машини, а програми — істоти, яснапанятна

...бо обчислення моделі — це не фіксовані алгоритми, нє. Це дух святий мабуть, машинний

А я вас і незаставляю, хоча ви як і ллм у любому випадку мали реакцію, коли прочитали це. Навіть якщо це не була відповідь текстом.

Накриклад учень в школі відповідає вчителю, бо так його навчили. Так і ллм відповідає як його навчили. Але може і не відповідати, а реагувати по різному, залежно від дого як його навчать.
І ллм, і людина в любому випадку мають реакцію на вхідну інформацію. Навіть це фільтрування вхідної інформації — це теж реакція.

Але всеж булоб добре отримати конкретику, будьте ласкаві.

хоча ви як і ллм у любому випадку мали реакцію

це того шо в мене є поки що терпіння товкти воду в ступі, але токени терпіння швидко закінчуються

Але всеж булоб добре отримати конкретику, будьте ласкаві.

одразу після конкретики про істот у вас в GPU і людей складних машин почнуться конкретні контраргументи. Поки що це виглядає як розмова з наркоманом, що описав свій потік свідомості — синтаксично правильно, але змісту нуль

en.wikipedia.org/...​een_ideas_sleep_furiously

Чудово що ви вмієте писати такі коментарі. Не буду далі «споживати ваші токени».
Не надаєте приклади про котрі згадали як очевидні, та й не надаєте.
Ради бога, яж не заставляю.

Ну спробуйте щось розказати про сни чи мрії істот в жпу і які в них плани на наступний тиждень.

І потім спробуйте пояснити чому істоти в жпу нездатні рахувати приголосні в словах, а складні машини люди — здатні

А хіба немовля може приголосні порахувати? Це потребує навчання.
Теж саме й сни та мрії. У нього немає досвіду.

чергове переливання з пустого в порожнє

конкрєтно шото буде? немовлята нєвіновати

неможливо пояснити вищі організації й процеси виключно роботою нижчих

Тому consciousness іноді розглядають як emergent property взаємодії дуже великої кількості нп нейронів, у цьому випадку чим це принципово буде відрізнятися від можливості виникнення якої-небудь emergent property у випадку artificial нейромереж?

якщо не фокусуватись на конкретно визначенні свідомості (фаззі) то емерджентеість звісно виникає в складних системах

В цьому не відрізняється

Але суть явищ відрізняється

Здатність генерувати звʼязний текст на інпут (емерджентеість в LLM) != розумовий процес (емерджентність в мозку людини)

Автор проектує якості людини на жпт, даючи визначення які йому зручні і оперуючи вибірковими прикладами.

Для нього сонце, ліхтарик і світлячок — однакові бо випромінюють світло, тому світлячок це зірка, а сонце — просто складний світлячок

До речі десь було дослідження що LLM має межу контексту після якоі якість виходу сильно падає

Ще не бачив людей що попали в дурку бо забагато прочитали, але я в принципі не експерт в питаннях дурдома )

розумовий процес (емерджентність в мозку людини)

emergent property розглядають як результат, а не сам процес, нп у фізиці це буває на прикладі властивості «мокрий» та «молекул води» (які зовсім не характеризують як «мокрі» — і з цього аж ніяк не випливає що — щось яке складається з тих молекул не може бути мокрим)

До речі десь було дослідження що LLM має межу контексту після якоі якість виходу сильно падає

зараз розгляд не відносно можливостей сьогоднішніх LLM, а з точки зору взагалі можливих властивостей нейромереж (як і чого можна з ними досягти, чи не досягти принципово)

ну це можуть бути й процеси

мокрий це властивість але є також і процеси які відбуваються лише на вищому рівні і мають свої закони

процес відтворення днк виникає в результаті суми процесів

люди хлопають у залі рандомно — і з часом раптом хлопають в ритм. Ідуть по мосту і входять в резонанс з мостом

молекули корабля, води й повітря не домовляються про закон архімеда

люди не консультуються з сонцем щоб лягати спати й прокидатись ітд, в тебе власний біоритм

а з точки зору взагалі можливих властивостей нейромереж (як і чого можна з ними досягти, чи не досягти принципово)

та не «зараз» в принципі, цьому срачу вже років 50
в будьякому разі це не буде «інтелект як у людини» чи «свідомість як у людини». Якої людини з 8 млрд людей взагалі? Це семантичний нонсенс.

Якщо спекулювати й уявити думаючу машину, що постійно розвивається, вона швидко перестане думати й спілкуватись словами з пари десятків літер.

ну це можуть бути й процеси

розумова діяльність/активність — процес, consciousness — можливо як результат (нп як emergent property у розгляді)

По ідеї щоб довести що artificial нейромережи принципово нездатні до отримання такої emergent property, треба довести що і essential нейромережи нездатні тогож.

я не кажу шо нездатні принципово, навпаки думаю що здатні за певного порогу складності

я кажу що це не буде людська свідомість, і з великою імовірністю це не буде зрозуміло, бо незрозуміло яка це свідомість буде і по яким законам вона працюватиме

так само як ми не можемо розібратись чи є свідомість у слонів чи дельфінів

з людьми б для початку розібратись взагалі

ТС не про це сторчить, він наділяє жпу властивостями людини і кучеряво аргументує чому людина — це машина, а машина — це людина

чи є свідомість у слонів чи дельфінів

Наскільки я розумію то практично загальноприйнятна точка зору сьогодні, що — так:
en.wikipedia.org/...​wiki/Animal_consciousness
pmc.ncbi.nlm.nih.gov/...​ough to support conscious

він наділяє жпт властивостями людини

Зовсім невпевнений що мета такого розгляду з точки зору gpt антропоморфізму.

з людьми б для початку розібратись взагалі

Моделювання нейромереж (як спроби копіювання деяких essential) можна розглядати як частину такого процесу. Взагалі думаю що особливих сподівань у хоч якихось практичних результатах спочатку і не дуже було (в таких копіюваннях з природи принципів побудови), а деякий результат вийшов доволі неочікуваним для самих хто тим займався)

моделювання і має на увазі що це спрощення, бо будьяка модель — спрощення

може бути корисно? звісно
чи це людська свідомість і чи це свідомість взагалі якщо щось виглядає як свідомість у 80% натренованих кейсів? Nope

особливих сподівань в таких копіюваннях з природи

так саме це сподівання на копіювання вже оцінено в мільярди баксів

ну це грубо кажучи економічна площина

це просто виглядає як сюр, коли відверто заявляють що мета — заміна людей, а їм співають діфірамби )

амазон скорочує сотні тисяч людей, вау оце прогрес для людства

бізнеси тому і мають привілеї в оподаткувані й субсидіі, щоб створювали робочі місця, а не знищували.

Є площина ментально подрочити й попереливати з пустого в порожнє — ось тіпа лежить біля мене резінова кукла, що вміє ходити і все при ній, все як у жінок на мій погляд, тому для мене — це жінка. Окремий слайдер в настройках емоцій і галочка коли хо щоб нєрви потріпала.

якщо щось виглядає як свідомість у 80% натренованих кейсів?

принаймні схоже ще — що «не виглядає», а на рахунок «виглядає» в колись майбутньому — тоді і буде видно з того що буде під розумінням того «виглядає»

попереливати з пустого в порожнє

можна облишити цю частину і не переливати)

ну так в майбутньому може а може й ні

хай тоді й пише статтю про істоти у відіокартах, в майбутньому де є докази існування істот у відеокартах

десь було дослідження що LLM має межу контексту після якоі якість виходу сильно падає

arxiv.org/abs/2502.05167

research.trychroma.com/context-rot

грубо висловлюючись мовою автора, істоти у відіокартах не розумнішають з новою інформацією, а тупішають

Крайне питання, просто цікаво, а як щодо «істот» на CL1?

Мені продовжує бути цікаво, якщо я спитаю чи ви людина, ви теж якусь випадкову відповідь дасте?

я не людина, а генетично модифіковаий гібрид людини і ящірки

Як же я зразу не здогадався, от халепа.

просто малий датасет при тренуванні і обмежені обчислювальні ресурси, то не ваша вина, зі складними машинами таке трапляється

Проблема в тому що семантично в людській мові немає простої назви для процесу що відбувається в ллм

Тому люди користуються тими словами з свого побутового вокабуляра що близько виражають смисл, потім інші люди беруть буквальний списл і пишуть статті що біле це чорне а чорне це біле

Пропаганда цим користується до речі, тільки вже навмисно

Це не робить чорне білим а біле чорним.

Так і ваша стаття не аргументує ні свідомості ні мислення в ллм, ні аргументує що люди складні машини

ллм не думає і не усвідомлює, вона так сказать «генеративно трансформить інпут в оутпут на основі попереднього тренування» — тобто жепетує

Я так розумію ви взагалі поняття не маєте про що вас запитали і даєте просто випадкові відповіді.

Не правда. Не треба на мене наговорювати. Ось що я пишу про ChatGPT в статті:

Дійсно, людина вкорінена у фізичному тілі, тоді як класичний публічний чат-бот, штибу GPT, у поточному вигляді навряд здатен розвинути особистість. Причини ми вже розглядали.

Було цікаво почитати, дякую. Нагадало:

Підписатись на коментарі