Субпрайм-криза коду: чому AI-асистенти роблять нас повільнішими — і дані це доводять

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

«Питання не в адопції AI, а у виживанні операційної моделі.»

Попередня моя стаття «Ілюзія економії: чому заміна розробників на AI — це шлях до технічного дефолту» була присвячена критиці стратегії скорочення штату інженерів, аргументуючи такий крок наявністю куплених ліцензій ШІ-асистентів (8000+ переглядів, 230+ коментарів).

Але як робота над статтею, так і дискусії з читачами змусили мене самого уважніше придивитись до наявних цифр. Ця стаття — логічне продовження, мета якого — проаналізувати: а чи взагалі ШІ код-асистенти є доказово корисними? Чи дають вони збільшення швидкості делівері загально? Чи є вони надійною технологією на 4-му році існування для бізнесу?

Спойлер: ні, не дають і не є надійними. Тож запрошую вас до ознайомлення з анатомією Субпрайм-бульбашки коду.

Ми фіксуємо системний збій, що розгортається в реальному часі. Поки ринок святкує «AI Productivity Boom», об’єктивні метрики доставки розповідають іншу історію. Це не революція цінності — це надування Субпрайм-бульбашки коду. Ця стаття — перша з серії, що аналізує механіку цього збою на основі незалежних досліджень.


Що таке «Субпрайм-криза коду»?

Цей термін є прямою відсилкою до фінансової кризи 2008 року. Щоб зрозуміти, що відбувається в IT сьогодні, варто згадати механіку того колапсу:

1. Токсичні активи: Тоді банки видавали кредити людям, які не могли їх повернути (subprime mortgages). Сьогодні ми маємо «дешевий синтаксис» — величезні обсяги коду, згенерованого ШІ, який виглядає робочим, але має низьку якість та високу приховану складність.

2. Ілюзія надійності: У 2008-му сміттєві кредити упаковували в складні фінансові інструменти та позначали як «надійні активи класу ААА». Сьогодні бізнес упаковує низькоякісний ШІ-код у звіти про «зростання продуктивності на 55%», створюючи ілюзію швидкого прогресу на дашбордах.

3. Системний ризик: Коли критична маса таких «токсичних активів» (неперевіреного, складного та дубльованого коду) накопичується в репозиторіях, настає момент технічного дефолту. Система стає настільки крихкою та дорогою в обслуговуванні, що будь-яка спроба змінити бодай щось призводить до колапсу.

Субпрайм-криза коду — це ситуація, коли ми пожертвували довгостроковою стабільністю системи заради короткострокової ілюзії швидкості. Ми «купуємо» рядки коду за безцінь сьогодні, щоб заплатити за них мільйонами доларів на підтримку та виправлення дефектів завтра.

Глава 1. Велика ілюзія: чому ми відчуваємо швидкість, а дані показують уповільнення

Запитайте будь-якого розробника, як йому працюється з AI Code Assistant, і ви почуєте одне слово: потужно. «Синдром чистого аркуша» мертвий. Бойлерплейт генерується за мілісекунди. Суб’єктивно тертя зникло — і виникає відчуття, що ми рухаємось у 10 разів швидше.

Але якщо відійти від IDE і подивитись на метрики доставки, виникає тривожний парадокс. Якщо кожен інженер «швидший» — чому Time-to-Market не обвалився? Чому релізи фіч буксують?

Щоб зрозуміти це, потрібно дивитись на холодні дані незалежних досліджень, а не на маркетинг вендорів.

«Штраф для сеньйорів»: підтверджено на масштабі

Найшкідливіший міф ери AI — що він перетворює джунів на сеньйорів, а сеньйорів на «10x» архітекторів. Реальність складніша. Зараз у нас є докази з двох незалежних векторів: контрольований експеримент і масштабне лонгітюдне дослідження.

1. Механіка уповільнення (METR, липень 2025):

У рандомізованому контрольованому дослідженні вимірювали вплив AI на досвідчених open-source розробників, які працювали у власних репозиторіях.

  • Результат: З використанням frontier AI-асистентів (Cursor Pro з Claude 3.5/3.7) розробники виконували завдання на 19% повільніше, ніж без них.
  • Суб’єктивна ілюзія: Попри реальне уповільнення, розробники вірили, що AI зробив їх швидшими. Вони прогнозували прискорення на 24% і навіть після експерименту оцінювали свій виграш у 20%.

Перечитайте це ще раз: люди стали на 19% повільніше і при цьому були впевнені, що стали на 20% швидше. Розрив між відчуттям і реальністю — ось де починається криза.

2. Валідація на масштабі (Xu et al., 2025):

Критики часто відкидають контрольовані дослідження як «занадто малі». Але Xu et al. проаналізували телеметрію від понад 10 000 розробників у різних enterprise-середовищах і незалежно підтвердили «Штраф для сеньйорів» на масштабі.

  • Перерозподіл праці: Периферійні контриб’ютори (джуни) вибухнули продуктивністю (+43.5% комітів), а Core Contributors (сеньйори) побачили колапс свого кодового виходу (-19% комітів).
  • Пастка підтримки: Замість того щоб писати код, сеньйори були змушені перейти до його рев’ю — їхнє навантаження на рев’ю зросло на +6.5%. І критично: AI-згенерований код потребував на 2.4% більше переробок на кожен PR, щоб відповідати стандартам якості.

Чому такий розрив?

AI змістив роль сеньйора з «Автора» на «Рев’юера/Дебагера». Сеньйори не зекономили час на написанні — вони втратили час на розплутування машинної складності.

Когнітивний податок: складність та попередження

Якщо ми друкуємо швидше, що саме ми виробляємо? Agarwal et al. (2026) провели глибокий структурний аналіз AI-згенерованих кодових баз порівняно з написаними людьми. Результати пояснюють, чому тягар підтримки вибухає:

  • Попередження статичного аналізу (+18%): AI-агенти систематично вносять тонкі порушення правил лінтингу та best practices, які людські сеньйори зазвичай фільтрують інстинктивно.
  • Когнітивна складність (+39%): Це вбивча метрика. Код, згенерований AI, функціонально коректний, але структурно заплутаний. Йому бракує елегантності та читабельності людської логіки.

Ми не просто генеруємо код — ми генеруємо технічний борг зі швидкістю +39% складності на кожну фічу. Саме тому Code Review стає новим вузьким місцем.

Дані: криза якості (GitClear)

Коли ми накладаємо дані про складність (Agarwal) на дані про обсяг (GitClear), картина стає повною. Аналіз 211 мільйонів рядків коду відносно базової лінії 2022 року:

Ілюзія продуктивності (метрики активності):

  • Додано рядків коду: +131.1% — обсяг сирого синтаксису більш ніж подвоївся. Ми генеруємо код у промисловому масштабі.
  • Вибух дублювання (~10x): Коміти з дубльованим кодом зросли з 0.70% (2020) до 6.66% (2025). Замість рефакторингу ми копіпастимо через AI.
  • Смерть перевикористання: Перевикористання коду («Moved» рядки) впало з ~25% до <10%. AI просто генерує нові версії існуючих функцій.

Реальність прогресу (метрики цінності):

  • Чистий приріст продуктивності (зважена медіана): ~9.0% — усереднюючи медіанні Commit Counts (+6.1%) та значущі зміни коду (Diff Delta +14.1%), ми отримуємо чистий приріст приблизно 9-10%.

Це збігається з публічними заявами керівництва Google. Наприкінці 2025 року CEO Сундар Пічаї розкрив внутрішній вимір інженерної швидкості: «Наші оцінки — це число зараз на рівні 10%.» Хоча це неаудитована заява, її скромність примітна — враховуючи, що Google має стимул звітувати про вищі показники, і враховуючи мільярди доларів внутрішньої інфраструктури, які роблять навіть ці 10% можливими (див. Главу 2).

Визнання позитивних доказів

Наукова чесність вимагає розглянути знахідки, які, здається, суперечать нашій тезі.

Ми не заперечуємо, що AI прискорює ізольовані завдання кодування, особливо для менш досвідчених розробників. Докази цього надійні. Peng et al. (2023) провели рандомізоване контрольоване дослідження (n = 196), яке показало прискорення на 55.8% на greenfield-завданнях. Xu et al. (2025) — те саме дослідження, яке ми цитуємо вище — підтверджує, що периферійні контриб’ютори побачили зростання на +43.5% в обсязі комітів. Окремі розробники, особливо джуни, дійсно пишуть код швидше з AI.

Наше занепокоєння інше: ці локальні виграші не транслюються в системне покращення продуктивності — і можуть активно його деградувати. Дослідження Peng et al. вимірювало ізольоване виконання завдань у greenfield-середовищі — написання маленьких програм з нуля. Це має обмежену релевантність для brownfield enterprise-інженерії, де 80-90% роботи — це підтримка, розширення та дебаг існуючих систем. І як самі Xu et al. демонструють, агрегований приріст продуктивності на рівні проєкту зникає, коли ви враховуєте перерозподіл навантаження на сеньйорів та збільшену кількість переробок.

Питання не в тому, чи AI робить друкування швидшим. Робить. Питання в тому, чи швидше друкування робить систему швидшою. Дані кажуть — ні.

«Фактор страху» в продуктивності

Є ще темніша інтерпретація скромного ~10% чистого приросту продуктивності. Чи є цей приріст технологічним — чи психологічним?

Наратив «AI робить кодування безкоштовним» дійшов до кожного спонсора проєкту. Це створило координований, імпліцитний тиск на інженерні команди доставляти швидше.

Ми зазначаємо це як неперевірену гіпотезу, що потребує окремого дослідження:

Розробники не просто використовують AI — вони працюють більше, щоб відповідати роздутим очікуванням. Значна частина цього «приросту» може бути результатом збільшених робочих годин та підвищеного стресу, спричинених страхом бути заміненим або виглядати «повільним» в еру AI. Ранні дані опитувань фіксують зростання тривожності серед розробників щодо витіснення AI (Stack Overflow Developer Survey, 2024). Можливо, ми плутаємо «ефективність» з «виснаженням».

Прогалина в доказах: коли маркетингові «вайби» замінюють операційні дані

Будь-який сеньйор-інженер, читаючи це, має відчути скепсис: чи об’єктивно будувати кризовий наратив на кількох джерелах?

У здоровій інженерній культурі ми б вимагали десяток незалежних точок даних. Ми б хотіли порівняти ці негативні знахідки з лонгітюдною телеметрією від самих вендорів.

Але ми змушені спиратись на ці обмежені сигнали з однієї тривожної причини: даних від вендорів не існує.

Три роки «AI-революції» — і компанії, які продають це майбутнє, які сидять на найбільшому датасеті інженерної поведінки в історії людства, досі не опублікували жодного ригористичного, незалежного дослідження, яке б демонструвало, що AI знижує Total Cost of Ownership або Defect Rates у реальному Enterprise-середовищі.

Замість операційних доказів публічний наратив домінується тим, що можна назвати лише «Плацебо-аналітикою»:

  • Патерн опитувань: Вендори часто цитують цифри на кшталт «88% розробників відчувають себе продуктивнішими.» Але, як показали METR та Xu et al., суб’єктивна впевненість — поганий проксі для реальної продуктивності. Ці опитування вимірюють настрій щодо адопції («Вам подобається інструмент?»), а не результати доставки («Система доставила цінність швидше?»).
  • Патерн синтетичних бенчмарків: Заяви на кшталт "55% швидша розробка«походять з Greenfield — написання маленького коду з нуля. Ці виграші реальні, але вузькі. Вони мають обмежену релевантність для Brownfield — підтримки великих, legacy-кодових баз, що становить 80-90% enterprise-інженерії.

Фалація «Ви неправильно тримаєте»

Ми передбачаємо стандартний захист від вендорів: «Якщо розробники мерджать поганий код — це помилка користувача, а не інструменту. Ви неправильно використовуєте асистент.»

Цей захист недостатній.

Якщо «режим за замовчуванням» використання по всьому ринку — спричинений власними маркетинговими обіцянками вендорів про «швидкість» — призводить до деградації кодових баз, це не просто помилка користувача. Це системний провал дизайну та позиціонування. Коли електроінструмент агресивно продається споживачам без адекватних інструкцій з безпеки, без захисного обладнання, і з маркетингом, що підкреслює швидкість замість обережності — ми не звинувачуємо лише користувача, коли зростає кількість травм. Ми притягуємо виробника до відповідальності за продаж потужності без адекватних запобіжників.

Відповідальність вендорів — змістити основні метрики AI Code Assistants з «Acceptance Rate» (як часто ви натискаєте Tab) на «Defect Reduction» та «Maintainability».

Висновок: конвеєр одноразового коду

Дані ведуть до неминучого висновку: ми сплутали Швидкість Друку з Інженерною Швидкістю.

Ми побудували високошвидкісний конвеєр для одноразового коду. Знизивши вартість генерації синтаксису до майже нуля, ми затопили наш SDLC низькоякісним (+18% попереджень), високоскладним (+39%) кодом. Ми відчуваємо швидкість, бо менше друкуємо, але доставляємо повільніше, бо тонемо в шумі, який самі створили.


Ми не прискорили software engineering — ми прискорили створення технічного боргу.

Джерела до Глави 1:


METR (липень 2025): «Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity» — RCT з 246 завданнями, 16 розробниками. AI-асистенти роблять досвідчених розробників на 19% повільнішими. Розробники вірять, що стали на 20% швидшими. metr.org

Xu et al. (arXiv, 2025): «AI-Assisted Programming Decreases the Productivity of Experienced Developers» — Аналіз 10 000+ розробників: +6.5% навантаження на рев’ю, +2.4% переробок для сеньйорів, —19% кодового виходу Core Contributors. +43.5% комітів для периферійних контриб’юторів. arxiv.org

Agarwal et al. (arXiv, 2026): «AI IDEs or Autonomous Agents? Measuring the Impact of Coding Agents» — AI-згенерований код: +18% попереджень статичного аналізу, +39% когнітивної складності. arxiv.org

Peng et al. (arXiv, 2023): «The Impact of AI on Developer Productivity: Evidence from GitHub Copilot» — RCT (n = 196): прискорення на 55.8% на greenfield-завданнях, переважно для менш досвідчених розробників. arxiv.org

GitClear (2025): «AI Assistant Code Quality 2025 Research» — Дублювання коду зросло у ~10 разів, перевикористання впало з ~25% до <10%. Датасет: 211 млн змінених рядків. gitclear.com

Stack Overflow Developer Survey (2024): Зростання тривожності розробників щодо витіснення AI. survey.stackoverflow.co

Глава 2. Прихований цінник: реальна вартість того, щоб AI працював

Попередня глава показала, що бачать інженери на землі. Ця глава про те, що ці дані означають для бізнесу — конкретно, для керівників та фінансових директорів, які затверджують AI-бюджети без видимості повної вартості того, щоб ці бюджети стали продуктивними.

Великі технологічні компанії часто зазначають, що вони успішно використовують ці інструменти всередині. Немає підстав сумніватися в цьому. Але те, про що рідко говорять — це повна структура витрат за цим успіхом.

Такі організації працюють з виключною інженерною зрілістю. Вони роками інвестували у внутрішні платформи, архітектурне управління та автоматизацію рев’ю, які поглинають додаткову складність, привнесену AI. Це не дрібна операційна деталь. Це фундамент, на якому побудований будь-який «приріст продуктивності від AI».

Невидима інфраструктура

Розгляньте інженерну інфраструктуру, яка існувала в Google до того, як був написаний хоча б один рядок AI-асистованого коду:

  • Blaze/Bazel: Система збірки, яку інженерили понад десятиліття для роботи з монорепо на мільярди рядків коду.
  • TAP (Test Automation Platform): Інфраструктура, що виконує приблизно 4.2 мільярди тестових запусків на день — система, на створення та підтримку якої пішло понад 15 років і, за розумними оцінками, значно більше $1 мільярда.
  • Critique: Внутрішня платформа для code review з глибокою інтеграцією статичного аналізу, перевірки стилю та автоматичних чеків — яка замінює потребу людини ловити ті самі «правдоподібні брехні», які генерує AI.
  • Tricorder: Фреймворк статичного аналізу, який автоматично позначає проблеми до того, як рев’юер побачить код.

Ці системи детально задокументовані у власних інженерних публікаціях Google. Вони представляють кумулятивну інвестицію 10–15 років і, консервативно, $1–3 мільярди у виділену платформну інженерію. І це лише одна компанія.

Microsoft підтримує 1ES (One Engineering System) та CodeFlow. Meta перебудовувала свою внутрішню платформу розробки кілька разів. Витрати на R&D, що фінансують ці системи, вражають:

КомпаніяРічний R&D (CY2024)Річний CapEx (CY2024)Плани CapEx (2025)
Alphabet (Google)$45.4B$52.5B~$75B
Meta$44.4B$39.2B$60—65B
Microsoft$29.5B (FY2024)$44.5B (FY2024)~$80B

Джерела: Alphabet 10-K (CY2024); Meta 10-K (CY2024); Microsoft 10-K (FY2024, закінчується червень 2024). Примітка: фіскальний рік Microsoft закінчується 30 червня; CapEx за CY2024 суттєво вищий (~$64B в річному обчисленні на основі витрат H1 FY2025). Плани CapEx на 2025 — за earnings calls компаній та звітами Financial Times.

Коли Сундар Пічаї каже інвесторам, що AI дає «10% приросту продуктивності», цей приріст вимірюється поверх цього мультимільярдного фундаменту. Це не приріст від самої ліцензії на AI. Це приріст від ліцензії плюс десятиліття інфраструктурних інвестицій, які роблять безпечну адопцію можливою.

Мультиплікатор трансформації

Коли ті самі AI-інструменти продаються зовні — організаціям, які не мають цієї оточуючої операційної моделі — ринок створює небезпечну ілюзію: що порівнянних результатів можна досягти переважно через купівлю ліцензій.

Давайте кількісно оцінимо цю ілюзію. Пряма вартість AI-інструментів для середнього enterprise (1 000–5 000 інженерів) тривіальна:


GitHub Copilot Business: $19/користувач/місяць ≈ $228K/рік для 1 000 інженерів.

Тепер розгляньте реальну вартість побудови інфраструктури, необхідної для безпечного поглинання складності, яку привносить AI. Наступні оцінки базуються на аналізі публічно доступних витрат на інфраструктуру, галузевих бенчмарках та кейсах enterprise-трансформацій. Це порядки величин, а не точні цифри:

Компонент трансформаціїОрієнтовна вартістьТерміни
Модернізація CI/CD та автоматичні quality gates$2—10M6–18 місяців
Сканування якості коду та безпеки (SonarQube, Semgrep)$500K—2M3–6 місяців
RAG-інфраструктура для контекстного AI-рев’ю$1—5M6–12 місяців
Навчання розробників та редизайн процесів$1—3M/рікПостійно
Додаткові сеньйор-інженери для рев’ю-потужності$2—5M/рікПостійно
Архітектурне управління та compliance-фреймворки$500K—2M3–6 місяців
Разом (Рік 1)$7—27M

Це дає співвідношення, яке має стривожити будь-якого CFO:

Мультиплікатор трансформації = Реальна вартість / Вартість ліцензій = $7—27M / $228K ≈ 30—120x


Ліцензія — це 1–3% реальної вартості того, щоб AI працював безпечно. Решта 97–99% — рахунок за трансформацію — невидимий на кожній презентації вендора.

Парадокс Джевонса для AI-коду

Ситуація гірша за одноразовий рахунок. Дані про enterprise-витрати на AI виявляють тривожну динаміку: навіть коли вартість одиниці AI падає, загальні витрати прискорюються.

За ринковими даними 2025 року, enterprise-витрати на генеративний AI зросли з $11.5B (2024) до $37B (2025) — зростання на 320% — попри те, що вартість інференсу за токен впала приблизно в 1 000 разів за той самий період. Середній місячний AI-бюджет на організацію зріс на 36% до $85 521/місяць, причому 45% організацій тепер витрачають понад $100K/місяць.

Це класичний Парадокс Джевонса: дешевший AI за одиницю → більше AI споживається → більше інфраструктури потрібно для управління ним → вищі загальні витрати. «Економія» від дешевших токенів поглинається — а потім перевищується — зростаючим радіусом ураження AI-згенерованої складності по всій організації.

Ліцензія видима. Рахунок за трансформацію — ні.

Ця асиметрія — двигун кризи. Коли Борд затверджує AI-бюджет, вони бачать рядок:


AI-ліцензії: $228K/рік — Затверджено.

Чого вони не бачать — це операційний борг, який вони імпліцитно авторизують:


Інфраструктура для безпечного поглинання AI-виходу: $7—27M — Не запитано. Не профінансовано. Не обговорено.

Вендор не має стимулу показувати цю вартість. CTO може не повністю її розуміти. CFO не має фреймворку для її розрахунку. І організація розгортає інструмент, який множить обсяг коду на 2x, у пайплайн, спроєктований для 1x — і дивується, чому через 18 місяців бюджет на підтримку вибухнув, а сеньйор-інженери вигорають.

Поки індустрія не розробить прозорі TCO-моделі для AI-асистованої розробки — моделі, що включають повну вартість управління, верифікації та трансформації процесів — кожен розрахунок «AI ROI», представлений Борду, є в кращому випадку неповним, а в гіршому — фікцією.

Виклик вендорам

Якщо AI Code Assistants настільки зрілі та універсально корисні, як стверджує поточний маркетинг, шлях вперед має бути простим.

Замість того щоб інвестувати переважно в кампанії адопції, ми кидаємо виклик вендорам виділити капітал на незалежні, об’єктивні дослідження. Профінансуйте університетські або нейтральні галузеві групи для вивчення реальних команд, що працюють над реальними беклогами, вимірюючи конкретні показники — cycle time, defect rates, rework та вартість підтримки — у різних організаціях протягом тривалого періоду.

Відсутність таких доказів не означає злий намір. Але вона залишає індустрію в критичній прогалині доказів. Поки ригористичні, незалежні дані не будуть доступні, обережний висновок залишається неминучим:

Без відповідних змін в операційній моделі, AI Code Assistants навряд чи дадуть чистий позитивний результат на системному рівні — і можуть активно збільшити довгострокову вартість та ризик.

Джерела до Глави 2


Google Software Engineering (O’Reilly): «Software Engineering at Google» — Детальна документація внутрішньої інфраструктури Google (Blaze, TAP, Critique, Tricorder), побудованої за 15+ років, що представляє мільярди інвестицій у платформну інженерію. abseil.io

Alphabet 10-K (CY2024): R&D $45.4B, CapEx $52.5B. Прогноз CapEx на 2025 ~$75B. sec.gov

Meta 10-K (CY2024): R&D $44.4B, CapEx $39.2B. Прогноз CapEx на 2025 $60—65B. investor.fb.com

Microsoft 10-K (FY2024): R&D $29.5B, CapEx $44.5B. Прогноз CapEx на 2025 ~$80B. microsoft.com/investor

Big Tech AI Spending (2025): Amazon, Meta, Microsoft та Alphabet планують сукупний CapEx понад $320B у 2025, зростання з $246B у 2024. delo.ua / Financial Times

Enterprise AI Spending (2025): «The Inference Cost Paradox» — Парадокс Джевонса в дії: вартість за токен впала в 1000x, загальні enterprise-витрати зросли з $11.5B до $37B. Середній місячний AI-бюджет на організацію: $85 521. arturmarkus.com

Enterprise AI TCO (2025): Фреймворк прихованих витрат за межами API-рахунків: data engineering, RAG-інфраструктура, MLOps, governance, compliance. xenoss.io

Frontier Model Training Costs: Витрати на тренування зростають у 2.4x/рік; найбільші запуски прогнозуються на рівні >$1B до 2027. epoch.ai

Глава 3. Пастка «безкоштовного обіду»: чому Борд обирає стратегію деградації

Якщо дані з Глави 1 настільки тривожні — сеньйори уповільнюються, code churn вибухає — і якщо реальна вартість трансформації в 30–120 разів перевищує вартість ліцензії (Глава 2) — чому індустрія подвоює ставку на ту саму стратегію? Чому розумні C-Level керівники приймають рішення, які активно деградують їхні продукти?

Відповідь лежить не в інженерії, а в ринковому тиску. Ми спостерігаємо класичне зіткнення між Gartner Hype Cycle та реальністю корпоративного бюджетування.

Механіка «Мандату на виконання»

Катастрофа починається задовго до того, як розробник встановить AI Code Assistant. Вона починається з інвесторів.

Під впливом звітів, що обіцяють «55% приросту продуктивності» та «демократизацію кодування», інвестори тиснуть на Борди, щоб ті продемонстрували AI-стратегію зараз. Повідомлення для CEO однозначне: «Впроваджуй AI або стань нерелевантним.»

Але Борд стикається з дилемою. Вони вимагають адопції AI, але не мають чіткого розуміння ROI чи складності необхідної трансформації. Вони сприймають AI як інструмент (на кшталт швидшої IDE), а не як зміну операційної моделі.

Відповідно, вони відмовляються виділяти бюджет на глибоку трансформацію (нові ролі, перебудова процесів, тренування агентів). Натомість вони видають те, що ми називаємо «Мандатом на виконання»:


«Впроваджуйте AI. Ось бюджет на ліцензії. Ось невеликий бюджет на воркшоп з промпт-інженерії. Вперед.»

Це виглядає як «безпечна» стратегія. Низька вартість (CapEx), легко впровадити. Але насправді це стратегічна помилка масивних пропорцій. Фінансуючи генерацію коду без фінансування управління кодом, Борд авторизував стійке збільшення обсягу, що значно перевищує пропускну здатність їхньої інженерної команди — без жодного плану закрити цей розрив.

Розрив між адопцією та впливом: 88% увійшли, 6% отримали результат

Масштаб цього розриву не теоретичний. Він вже вимірюваний на макрорівні.

Глобальне опитування McKinsey 2025 року щодо стану AI в enterprise виявило, що 88% організацій впровадили AI у тій чи іншій формі. Але лише 6% звітують про значущий вплив на EBIT — метрику, яка реально відображає, чи AI створює бізнес-цінність, а не просто активність.

Це «Мандат на виконання», відображений в агрегованих даних. Майже дев’ять з десяти компаній купили ліцензії. Менше ніж одна з п’ятнадцяти може продемонструвати, що інвестиція окупається.

82-відсотковий розрив між адопцією та впливом — не загадка. Це передбачуваний результат того, що Глава 2 кількісно оцінила: організації фінансують 1–3% реальної вартості того, щоб AI став продуктивним (ліцензію), залишаючи решту 97–99% (трансформацію) без уваги.

Сліпота масштабу: вертикальні криві vs горизонтальне планування

Цей розрив між планами керівництва та технічною реальністю визнають навіть ті, хто очолює AI-«Ренесанс».

Андреас Хорн, Head of AIOps в IBM, нещодавно зазначив, що розробка ПЗ перетнула лінію, з-за якої немає повернення. Хоча він виступає за потужність цих інструментів, він підкреслює вражаючий розрив у плануванні керівництва. Це коментар у соцмережах, а не рецензоване дослідження, але спостереження від старшого AI-практика у великому вендорі примітне саме тому, що воно звучить зсередини індустрії:


«Крива йде вертикально. Більшість планування досі горизонтальне.»

Ось де Субпрайм-криза спалахує. Прихильники на кшталт Хорна бачать вертикальну криву можливостей і прогнозують, що частка ручних кодерів буде «меншою, ніж хтось у boardroom зараз планує.» Але коли ми перетинаємо цю «вертикальну криву» з даними METR за березень 2025 про надійність (50% рівень невдач для завдань, що потребують 7 годин експертної людської роботи), небезпека стає очевидною.

Boardroom’и планують лінійне, «горизонтальне» зростання ефективності. Тим часом технологія доставляє вертикальний стрибок неверифікованої складності. Попередження Хорна про «vibe coding», що призводить до «клаптикового коду, який швидко старіє», підтверджує нашу тезу: без тотальної перебудови SDLC ми не прискорюємо інженерію — ми прискорюємо ентропію.

Парадокс стартапу vs enterprise

«Мандат на виконання» особливо небезпечний, бо ігнорує контекст.

Для стартапу на ранній стадії ця стратегія може реально працювати. Стартапи працюють за моделлю «fail fast». Їхня мета — валідувати гіпотезу до того, як закінчаться гроші. Якщо код брудний, але продукт знайшов product-market fit — вони виживають і переписують.

Для Enterprise, однак, ця стратегія токсична.

У зрілій організації вартість ПЗ не в його написанні — а в його підтримці. Галузеві стандарти свідчать, що 80% Total Cost of Ownership (TCO) програмного забезпечення припадає на період після деплою.

Коли Enterprise приймає «Стартап-стратегію» AI (максимальна швидкість, мінімум процесів), він затоплює свою довгострокову кодову базу «одноразовим» кодом. Але на відміну від стартапу, він не може його викинути. Він має підтримувати його роками. Економлячи копійки на генерації коду сьогодні, Борд гарантує мільйони збільшених витрат на підтримку завтра.

Для українського контексту це ще гостріше. Типова аутсорс-компанія на 500+ розробників працює під тиском клієнтів, які вже прочитали про «AI-революцію» і очікують миттєвого прискорення. Але ці клієнти не збільшують бюджет на якість — вони зменшують таймлайни. Результат: команда генерує більше коду під більшим тиском з меншим часом на рев’ю. Класичний рецепт для технічного банкрутства.

Сліпа зона дашборду

Чому C-Suite не бачить цю кризу, що насувається? Бо вони дивляться на неправильний дашборд.

Більшість executive-дашбордів вимірюють Активність, а не Здоров’я.

  • Вони бачать: Кількість комітів (Зростає), Фічі випущені (Стабільно), AI Adoption Rate (100%).
  • Вони не бачать: Складність коду (Злітає), Technical Debt Ratio (Критичний), Maintainability Index (Падає).

Дані McKinsey підсилюють це: дашборд показує 88% адопції. Він не показує, що лише 6% отримують реальну цінність. Корабель набирає воду, але Капітан дивиться лише на спідометр.

З даними METR за 2025 рік, що показують лише 50% надійності навіть найкращих агентів на суттєвих проєктах, «Активність» на дашбордах все більше відірвана від цінності. Половина тієї «швидкості» — це просто швидке накопичення токсичних активів.

Enterprise-опитування Deloitte за 2025 рік підтверджує цей зсув: організації переходять від експериментів до вимоги вимірюваного ROI — імпліцитне визнання того, що початкова стратегія «спочатку впровадь, потім вимірюй» не виправдала очікувань.

Висновок: стратегія деградації

Пастка «безкоштовного обіду» — це віра в те, що можна отримати переваги AI (швидкість) без оплати ціни (трансформація процесів).

Борд успішно оптимізував найдешевшу частину SDLC — друкування — ігноруючи найдорожчу частину — мислення. Поки керівництво не зрозуміє, що AI вимагає фундаментального зсуву в тому, як ми будуємо, а не лише якими інструментамикористуємось, вони продовжуватимуть фінансувати деградацію власних активів.

Джерела до Глави 3


McKinsey & Company (2025): «The state of AI in early 2025» — Глобальне опитування: 88% організацій звітують про адопцію AI; лише 6% звітують про значущий вплив на EBIT. mckinsey.com

METR (березень 2025): «Measuring AI Ability to Complete Long Tasks» — Горизонти AI-завдань подвоюються кожні 7 місяців; GPT-5.2 обробляє 7-годинні завдання з 50% надійністю. metr.org

Andreas Horn, IBM (лютий 2026): «The most important chart in AI» — Коментар старшого AI-практика IBM про розрив між вертикальними кривими можливостей AI та горизонтальним плануванням boardroom’ів. linkedin.com

Andreas Horn, IBM (лютий 2026): «AI writes code faster than teams can keep up with» — Аналіз «клаптикового коду» та прискорення ентропії в enterprise-кодових базах. linkedin.com

Deloitte (2025): «Now decides next: Insights from the leading edge of generative AI adoption» — Enterprise-опитування, що документує зсув від AI-експериментів до вимоги ROI-підзвітності. deloitte.com

Microsoft (2025): FY25 Q2 Financial Results — Рекордний дохід від Copilot підкреслює ринковий «Мандат на виконання» та структуру стимулів на стороні вендора. microsoft.com/investor

Глава 4. Анатомія зламу: як «безпечний сценарій» вбиває SDLC

Ми встановили, що Борд видав мандат на стратегію «високого обсягу» (Глава 3), профінансовану на 1–3% від реальної вартості трансформації (Глава 2), у систему, яка вже демонструє ознаки деградації якості (Глава 1). Тепер подивимось на точний механізм, яким ця стратегія ламає сам інженерний процес.

Щоб зрозуміти катастрофу, що розгортається в інженерних командах, не потрібні складні AI-теорії. Достатньо базової фізики виробництва — а саме, Теорії обмеженьЕліяху Голдратта.

Фізика доставки ПЗ

Кожен виробничий процес, включаючи розробку ПЗ — це ланцюг подій. Загальний вихід системи (Throughput) визначається рівно однією річчю: швидкістю найповільнішої ланки (Вузького місця).

Класичний SDLC (Software Development Life Cycle) був спроєктований для світу людської швидкості:

  1. Кодування (Обмеження): Писати код було важко, повільно і ментально виснажливо. Це було природне вузьке місце.
  2. Рев’ю та QA (Потужність): Оскільки кодування було повільним, наступні кроки (Рев’ю, QA) мали достатню потужність для обробки потоку.

Система була збалансована. «Повільність» написання коду діяла як природний клапан контролю потоку. Це не вада, яку треба оптимізувати — це конструктивна особливість стабільної системи доставки.

Зламаний клапан

Впровадження AI Code Assistants прибрало клапан контролю потоку.

Раптово фаза «Кодування» більше не є обмеженням. Джуніор-розробник з AI Code Assistant може генерувати код швидше, ніж здатен його прочитати. Як показано в Главі 1, обсяг коду, що входить у пайплайн, більш ніж подвоївся (+131% доданих рядків), тоді як його структурна якість значно деградувала (+39% когнітивної складності, +18% попереджень статичного аналізу).

Але ось «Анатомія зламу»: ми змінили вхідні параметри системи, не змінивши архітектуру вузлів обробки.

Ми качаємо пожежний шланг води (AI-згенерований код) у садовий шланг (Людське рев’ю).

Згідно з Теорією обмежень, коли ви збільшуєте потік вище за вузьке місце, ви не отримуєте більше throughput. Ви отримуєте Інвентар.

Проблема інвентарю

У виробництві інвентар, що лежить на підлозі заводу — це відома вартість: він займає місце, зв’язує капітал і деградує з часом. У ПЗ еквівалент ще токсичніший, бо він невидимий:

  • WIP (Work In Progress): Вибухає, створюючи пекло перемикання контексту. Xu et al. (2025) кількісно це оцінили: навантаження на рев’ю сеньйорів зросло на +6.5%, тоді як їхній власний кодовий вихід впав на —19%. Вони більше не будують — вони тріажать.
  • Merge-конфлікти: Зростають експоненційно, коли PR’и довше стоять у черзі. Те, що було 10-хвилинним мерджем, стає 2-годинною археологічною експедицією.
  • Когнітивне навантаження: Рев’юери змушені дебажити код, який вони не писали і не розуміють. Як показали Agarwal et al. (2026), AI-згенерований код несе +39% вищу когнітивну складність — тобто кожне рев’ю потребує непропорційно більше ментальних зусиль, ніж еквівалентний код, написаний людиною.
  • Застарілий контекст: До моменту, коли PR дістається до початку черги, кодова база вже змінилась. Рев’юер тепер має оцінювати код відносно стану, який більше не існує.

Це не теоретичне занепокоєння. Галузевий аналіз підтверджує, що AI-згенерований код потребує у 2–3 рази довшого часу на рев’ю через правдоподібні баги, сховані за синтаксично елегантним виходом — те, що цей звіт називає «правдоподібними брехнями».

Бінарний вибір у вузькому місці

Коли сеньйор-інженер стикається з чергою з 30 AI-згенерованих PR’ів і дедлайном спринту, у нього рівно два варіанти:

Варіант A: Глибоке рев’ю (Повільно, Безпечно) — Прочитати кожен рядок. Зрозуміти логіку. Перевірити edge cases. Відхилити те, що не відповідає стандартам. Це правильна інженерна практика — але при AI-згенерованих обсягах вона створює вузьке місце доставки, через яке команда виглядає «повільною» для менеджменту.

Варіант B: Rubber Stamp (Швидко, Небезпечно) — Проглянути PR. Перевірити, що тести проходять. Довіритись AI. Затвердити. Це тримає дашборд зеленим і sprint velocity високим — але це механізм, яким неверифікована складність потрапляє в продакшн.

Під тиском «Мандату на виконання», описаного в Главі 3, Варіант B стає раціональним індивідуальним вибором, хоча він є катастрофічним системним вибором. Сеньйор-інженер не лінивий і не недбалий — він реагує на систему, яка карає ретельність і винагороджує швидкість.

Це Пастка Rubber Stamp: структурний стимул затверджувати код, який ви не повністю перевірили, створений не індивідуальним провалом, а системою, що генерує код швидше, ніж люди здатні його оцінити.

Ілюзія «безпечної» адопції

Ось чому «Безпечний сценарій» — купівля ліцензій без зміни процесу — насправді є найнебезпечнішою доступною стратегією.

Зберігаючи старий процес (де люди мають вручну рев’юїти кожен рядок коду) при драматичному збільшенні обсягу та складності цього коду, організації перетворили своїх сеньйор-інженерів на нове вузьке місце без надання їм жодних нових інструментів чи потужностей для обробки навантаження.

«Безпечний» сценарій безпечний лише для бюджетного рядка. Для інженерної системи це повільний колапс:

  1. Обсяг подвоюється (Глава 1: +131% доданих рядків)
  2. Складність зростає (Глава 1: +39% когнітивної складності на одиницю)
  3. Потужність рев’ю залишається сталою (жодних нових сеньйорів, жодної автоматизованої інфраструктури рев’ю)
  4. Черга зростаєКонтекст деградуєRubber stamps збільшуютьсяДефекти проникають
  5. Витрати на підтримку вибухаютьСеньйори вигораютьПотужність рев’ю скорочується

Це петля позитивного зворотного зв’язку — спіраль смерті, де кожен цикл деградує систему далі. Черга стає довшою, рев’ю — поверхневішим, баги — глибшими, а виправлення — дорожчими.

Висновок: затор на дорозі

Уявіть автостраду, де ми раптово даємо кожній машині двигун Ferrari (AI), але не додаємо жодних нових смуг і залишаємо ту саму єдину пропускну будку (Рев’ю) в кінці.

Машини швидші. Рев двигунів гучніший. Але затор біля пропускної будки тепер тягнеться на кілометри.

Ми не побудували швидшу автостраду. Ми просто побудували швидший спосіб дістатись до затору.

Теорія обмежень каже нам, що оптимізація будь-якого кроку окрім вузького місця не просто марна — вона активно шкідлива, бо затоплює вузьке місце більшим обсягом роботи, ніж воно здатне обробити. AI Code Assistants оптимізували єдиний крок у SDLC, який не потребував оптимізації (швидкість друку), ігноруючи кроки, які реально обмежують доставку (рев’ю, інтеграція, верифікація).

Поки організації не інвестують у розширення вузького місця — через автоматизовану інфраструктуру рев’ю, AI-асистовану верифікацію, архітектурне управління та планування потужності сеньйорів — вони не прискорюють доставку. Вони прискорюють накопичення ризику.

Джерела до Глави 4


Goldratt, E. M. (1984): The Goal: A Process of Ongoing Improvement. North River Press. — Фундаментальний текст з Теорії обмежень: оптимізація не-вузьких місць збільшує інвентар без покращення throughput.

Theory of Constraints in Software Development: «Finding and Fixing the Real Bottleneck» — Прикладний аналіз того, як AI зміщує вузьке місце кодування на потужність людського рев’ю. theagilemindset.co.uk

AI Code Review Paradox (2025): «Why AI Coding Speed Gains Disappear in Code Reviews» — Галузевий аналіз, що підтверджує: AI-код потребує у 2–3 рази довшого рев’ю через правдоподібні баги, сховані за елегантним синтаксисом. softwareseni.com

Перехресні посилання: Ця глава синтезує дані з Глав 1–2. Первинні джерела щодо обсягу (+131%), складності (+39%), навантаження на рев’ю (+6.5%) та переробок (+2.4%) — див. Джерела до Глави 1 (METR, Xu et al., Agarwal et al., GitClear).

Про проєкт: від діагнозу до дії

Ця стаття — адаптація перших чотирьох глав відкритого аналітичного звіту «The Subprime Code Crisis», який я створив на GitHub.

Мета проєкту — не просто попередити про кризу, а дати інженерному ком’юніті конкретні інструменти для протидії:

  • 📉 Повний звіт (10 глав) — data-driven аналіз того, як AI-асистенти надувають бульбашку технічного боргу
  • 🛡️ Операційні протоколи — конкретні захисні заходи для вашої кодової бази
  • 📚 Повна бібліографія — кожна цифра перевіряється

Проєкт ліцензований під CC-BY-SA 4.0 і відкритий для контриб’юцій.

Одна дія, яка має значення


Якщо цей аналіз резонує з вашим досвідом — поставте зірку на репозиторії. Це не vanity metric. Це сигнал, що ком’юніті бачить проблему і вимагає зміни наративу. Чим більше нас — тим важче це ігнорувати.
Якщо хочете піти далі — відкривайте Issues з вашими кейсами, пропонуйте PR’и до протоколів, діліться статтею з вашим тех-лідом. Ця криза стосується кожного, хто пише або рев’юїть код.

Наступна стаття серії: «Зламана механіка» — смерть Code Review, чому AI-агенти не врятують, і ланцюгова реакція по всьому Value Stream.

Author: Vitalii Oborskyi — Head of Delivery & Ops | Creator of «Uncertainty Architecture» (AI Control Theory)

AI Governance Framework(AI Reliability = Actuators + Sensors + Controller): github.com/...​/uncertainty-architecture

LinkedIn: www.linkedin.com/in/vitaliioborskyi

👍ПодобаєтьсяСподобалось35
До обраногоВ обраному19
LinkedIn

Найкращі коментарі пропустити

Довгочит, мовою оригінала (він білорус, у Польщі, виїхав коли там народу не вдалося відстояти свій вибір).
Віртуально я пару років знаю. На Медіум можна погуглити його статті про RAG.
А так — він один з авторів «Copilot для юристів».
Супер оптимістом ШІ був. Особливо як у Каліфорнію з’їздив: Тотальна революція! Ура! ... і тд

Сергей Авдейчик:

Скорость выросла.
А вот вывозить стало сложнее: как агентный ИИ переводит нас с техдолга на когнитивный долг

Мы все сейчас немного на хайпе: Cloud Code, Codex, Google Antigravity, Cursor, агентские пайплайны, автогенерация фич «под ключ». Никто уже не спорит — скорость разработки растёт кратно, а скорость генерации кода — вообще на порядки.

И вот парадокс, в который многие из нас влетели на полной скорости.

Чем быстрее вокруг тебя «пишут код» агенты, тем тяжелее становится тебе самому. Не по линии «сложно в коде», а по линии сложно в голове.

Я это очень чётко ощутил на себе: чтобы эффективно работать с AI-агентами, нужна более высокая концентрация, больше «оперативной памяти», способность держать в голове одновременно:
— контекст задачи,
— архитектурные ограничения,
— цепочку действий агента,
— риски побочных эффектов,
— и ещё — параллельно — план следующего шага.

Раньше цикл разработки был «тикет → митинг → техзадание → реализация». Интервалы были человеческие: часы, дни. У тебя было время отойти, переварить, структурировать, вспомнить почему ты так сделал, а не иначе.

Теперь же ты можешь за один вечер «закрыть» объём недели — и это звучит как победа... пока не наступает середина проекта.

Последняя миля стала адом (и это новая норма)

Есть старая, почти классическая динамика: старт проекта бодрый, потом «последняя миля» тяжёлая, но у тебя уже есть понимание архитектуры и накопленный опыт решений. В традиционной разработке к финалу у тебя обычно в голове складывается теория системы: что она делает, почему устроена так, где слабые места, как безопасно менять.

С агентами всё перевернулось.
Первая фаза теперь супербыстрая, потому что агенты легко набрасывают каркас, API, интеграции, UI, тесты, миграции — всё, что раньше съедало недели.

А дальше начинается странное: скорость падает, правки становятся рискованными, любое «просто поменять вот тут» неожиданно ломает пять мест. И самое неприятное — у тебя появляется ощущение, что проект больше не у тебя в голове.

Это и есть то, что всё чаще называют когнитивным долгом.
Техдолг живёт в коде. Когнитивный долг — в мозгах

Технический долг мы умеем распознавать: плохая архитектура, костыли, отсутствие тестов, спагетти, дедлайны, «потом отрефакторим».
А когнитивный долг — штука коварнее. Код может быть даже аккуратным (агенты умеют «красиво»), но при этом:
— никто не может внятно объяснить, почему выбрали именно этот подход,
— «как оно работает» — это набор разрозненных догадок,
— изменения превращаются в русскую рулетку,
— система становится чёрным ящиком даже для авторов.

Программа — это не только исходники; программа — это теория в головах разработчиков. Код — лишь одна из проекций этой теории.

Агентный ИИ умеет производить код быстрее, чем мы успеваем строить и поддерживать теорию.

И вот почему когнитивный долг, как по мне, становится опаснее техдолга: техдолг чинится инженерными практиками на уровне репозитория, а когнитивный — требует восстановления коллективного понимания, а это всегда дороже, дольше и эмоционально тяжелее.

«Больше агентов» ≠ «быстрее проект»

Здесь очень уместно вспомнить «Мифический человеко-месяц»: добавление людей в проект повышает стоимость координации. С агентами происходит похожее, только координация становится тоньше и менее заметной.

Каждый агент:
— принимает микрорешения,
— выбирает между альтернативами,
— вводит новые сущности,
— меняет поведение системы.

И если эти решения не становятся частью общей теории команды (то есть не попадают в головы людей), то у тебя появляется невидимая сложность. Ты как будто живёшь в проекте, где половина решений принята «кем-то», «где-то», «почему-то».

Отсюда и эта новая когнитивно-эмоциональная нагрузка: ты не просто пишешь код — ты следишь за роялем, который сам играет, но иногда внезапно меняет тональность.

Плохая новость: это не «детская болезнь инструментов». Это фундаментальная штука: человеческая рабочая память ограничена, а агентные системы умеют перегонять изменения быстрее, чем мы их осмысляем.

Я думаю, в ближайшие годы мы будем говорить не столько про «технический долг» (он никуда не денется), сколько про управление когнитивным долгом: как измерять его, как предотвращать, как снижать, как он масштабируется в распределённых командах и open source, как адаптируется онбординг.

И, честно, это может стать одной из главных дисциплин инженерии в эпоху LLM.
Потому что скорость генерации кода — это уже решённая задача.
А вот сохранение общей теории системы в головах людей — похоже, становится задачей номер один.

Если вы сейчас на агентских инструментах и чувствуете, что «ускорились, но устали», — это не слабость. Это сигнал: вы не просто пишете софт. Вы управляете когнитивной нагрузкой, которую софт теперь создаёт быстрее, чем когда-либо.

И да — похоже, нам придётся снова полюбить старую школу: ясные решения, тесты, ревью, парное мышление и регулярное «а мы вообще понимаем, что делаем?».

Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

ШІ ентузіасти — шах і мат.
------‐------------------------------------------------------------
OnlyFans vs ChatGPT: на що американці витрачають більше грошей

Економіка цифрових підписок іноді дає результати, які виглядають парадоксально. За даними різних досліджень ринку, витрати користувачів на OnlyFans у США перевищують сумарні платежі за підписки на ChatGPT та The New York Times.

«шах і мат» виглядав би як «OnlyGPT», чи принаймні «The New GPT Times»)

Ну так теребонькать то ж реальна потреба, а от думати можна і дупою! ))))
Плот твіст — чати жпт відповідає в чатах із моделлю на онліфанс!
Доречі не здивиуюсь якщо це і правда, на балакучу примітивну модель потрбіно дуже мало потужностей, відносно топових моделей.

Потужно, dev бокси, 400 тулзів для доступу до внутрішніх ресурсів, предефайнений workflow у вигляді коду і агентів які роблять повний цикл — розробку, тестування, ci/cd.

Причому використовують форк агента від блока, який Дорсі використовуав і адаптував внутрішні процеси ще до появи claude code.

І потім, якийсь Бондаренко чи Нурібеков пише що це маркетинг, тому що безкоштовний чатгпт з якоюсь задачею з першого разу у нього не справився. А Дорсі уволив половину команди щоб акції на 20% пампануити, а не тому що йому в новому світі, де він один з перших почав інтегрувати ШІ в процеси, стільки народу не треба.

Я давав приклад задачи. Елементарна по суті. Але щось відповіді немає... мабуть й досі пояснюють агентам, що треба зробити, документацію пишуть... :D

Тобі пояснили покроково як елементарно і просто вирішується твоя задача, но ти продовжуєш дурачка включати.

Тобі дай лопату но ти продовжиш ложкою землю рити, бо не зможеш розпакувати лопату, і будеш потім всім розказувати що лопата для роботи на землі не годиться.

Ну якщо тобі в кайф щодня писати один і той же код трансформацій замість того щоб один раз за 10 хв згенерувати скіл (документацію) то продовжуй це робити. Тільки не розказуй тут що це єдиний робочий варіант і інакше ніяк.

Тобі пояснили покроково як елементарно і просто вирішується твоя задача

Мені треба не пояснення було, а результат. Розумієш різницю?

Ну якщо тобі в кайф щодня писати один і той же код трансформацій замість того щоб один раз за 10 хв згенерувати скіл (документацію) то продовжуй це робити.

Ти не почув аргументацію. Нічого, можу повторити. Проблема не в тому, що треба щось писати руками чи за допомогою вайбкодингу. Проблема в тому, що вайбкодинг не допомагає, коли твоя задача не типова. Я надав приклад нетипової задачі.

Я надав приклад нетипової задачі.

нет, ты дал пример некорректной задачи: claude.ai/...​95-46e1-b685-54b48d925530

Задача поставлена некорректно — она требует от JOLT то, что он не умеет делать.

мы — умеем пользоваться AI, получаем результат и деньги зарабатываем. а ты носишься со своей «нетиповой задачей» по комментам, устраивая клоунаду наподобие «ха-ха-ха! чатЖПТ не смог посчитать буквы r в слове strawberry!»

А чому це працює?
Протестувати можна тут

[
  {
    "operation": "shift",
    "spec": {
      "refs": {
        "*": {
          "title": "lookup.@(1,id)"
        }
      },
      "items": {
        "*": {
          "*": "items[&1].&",
          "ref": [
            "items[&1].ref",
            "items[&1].joinKey.@(0)"
          ]
        }
      }
    }
  },
  {
    "operation": "shift",
    "spec": {
      "items": {
        "*": {
          "*": "items[&1].&",
          "joinKey": {
            "*": {
              "@(4,lookup.&)": "items[&3].title"
            }
          }
        }
      }
    }
  }
]

© Gemini 3 Pro link

а никто не говорил, что сделать нельзя. вопрос был в том, насколько корректная задача? она не корректна: JOLT не предназначен для решения таких задач. это подтвердил тебе Gemini, это же подтверждает еще раз Opus, попутно решив задачу: claude.ai/...​30-451c-9f77-6ae112255716

тут поинт в том, что так делать — неправильно и не нужно в реальных проектах. и это не «нетиповая задача». задача абсолютно типовая, инструмент выбран неправильно.

ну и главное, ради чего все автор затеял: он придумал ребус, чтобы показать, как LLM не справляется. LLM справилась.

а никто не говорил, что сделать нельзя.

Перший раз Claude чітко про це сказала:

Задача поставлена некорректно — она требует от JOLT то, что он не умеет делать.

Задача коректна, життя бентежне, іноді треба або якось викручуватися, або мігрувати на інший інструмент, чи додавати костилі. Не виключаю варіант, що це задача з практики з реального проєкту: є готовий пайплайн, який викликає JOLT, і з’являється клієнт якому ось так треба, а в пайплайні коду немає. Що робити? Переписувати пайплайн? Чи додати трюк?

Задача нетипова, і навіть у Claude виникли проблеми. Задачу вирішити можна, а дискусії чи налаштований інструмент для цього чи ні це філософія. Так, трохи інший контекст, і Claude і Gemini вирішили задачу, хоча обидва з другої спроби.

Перший раз Claude чітко про це сказала:

можно было бы поспорить, но не буду. соглашусь c тобой — Опус ввел в заблуждение. скажем так, скорее всего я поставил вопрос некорректно + трудности перевода. плюс, своим вопросом я задавал рамку ответа, что в данном случае тоже не очень правильно.

все же, я стараюсь фокусироваться на практической стороне.

может LLM решить эту задачу ? — да, может.
нужно ли решать эту задачу таким способом? — нет, не нужно. но в крайнем случае, LLM решить может. что и хотел автор, чтобы ему доказали.

LLM решить может. что и хотел автор, чтобы ему доказали.

Я можу нагадати про контекст, чому саме зʼявилася ця задача та що вона мусить довести в решті решт. Для типових середньостатистичних задач LLM буде працювати доволі ефективно. Для нетипових задач — погано (неефективно) через брак «знань». Жодний агент не зможе виправити цей недолік (поки що). Тому закидони, що ви просто не вмієте його налаштовувати, є наївними спробами видавати бажане за дійсне.

она не корректна: JOLT не предназначен для решения таких задач.
задача абсолютно типовая, инструмент выбран неправильно.

Звинувачувати задачу, що її не може вирішити AI — це ще той зашквар...

LLM справилась

Це мені нагадало анекдот про лучника, який спочатку стріляв в стіну, а потім навколо малював мішень. Ви приймаєте будь-який результат за успішний результат. Така поведінка має право на життя, не сперечаюся.

Да любий проект для ЛЛМ це не типова задача якщо слідувати твоїй логіці. Тому є агенти, тулінг, і коли все налаштовано — вайбкодинг прекрасно працює.

Ну да, треба налаштовувати, це частина процесу. На велосипеді також треба вчитися їздити перед тим як літати на ньому.

Да любий проект для ЛЛМ це не типова задача якщо слідувати твоїй логіці.

Не вгадав. Є типові задачі, є нетипові задачі. Вгадай, для якого типу задач будуть побудовані вектори з кращою точністю?

Ну да, треба налаштовувати, це частина процесу.

Налаштування не покращать модель. Це як ставити на Ланос модні гальма в сподіваннях що це покращить динаміку розгону.

Да весь агентський стек з скілами це вирішення «нетипових» проблем.

ЛЛМ грубо говорячи має 3 характеристики:
1. Знання
2. Reasoning (її розумність опрацьовувати вихідну інформацію якої немає в знаннях)
3. Розмір робочого контексту

Твоя проблема це знання, необхідні тобі знання для вирішення твоєї нетипової проблеми не «зашиті» в модель.

Но! Reasoning-а сучасних проблем достатньо для вирішення майже будь-яких задач які поміщаються в робочий контекст. Це твоя відповідальність поставити задачу правильно і надати необхідні дані (в твоєму випадку документацію і приклади) для вирішення твоєї задачі не вилазячи з робочого контексту. Агентський стек дає всі необхідні інструменти (скіли, тулзи) щоб це зробити.

Твоя аналогія з ланосом лише в черговий раз доказує що ти дупля не відстрілюєш як працюють сучасні ЛЛМки і агентський стек.

Це твоя відповідальність поставити задачу правильно і надати необхідні дані

Це не змінить нічого в моделі. Покращить деякі з векторів, але кардинально не змінить. Приклад з JOLT наочно це показує. Жодна з моделей не впоралася із задачею з першого разу (поки що).

Твоя аналогія з ланосом лише в черговий раз доказує що ти дупля не відстрілюєш як працюють сучасні ЛЛМки і агентський стек.

Можна скільки завгодно це повторювати, але звідки в тебе така впевненість в цьому? Ваша проблема в тому, що ви сприймаєте AI як блекбокс. Закинули на вхід барана — отримали на виході палку ковбаси. Але ви гадки не маєте, що саме було всередині. Тепер ви всім розказуєте, що ви отримали якесь унікальне знання про те, як все працює всередині, хоча насправді ви лише навчилися розповідати про ефекти, а не механіку.

Жодна з моделей не впоралася із задачею з першого разу

claude.ai/...​0b-42f3-93c2-876fbe5b644f
вот тебе с первого раза.

это тебе наглядный пример, что это не AI тупой, а ты не умеешь работать с LLM. плохому танцору, как известно, яйца постоянно мешают.

Це не змінить нічого в моделі. Покращить деякі з векторів, але кардинально не змінить. Приклад з JOLT наочно це показує. Жодна з моделей не впоралася із задачею з першого разу (поки що).

Весь діалог з тобою зводиться до цього:
— вінда не вміє нормально редагувати фото
— поставь фотошоп
— це нічого не змінить в вінді. Вінда всеодно не зможе фото редагувати

Що якби доказує твоя поверхневе знання ШІ тулінга і ролі LLM моделей в ньому.

Тепер ви всім розказуєте, що ви отримали якесь унікальне знання про те, як все працює всередині, хоча насправді ви лише навчилися розповідати про ефекти, а не механіку.

Ну, ми успішно вирішуємо деякі складні задачі, а ти навіть елементарної зі своїм JOLT не можеш вирішити, навіть після того, як тобі покроково розписали як вирішити. Що якби натякає що у нас є деякі знання і чуйка де, як і коли який ШІ тулінг і моделі використовувати.

Весь діалог з тобою зводиться до цього:

Невірно. Спробуй ще.

Що якби доказує твоя поверхневе знання ШІ тулінга і ролі LLM моделей в ньому.

Ти не навів жодного аргумента за твою сторону. Тільки звинувачення, що всі нічого не розуміють. Аргументація рівня «Бог».

Ну, ми успішно вирішуємо деякі складні задачі, а ти навіть елементарної зі своїм JOLT не можеш вирішити

Лише деякі? JOLT був одним з прикладом того, що при відсутності «знань» LLM значно гірше дає результат з більшими витратами часу на вирішення. Нагадаю, що Claude взагалі спасував. Що є таким собі результатом.

Що якби натякає що у нас є деякі знання і чуйка

Останнє просто порвало... :D Серйозний аргумент! Дорослий!

твоя відповідальність поставити задачу правильно і надати необхідні дані

Я от що іще помітив(чисто субєктивно) що ллм-кодінг заходить як раз техлідам та іншим лід+ левел, а також сеньорам хто мав досвід делегації задач. Ті хто звик робити все сам, важче адаптуватись до нової парадигми мислення.

нет ничего общего у делегации задач людям и делегации задач ллм. далагация задач ллм — это написание тасок и работа мануальным тестеровщиком

а если бы не передумал, то как бы ты ответил на вопрос в чем разница между тех лидерством и бейбиситингом?

во всем. нянчиться — значит, контролировать, помогать, исправлять, переделывать и тд.

лидерство — ты определяешь цели, границы, критерии и позволяешь людям самостоятельно добиваться результата, только помогая им сохранять вектор движения. тогда они растут, а ты получаешь результат.

пока ты нянчишься с AI агентами, переделывая в VS Code код, чтобы он тебе больше нравился, ты не получишь реального ускорения. когда ты научишься делегировать, поймешь, что AI агенты, как и люди, несовершенны, но и от тех, и от других можно получать результат, тогда у тебя все начнет получаться.

я передумал потому, что не хотел козырять личным опытом, потому что я тут аноним, а раскрывать детали — меня могут узнать, чего я не хочу. но я 10 лет был ПМом крупных проектов, и был хорошим ПМом, так что понимаю, что такое — делегировать. просто поверь на слово.

Важаю позицію Фаулера збалансованою — він не фанбой ШІ, але й не завзятий критик.

Martin Fowler: 25 Feb 2026

Martin Fowler: 19 Feb 2026

I recently tried migrating a Python project to TypeScript using GPT-5.3-Codex — letting the agent handle it 100% autonomously.

On the surface, it was impressive.
All tests passed.
All requirements were met.
Functionally, everything worked.

But once I reviewed the code... it was a different story.

Unnecessary over-engineering.
Unreasonable module structures.
Duplicate logic.
Shortcuts clearly written just to satisfy test cases.

And here’s the interesting part:
The more iterations I allowed, the more complex and convoluted the codebase became — even though functionality remained intact and tests continued to pass.

Yes, AI can save you time getting something working.
But you may end up spending even more time teaching it how to do it properly.

It reminded me of the Infinite Monkey Theorem.

Today, AI is that monkey — it keeps typing until something works.
But passing tests doesn’t mean it understands what it’s building.

What if future AIs are trained mostly on AI-generated code?

Each cycle could dilute well-crafted, human-written code with layers of “just-make-it-work” output. Programs will still run. Tests will still pass. But the code may no longer be truly human-readable.

And if humans no longer need to read code, do programming languages even matter?

We might go full circle — from machine language, to human-readable abstractions, and back to something only machines understand.

Оригінал посту www.linkedin.com/...​-7432994214222909440-xsDm

То й що? Бізнесу пофіг на якість коду якщо вінг працює. І навіть якщо не оптимізований код жере більше ресурсів, все одно праця інженера коштує дорожче

Тому що це з часом збільшує ТСО — витрати на підтримку коду зʼїдають прибутки. Коли в такій кодовій базі — щось зламалось, а людей хто цю кодову базу тут і зараз розуміє немає — то це стає дуже дорого полагодити. Постійне зростання складності ШІ генерованого коду, там де ця складність «не потрібна» бо не вирішує проблему — це шлях до
1. Того що через деякий час цей код ніхто вже не буде розуміти.
2. Сам ШІ в цьому перестане розбиратись. Бо генерує як показують звіти на 130%+ більш обьемний код і на 39% з зайвою складністю порівняно з «людським».

Щоб потім це все розгрібати — треба буде знову використовувати досвідчених інженерів. І робота ця буде вкрай дорогою.

Бо генерує як показують звіти на 130%+ більш обьемний код і на 39% з зайвою складністю порівняно з «людським».

на эти цифры нужно смотреть внимательно. потому что практика показывает, что люди частенько забивают на edge cases, дополнительные тесты и inline docs. а AI на это не забивает и потому код получается, более безопасный, но и более объемный, разумеется.

я знаю, что ты напишешь, вот мол, есть отчеты, а у меня есть только личные впечатления. все так и есть, я своему коду доверяю гораздо больше, чем каким-то чужим цифрам, да еще и устаревшим.

Так я хіба десь ваш код під сумнів ставив? Більше того — підкреслював що в ізольованих і локальних умовах — все може працювати чудово. А небезпека — саме для великих та складних продуктів в першу чергу. А наприклад для стартапів — взагалі не критично це все може бути. Я от оптимізував нещодавно серією власних агентів частину своєї роботи. Мені треба парсити з різних джерел і під «різними» аналітичними кутами по різному структуровані дані. Щоб на виході була одна і таж структура агрегована так як мені зручно. Щоб далі — опрацьовувати «головою». ШІ не приймає тут ніяких рішень, даних не дуже багато і вікно контексту обмежене, і я не переймаюсь сильно що ШІ буде галіцінувати бо через не велику кількість даних інпуту — не бачу деградації навіть вікна уваги. До того ж в агентах прописаний запобіжник в вигляді цитування з оригінальних сорсів якщо ШІ робить якийсь «висновок» проміжний при агрегації і ще стоїть запобіжник «не вигадувати і казати — не знаю». Щоб мій промпт банально не змушував ЛЛМ — вигадувати результат. Більше того — по ключовим категоріям — я перевіряю результати роботи кожен раз — очами. Але як це все маштабувати наприклад на організацію 1000 людей? Це ж не масштабується «автоматично». ЛЛМ в цьому сценарії — по суті просто розумний парсер і не більше. І таке використання як приклад — доволі безпечне якщо ти знаєш що робиш і як такий парсер створити.
Також доволі багато користі бачу наприклад в роботі цього чувака www.reddit.com/u/stunspot/s/Rh0sD8yx18
Він людина досить не ординарна і навколо його ідей — дуже багато і хейта в тому числі. Але — для себе я спробував і подивився його «агентів». Частково мені здається що вони дещо «переускладнені». Але — з іншого боку бачу що на рівні промптів та створенні саме агентів — він дуже глибоко копнув. Саме в налаштуванні конкретних «персон» під задачі. І корисні патерни у нього точно є і більше того — прикскіплива перевірка аутпуту за рахунок аналізу агентами з різними налаштуваннями — він реалізував круто задовго до того як взагалі індустрія почала використовувати термін "агентік ШІ«.Тобто людина — по суті створила протоагентський підхід — а все що зараз в цьому сенсі відбувається на ринку — часто повторення або «перевинахід» його ідей та концепцій. Тобто він працює не в полі — як зашаманити щось на рівні коробкових рішень від вендора налаштувавши агентів як вендор рекомендує. А в полі — коли ще ніхто толком не розумів що таке агенти — він іх створив, розробив свою філософію та методологію створення, свій «язик» промтингу який утилізує можливості ЛЛМ максимально(згідно з його баченням).

на эти цифры нужно смотреть внимательно. потому что практика показывает, что люди частенько забивают на edge cases, дополнительные тесты

Я би сказав скоріше навпаки, дуже часто LLM пропускають можливі сценарії роботи. А тести зазвичай ні про що, бо дуже складно відтворити контекст.

по моему мнению, это из-за недостатка контекста, когда edge cases неочевидны из той документации, которая доступна агенту.

когда я даю команду: «а ну-ка посмотри пристально на спеки, тщательно проанализируй реализацию и выяви возможные edge cases», то находит в итоге зачастую то, что я сам бы пропустил, только наткнувшись бы выявил.

На жаль, це працює лише для нескладних задач. Проблема документації полягає у тому, що це або спрощення, яке приховує деталі, які як раз важливі, або має таку ж саму складність що й код, який по суті також є формою специфікації, тільки без приколів природніх мов на кшталт багатозначності, неточності, тощо. Не кажучи про те, що документацію створюють не телепати, тому вона не може дати відповіді всі на питання які з’являться у майбутньому.

По-друге, саме тут LLM має багато хибних спрацьовувань, коли починає жалітися на граничні кейзи, які просто виключені інваріантами поведінки. А щось реальне знайти не може. unit-тести обмежені бо комбінаторний вибух можливих контекстів.

На жаль, це працює лише для нескладних задач.

Я б уточнив, що це працює для _стандартних_ задач, бо контекст для них вже зашитий при навчанні. Саме тому на демках ШІ ми бачимо інтернет-магазини, три-у-рядок, тетріси, 2048, туду-лісти.

Я приводив вже приклад з JOLT трансформацією. Жоден прихильник вайбкодінгу мені не надав правильного рішення. А це ж так просто зробити з агентнтим програмуванням... ;)

На жаль, це працює лише для нескладних задач

это работает для тех кодовых баз, в которых более-менее соблюдаются принципы SOLID. тот случай, когда размер, действительно — не главное.

Проблема документації полягає у тому, що це або спрощення, яке приховує деталі, які як раз важливі

проблема документации в том, что ее не пишут, а если пишут, то потом не апдейтят.

SOLID ніде не бачив хоча б близько у промисловому коді, це дуже схоже на радикалізм новачків, які вірять в те, що срібляна куля існує. Щодо документації... я працював в корпораціях, де до цього ставилися прискіпливо, не можна було кодувати без затвердження feature design документа. Але користь від цього була досить обмежена., бо простіше подивитися код. Так ознайомитися на початку, коли ти не мав з цим справи... І знову ж зазвичай у тебе виникають питання, яких немає в документації.

Це скоріше реклама. Якщо воно реально працює то нема ніякої різниці наскільки код поганий, хороший код треба щоб його можна було модифікувати, якщо ІА так само зможе дописати нову фічу до того гівна що вже є то це успіх.
Багато розробників забувають що сам по собі код не є цінністю, він настільки хороший наскільки вирішує задачу бізнесу

Мінуси?

Взагалі, багато невідомих:
— якого розміру проект
— які інструкції, скіли доступні
— чи був якийсь план поступової міграції чи одним промтом сказали конвертни
— reasoning був low, medium чи high?
— який взагалі агент використовув? Кодекс модель сіяє з codex cli агентом.

І від цього залежить буде конвертація говном чи нормальною і чистою.

Взагалі, щоб кодекс агент так зробив як у автора, це сильно треба налажати по кільком пунктам.

вообще, таких постов как правило, меньшинство. и если критически посмотреть, то в основном они оказываются skill issue.

да, ai coding agents еще не идеальны. позиция одних: «они не идеальны, потому действуем по старинке, пусть другие тропку прокладывают». позиция других (и моя в том числе): «они не идеальны, поэтому нужно пробовать и учиться. пока другие ждут, я уйду далеко вперед».

пока другие ждут, я уйду далеко вперед

Але не в тому напрямку, що треба... :D

Воно швидше як в тому мемі:

www.pinatafarm.com/...​93-4cf3-8d3d-7737c94f203b

Коли ШІ робить помилку в 1000 строчках згенерованого коду, одні бачать лише ту помилку і весь ШІ код для них це помилка, а інші бачать 1000 строк згенерованого коду який лиш треба трохи поправити або підтюнити тулінг щоб більше такої помилки не було.

пока другие ждут, я уйду далеко вперед

Я скептичний по поводу цього. Воно настільки все швидко рухається і устаріває, що ті знання ШІ тулінга і підходів які ти мав рік назад вже нікому не потрібні. І потім дивишся як якийсь Вася, який був далеким не тільки від ШІ но і від програмування, за 2 тижні піднімає на openclaw воркфлоу (generic purpose воркфлоу, не програмування) який ти намагався пів року сам зробити — це все викликає сильне ФОМО. Тому воно до цього все йде, що буде pure вайб кодинг і не сильно треба буде паритися про prompt engineering і context engineering, і виграє не той, хто більше досвіду має, а той, у кого мозги швидше працюють і більше вільного часу має.

x.com/...​tatus/2027129697092731343

Джек Дорси уволил 40% людей из своей компании (4000 человек). причина — AI tools радикально меняют как ведется технологический бизнес. он решил сделать один быстрый сильный шаг, чем резать хвост по частям. после известий акции Block подскочили на 23%.

бизнес уже делает свои выводы относительно эффективности AI. можно конечно, «не смотреть наверх», но нас все это коснется тоже.

Он це я називаю реальні цифри ефективності а не ефімерні метрики, якими тут оперують ШІ дисиденти.

Вони зараз себе заспокоюють тим, що це не через АІ а просто використовують АІ як прикриття щоб позбутися баласту.

Ну да, раніше баласт був потрібен а зараз чомусь ні, цікаво чому?

Он це я називаю реальні цифри ефективності а не ефімерні метрики, якими тут оперують ШІ дисиденти.

він каже, що звільнив 4к людей, далі буде 20+ тижднів їм платити гроші і потім якісь лозунги, що в нього бізнес росте, буде рости далі і клієнти будуть задоволені.

де ти у тому пості побачив реальні цифри ефективності?

Маск той твітар порізав в рази, коли це ще не було мейнстрімом ШІ.
Реально не зрозуміло як 4000 людей може бути зайнято в такому простому застосунку як твітор.
Дуров он щось весь Телеграм хоть з ШІ хоть без ШІ тримає командою з 40 людей.
Ось коли Дуров звільнить кожного другого зі своєї команди, тоді так, то була не оптимізація роздутого штату тестировщиків кавоварок, а реальні звільнення.

Та навряд чи було звільнено 4К девелоперів чи куа. Можливо, це була техпідтримка, умовні асистенти, секретарі, тощо.

Це дійсно дуже показовий кейс, але давайте відділяти реакцію фондового ринку від реалій інженерного делівері.

Акції Block підскочили на 23% не тому, що ШІ раптом почав ідеально підтримувати їхню архітектуру. Уолл-стріт завжди аплодує миттєвому радикальному зниженню OpEx (операційних витрат). Компанія одним днем скинула з балансу зарплатний фонд 4000 людей. З точки зору квартального фінансового звіту — це феноменальний буст маржинальності.

Але з точки зору SDLC — це безпрецедентний і дуже небезпечний експеримент, який я якраз детально описував минулого місяця у статті про «The AI Cost-Cutting Fallacy».

Те, що зробив Дорсі — це класична логіка електронних таблиць (Spreadsheet Logic) та спроба перестрибнути J-Curve. Керівництво бачить локальне прискорення генерації коду завдяки ШІ і робить лінійний висновок: якщо ми пишемо на 40% швидше, нам потрібно на 40% менше людей. При цьому зрізається проміжний шар (те, що Дорсі назвав переходом до «flatter teams»).

Що відбудеться далі? Завтра ті 6000 людей, що залишилися, зіткнуться з колосальним навантаженням. Швидкість генерації коду (вайбкодинг) зросла, але швидкість його читання, валідації, тестування на безпеку та архітектурного рев’ю — ні. Сеньйорам компанії Block доведеться перетворитися на «AI Janitors», які потонуть у розборі згенерованого масиву, намагаючись утримати систему від деградації.

Дорсі сам у своєму листі прямо каже: «я приймаю те, що ми могли помилитися в деяких рішеннях щодо ролей». Тобто він свідомо скинув компанію в хаос, сподіваючись, що ШІ перекриє цей розрив.

Тому цей кейс — це не доказ того, що ШІ вже здатен безболісно замінити половину компанії. Це доказ того, що бізнес готовий використовувати ШІ як легітимний привід для агресивного скорочення витрат. Справжню ефективність цього рішення (вплив на технічний борг, TCO та швидкість релізів) ми побачимо не сьогодні на біржі, а через 12-18 місяців у реальному продакшені.

Чи має він право як керівник компаніі так діяти? Звісно має — хто ж йому заважає. Але чи це правильне рішення яке призведе до позитивного результату на протязі 1-2 років — він не знає сам. Він вирішив «ризикнути». І сам факт прийняття ризику кимось і десь при незрозумілих для інших обставинах — не є ознакою того що треба робити так самому. Якщо Коля стрибне з моста то ти теж стрибнеш? От коли ми наочно побачимо що Коля вижив, та ще і навчився літати — можно буде стверджувати що «обережність» можно відкласти в сторону і є зрозумілий рецепт успіху. І так, тут завжди є ділема «першопроходця» — з одного боку першопроходець, якщо він дійде — отримує колосальні переваги. З іншого — статистично більшість «першопроходців» в бізнесі — помирають так нікуди і не потрапляючи.

Розповім байку про «сина маминої подруги», який працював колись у дуже великому міжнародному банку. Тоді на ринку вирував хайп навколо 100% автоматизації тестування. Керівництво банку прийняло вольове рішення: масово позбутися мануальних тестувальників. Враховуючи, що екосистема складалася із сотень пов’язаних продуктів, над якими працювали тисячі інженерів, QA там займалися переважно складним грей-бокс тестуванням. Але план був простим і надійним: скоротити понад 50% мануального штату, а решту терміново перевчити на інженерів з автоматизації (AQA/SDET).

Логіка в табличках топ-менеджменту виглядала бездоганно: навіщо платити сотням людей за ручний аналіз та перевірки, якщо можна написати скрипти, які робитимуть це вночі, безкоштовно і в 10 разів швидше?

Спочатку все виглядало як абсолютний тріумф. Звіти рясніли тисячами автотестів, які проганялися за лічені години. Проте через 12-18 місяців цей ідеальний план зіткнувся з реальністю складних архітектур.

Вилізли дві критичні проблеми:

1. Вартість підтримки (Maintenance Cost) та крихкість. Банківська екосистема постійно змінювалася. Мінорний апдейт одного API або зміна інтеграційного контракту приводили до того, що сотні тестів миттєво «червоніли». Замість тестування нового функціоналу, дорогі AQA-інженери почали витрачати 70-80% часу просто на лагодження старих тестів (flaky tests), які падали через таймаути чи розсинхронізацію середовищ. Автоматизація перетворилася на монстра, що пожирав сам себе.

2. Сліпота автоматизації (Escaped Defects). Скрипт перевіряє лише те, що йому жорстко наказали. Він ідеально проходить «щасливий шлях», але абсолютно сліпий до ширшого контексту. Мануальний грей-бокс спеціаліст завдяки своєму когнітивному досвіду міг помітити аномалію в логах, нетипову затримку транзакції чи дивну поведінку на стику двох мікросервісів. Скрипт цього не вмів. Як наслідок, кількість критичних інцидентів, що просочилися в продакшен (production leakage), стрімко зросла — у деяких модулях на 30-40%.

Що відбулося далі? Банк почав зазнавати реальних фінансових та репутаційних втрат. TCO (Total Cost of Ownership) такої тотальної автоматизації виявився просто космічним.

І маятник хитнувся назад. Приблизно через два роки після старту цієї «революції» банк був змушений тихо дати задню. Вони відновили найм людей для когнітивного, дослідницького (exploratory) та грей-бокс тестування. За різними оцінками, компанія повернула близько 30-40% від попереднього обсягу мануальних позицій. Звісно, щоб не визнавати перед акціонерами провал гучної стратегії, ці ролі назвали інакше: Quality Analysts, Risk Engineers чи Exploratory Testers. Але суть не змінилася: бізнес болісно усвідомив, що скрипти чудово покривають базову рутину, але здоровий глузд, оцінку ризиків та аналіз архітектурних аномалій автоматизувати неможливо.

Сьогодні ми бачимо абсолютно ідентичний патерн із впровадженням ШІ-кодогенераторів. Спроба звільнити інженерів, покладаючись на алгоритми, які «пишуть код в 10 разів швидше», неминуче призведе до такого ж TCO-колапсу та тихого повернення кваліфікованих людей для розгрібання згенерованого хаосу.

А найцікавіше в цій історії те, що автор всього цього банківського експерименту на момент настання реальних наслідків у банку вже давно не працював і створений ним колапс не розгрібав. Натомість він побудував на цьому кейсі гучну та успішну кар’єру консультанта. Більше того, згодом він почав активно критикувати сліпу гонитву за 100% автоматизацією, називаючи її руйнівним «антипатерном», і навіть написав про це книгу-бестселер. Тобто людина спочатку створила масштабну корпоративну проблему, втекла до того, як вона вибухнула, а потім заробила статки, продаючи іншим компаніям поради, як уникати її ж власних помилок.

Чи варто додавати що коли цей геніальний стратегічний крок був зроблений — акції банку суттєво злетіли? Але вже через 2 роки, коли стала зрозуміла реальна ситуація — сильно впали? Чи варто також згадувати що перші 2 роки заміри «швидкості» показували шалену користь?

«Це ж було вже!».

А що ж сам банк? Точно ми сказати не можемо, бо жодна корпорація такого рівня майже ніколи публічно не визнає помилок стратегічного масштабу. Але можна впевнено сказати, що банк збив дебет із кредитом по всьому циклу цієї «революції» і зрозумів, що в сухому залишку вона принесла збитки. Саме тому сьогодні, спостерігаючи за лихоманкою навколо ШІ, ця організація веде вкрай обережну та консервативну політику щодо масштабного впровадження технологій на піку хайпу — без гучних стратегій «Звільнимо Х% інженерів бо ШІ іх замінить» — бо в керівництві банку сьогодні ймовірно ті люди — які розгрібали «наслідки» попередньої революції і чудово розуміють «ціну» таких рішень.

first off, if you’re one of the people affected, you’ll receive your salary for 20 weeks + 1 week per year of tenure, equity vested through the end of may, 6 months of health care, your corporate devices, and $5,000 to put toward whatever you need to help you in this transition

та це якийсь подарунок долі. щось підозрюю, що не всі people affected засмутилися)

І доречі, цікавий кут зору

This is CRAZY.

It turns out Jack Dorsey’s Block $XYZ spent $68 million on a single party in September 2025, roughly the annual payroll for 200 employees at $340,000 each.

Then 5 months later, he laid off 4,000 people (40% of the company’s workforce), citing AI and «intelligence tools» as a reason.

Many people are speculating the real reason is poor planning and overspending, not AI.

x.com/...​/2027250361816486085?s=61

Тобто це може все в реальності бути класичною ситуацією — керівництво компаніі роздуло штат, не здатне було утилізувати його з користю, додатково до цього не має фінансової дисципліни і «тринькало» грошима направо і наліво. Це призвело де реакції ринку і падіння акцій. На це СЕО має якось реагувати — скорочувати кости. Але скорочення костів в лоб — це фактично признати помилку. А значить — під загрозою звільнення буде і само керівництво. Що робити? Стати візіонером! Ми не скорочуємо кости тому що погані менеджери і витрачали гроші не ефективно — ми скорочуємо кости щоб компанія набула нової якості — ШІ компанія.

А далі — або щось вийде, якось, якимось дивом, або ні. Він вже собі «купив» ше 1-2 роки на посаді, зп, бонуси і т.п. А якщо не вийде — такий досвід рідко пропадає. Завжди можна стати консультантом і продавати антіпатерн ШІ трансформації — як я описував в байці про один банк.

Віталік вчить Дорсі плануванню. На його думку чувак, який створив два багатомільярдні стартапи, який практикує медитації, мінімалістичний стиль життя, не володіє дорогою нерухомістю, не вміє:
— визначати які працівники і скільки йому їх потрібно, і чисто випадково найняв в 2 рази більше ніж йому потрібно
— планувати витрати і потратив 70 млн. на вечірку не перевіривши фінанси
— не може просто звільняти по 10% в рік і нікому нічого не пояснювати і не оправдуватися, та хоч половину звільнити і нікому нічого не пояснювати, у нього 40% голосів в компанії і практично його звільнити дуже важко

«Жираф бааальшой єму віднєй... » ©

Ви знову дуже сильно ідеалізуєте топ-менеджмент, буквально сприймаючи за чисту монету те, що є класичним продуктом корпоративної PR-машини (медитації, аскетизм та інші публічні атрибути «візіонера»).

Більше того, ви робите хибний висновок, ніби я намагаюся когось повчати або вважаю керівництво компаній дурними. Насправді все з точністю до навпаки. Ці люди вкрай розумні та прагматичні.

Щоб не обговорювати персоналії безпідставно, давайте повернемося до байки про банк, яку я навів вище. Ви ж розумієте, що це абсолютно реальна історична подія?

Так от, чи був ідеолог тієї «революції» в банку дурним? Ні, він геніальний. Після банку він став партнером у Big4, потім йому стало там «тісно», він відкрив власне успішне консалтингове агентство і сьогодні є мультимільйонером. Його ім’я у корпоративному світі дуже вагоме, бо він керував трансформацією бізнесу, який за масштабами і впливом набагато більший за Block. Він ідеально розіграв свої особисті кар’єрні карти.

Чи було керівництво банку дурним? Теж ні. Вони заплатили певну ціну за цей експеримент, але отримали за ці «копійки» (в масштабах їхніх капіталів) залізобетонну інституційну пам’ять. Ті, хто прийшов лагодити процеси після звільнень, зробили бізнес-логіку управління набагато стійкішою. І як я вже казав, тепер цей банк ставиться до подібних хайпових рухів вкрай обережно.

Тому в таких історіях взагалі некоректно ставити питання в площині «хто тут правий, а хто дурень». Усі учасники дуже розумні і кожен переслідує свої цілі (СЕО рятує акції і бонуси, ринок радіє скороченню витрат).

Головне інженерне та управлінське питання полягає зовсім в іншому: чи можна було компанії отримати фактичний позитивний результат (робочу часткову автоматизацію) без цих радикальних рухів, шокових ризиків для архітектури та колосальних втрат на цикл «масове скорочення — падіння якості — екстрений найм назад»?

З точки зору стабільності SDLC і технічного боргу — безумовно можна і треба було йти еволюційним шляхом. Але еволюційний підхід та визнання помилок планування не підіймають акції на біржі на 23% за один день. А гучна «ШІ-трансформація» — підіймає.

Що ще цікаво — імя того СЕО — як я вже описав — вкрай вагоме в індустрії досі. А імен його послідовників мало хто згадує незважаючи на те, що вони потім наводили порядок в результатах тієї «революції», а їх карʼєри — далеко не такі яскраві і значно більш «скучні». Хоча ніхто з персонажів цієї байки — не бідує. То хто тут правий а хто дурень? Чи є взагалі відповідь саме на це питання в таких обставинах і чи має сенс саме так питання формулювати?

Ти як вуж на сковродці з допомогою чатгпт ізвиваєшся щоб не прийняти очевидного. Вже навіть коли пішли звільнення, і відкрито називають причини звільненнь, ви всерівно намагаєтесь за щось зацепитись. Твої аргументи із категорії що менеджери женуть всіх в офіси бо аренду треба платити чи шкода грошей на побудову офісу, ніби аренду більше не треба буде платити чи гроші на побудову вернуться.

У Дорсі достатньо бабла і достатньо влади в компанії, він може половину народу звільнити і ніхто ні в чому його винити не буде. Йому не треба щоб акції росли 20% за день. Це ніяк суттєво не змінить його положення в компанії і його статки. Єдиний головняк для нього це крипта і стейблкойни.

Ви плутаєте особистий гаманець мільярдера з капіталізацією публічної корпорації. Це дві абсолютно різні економічні реальності. Давайте розберемо, чому аргумент «у нього багато грошей і влади, йому пофіг на акції» — це дуже наївне уявлення про те, як працює Уолл-стріт.

По-перше: Якщо Дорсі настільки «пофіг» на ціну акцій, навіщо компанію взагалі виводили на IPO?
Компанію роблять публічною з однією метою — залучати публічний капітал. Якщо власнику байдуже на капіталізацію, він будує приватну компанію (як Valve чи Telegram) і робить там що завгодно. Але з моменту виходу на біржу СЕО отримує фідуціарний обов’язок. Він керує вже не лише своїми, а чужими грошима — капіталами інституційних інвесторів, пенсійних фондів тощо. Мати роздуті витрати і стагнуючу ціну акцій у таких умовах — це ризикувати мільярдами чужих грошей. За таке інвестори можуть влаштувати пекло, знизити рейтинги або ініціювати розслідування ради директорів та SEC.

По-друге: Міф про «недоторканність» і 40% голосів.
Історія бізнесу знає безліч прикладів, коли інвестори викидали на вулицю «повністю захищених» засновників за непрофесійні дії та втрату фінансової дисципліни:
1. Стів Джобс (Apple, 1985) — найвідоміший приклад. Засновник-візіонер, який втратив зв’язок з фінансовою реальністю компанії і був звільнений радою директорів, коли інвестори почали втрачати кошти через падіння продажів.
2. Адам Нойман (WeWork) — мав супер-голосуючі акції і юридично абсолютну владу. Але коли його неадекватне управління почало знищувати мільярди інвесторів, ті знайшли важелі тиску і змусили його піти.
3. Тревіс Каланік (Uber) — співзасновник, який разом із союзниками мав більшість голосів. Але великі інвестори об’єдналися і витиснули його через систематичні скандали, що загрожували капіталізації.
До речі, самого Джека Дорсі інвестори-активісти (Elliott Management) вже брали в жорсткі лещата у Twitter у 2020 році саме через незадовільні фінансові показники компанії. Тож він чудово знає, що буває, коли акціонери втрачають гроші.

І саме вивід цих компаній на ІПО — зробив співзасновників вразливими — безпечніше було б цього не робити.

По-третє: Чому стрибок акцій на 20% критично важливий для компанії просто зараз?
Левова частка доходів топових інженерів у Бігтеху — це акції (RSU). Якщо акції компанії стагнують через марнотратство керівництва, реальна зарплата команди зменшується. Що роблять ключові інженери, на яких після звільнення 4000 колег впало подвійне навантаження? Вони йдуть туди, де акції ростуть. СЕО зобов’язаний «пампити» ціну просто для того, щоб утримати ядро команди від втечі.

Чому не можна було просто звільнити людей без ШІ-наративу?
Тому що за визнання «ми втратили контроль над фінансами, роздули штат і спалювали гроші» інвестори карають обвалом капіталізації. А за заяву «ми оптимізуємось і стаємо ШІ-компанією майбутнього» — ринок аплодує і підвищує ціну акцій.

Тому сліпо вірити прес-релізам, що 4000 людей звільнили виключно через технологічне диво ШІ, а не через необхідність екстрено різати кости (Cost-Cutting) після втрати фінансової дисципліни — це просто не розуміти законів великого бізнесу та корпоративного виживання.

Тобто вивід компанії на IPO — це прямий крок, який доводить: співзасновника цікавив публічний капітал, а отже, критично цікавить і ціна акцій. Більше того, цей крок створює для нього величезний ризик. З моменту виходу на біржу він більше не може керувати компанією як абсолютною монархією і не звертати уваги на фінанси. Адже публічні компанії мають вбудований механізм захисту грошей акціонерів — Раду директорів, яка має юридичне право та реальні важелі відсторонити СЕО та співзасновника від управління в разі його неефективності чи марнотратства.

Чи намагаюсь я особисто в чомусь звинуватити Дорсі? Абсолютно ні.

Немає сенсу спекулювати, наскільки щирими є його медитації, підтримка опенсорсу чи благодійність. Збоку виглядає так, що це не порожній імідж, а його реальна життєва філософія, яка заслуговує на повагу.

Але справа зовсім в іншому. Коли він сідає в крісло СЕО публічної компанії, ця філософія відходить на другий план. У цьому кріслі він змушений робити не те, що «хоче» як засновник, а те, чого жорстко вимагає обов’язок перед акціонерами.

Його аура «візіонера» дійсно дає йому трохи більше простору для маневру і дозволяє легше продавати ринку непопулярні рішення. Проте вона жодним чином не скасовує базового правила великого бізнесу: СЕО завжди підкоряється волі інвесторів та Ради директорів. Нічого особистого, просто корпоративна механіка.

він може половину народу звільнити і ніхто ні в чому його винити не буде. Йому не треба щоб акції росли 20% за день. Це ніяк суттєво не змінить його положення в компанії і його статки. Єдиний головняк для нього це крипта і стейблкойни.

ти йому коханка чи мама? звідкіля знаєш?

ну про побудований бiзнес можна погодитись, а

практикує медитації, мінімалістичний стиль життя

до чого?

практикує медитації, мінімалістичний стиль життя

бо сидіти з заплюснутими очима і спостерігати за своїм брєдогенератором у голові та не покупати собі нічого, бо впадло це все менеджети — це іпать яке досягнення для сучасної людини і про це навіть тренінги роблять і воркшопи всілякі

Ну вродi як медитації допомагають творожним людям меньше творожитись, а iншим воно не дуже заходить

та ні, я ж не проти. для деяких кейсів медитація гарна штука, та і взагалі. просто казати, що чувак крут тому що практикує медитації це десь теж саме, що казати — він крут, тому що п’є стакан води після пробудження

він крут, тому що п’є стакан води після пробудження

а що не так із водою після пробудження? я завжди ставлю воду коло ліжка, взагалі не можут спати без води, а якщо я «вживав напої» увечорі то ставлю графін. звичка іще з нульових, але то правда більше після пянок зявилось але потім звик до того що вода післа пробудження то класно, а от коли залатав вихлопну трубу і кожен запор то жесть яка то споживання потрібної кількості води(на добу) то взагалі маст хев.

ну і що це таке досягнення для тебе, чи шо? мова ж іде про ствердження форумного Трампа, що чувак крут, бо в нього умовний завод-параход-бізнес, а ще він практикує медитації.

практикування медитації як і стакан води після пробудження — це не ті досягнення, про які буде розповідати людина у здоровому глузді

Завжди можна стати консультантом і продавати антіпатерн ШІ трансформації

Виталий, честно, это — жалко

Завжди можна стати консультантом і продавати антіпатерн ШІ трансформації — як я описував в байці про один банк.

Там конкуренція...

Цікава новина dou.ua/forums/topic/58096
Талеб доволі розумна людина особливо якщо не дивитись на його тексти та тези як на пророцтва, а скоріше як на системний аналіз. І зі своєї перспективи він бачить загрозу великої кризи через ринкову ситуацію навколо ШІ. І деякі факти в цій статті як от випуск Гугл облігацій зі строком повернення грошей в 100 років — це ознаки небезпеки. Такі цінні бумаги — нетипові і дуже специфічні. Бо горизонт інвестування все таки спрямований на повернення в межах життя людини. Мало хто на ринку готовий інвестувати в щось що себе окупить — аж після того, коли все поточне керівництво інвестора помре. І чи не є це своєрідним прогнозом від Гугл — що треба 100 років щоб у цього теку було РОІ?
І він «красунчик» в цьому прогнозі бо робить фактично прогноз в обидві сторони, загроза ІТ ринку якщо тек вистрелить, бо це драматичний зсув, а також загроза того що тек не вистрелить — при тому що інвестицій в нього «закачано» вкрай багато. Обидва сценарії реальні. Обидва — кризові.

Тобто Віталій не тільки в ШІ сфері поверхнево плаває но і в інвест сфері.

Гугловські бонди йдуть з купоном 6.125%. Не треба чекати 100 років щоб вернути гроші, достатньо 15. Через 100 років ROI буде порядку 600% + тіло.

Іншими словами, такі бонди купують ті, кому треба гарантовані 6% річних — фонди, пасивні, консервативні інвестори. Можна 40 річні бонди купити, но там дохідність 5%.

Не говорячи вже про те, що бонди торгуються, як акції, можеш в будь-який момент вийти і забрати тіло.

Дякую за лікбез з базової математики купонних облігацій. Ви абсолютно праві щодо механіки виплат і можливості перепродажу на вторинному ринку. Але ви розглядаєте цей інструмент виключно з позиції фінансового вакууму і випускаєте з уваги два фундаментальні фактори.

По-перше, ви зручно оминули поняття дюрації (duration risk). 100-річні бонди є екстремально чутливими до зміни макроекономічних умов та відсоткових ставок. Якщо ставки ростуть, ринкова ціна такої облігації стрімко летить у прірву. Запитайте інвесторів, які купували 100-річні бонди Австрії, як безпечно можна «вийти в будь-який момент» без катастрофічної втрати тіла інвестиції. Це далеко не безризикова гавань для «консервативних» грошей.

По-друге, і це ключове для нашої дискусії про ШІ: справа не в тому, як саме інвестор отримує свої 6%. Справа в тому, чому ІТ-гіганту, який історично генерує колосальний вільний грошовий потік, раптом знадобилося фінансування з горизонтом повернення тіла боргу через століття.

Історично такі інструменти використовували залізниці, університети або держави для побудови фундаментальної інфраструктури, яка окупається поколіннями. Те, що бігтех змушений залучати такий капітал, лише підтверджує мою тезу: ШІ — це вже не високомаржинальний софт. Це надважка, капіталомістка інфраструктура з астрономічними витратами (Capex) на чипи, енергетику та дата-центри.

Вендори беруть у борг як будівельники трансконтинентальних магістралей. І системний ризик, на який натякає Талеб, полягає саме в цьому розриві: інфраструктуру будують за космічні гроші просто зараз, але чи зійдеться економіка кінцевих ШІ-продуктів — досі невідомо. Якщо масовий ринок зіткнеться з тим самим від’ємним ROI та зростанням TCO при впровадженні ШІ у свої процеси, попит на ці «магістралі» не виправдає вкладень. І тоді ми отримаємо класичну грандіозну кризу перевиробництва, попри всі купонні виплати.

Давайте без складної математики, подивимось на ваш розрахунок суто з позиції ризиків.

Ви рахуєте лінійно: 16 років по 6% — це номінальний вихід в нуль. Але 16 років тому верхом технологій був iPhone 4. Тобто навіть в ідеальних умовах інвестор морозить капітал на цілу епоху просто щоб відбити своє.

А в реальності ці 16 років легко перетворюються на проблему через три сценарії:

1. Інфляція. За 16 років долар відчутно втратить купівельну спроможність. Реальний вихід в нуль по цінності грошей — це 25-30 років.
2. Пастка «забрати тіло». Гугл поверне номінал лише через 100 років. Якщо виходити раніше, треба продавати бонд на біржі. 100-річні папери екстремально чутливі до ставок. Якщо ставка ФРС виросте хоча б на 2-3%, ринкова ціна бонда обвалиться десь на 50%. Щоб просто перекрити цей капітальний збиток купонами, доведеться чекати 8 років. А щоб почати отримувати реальний прибуток — усі 24 роки. І ми тут навіть не враховували інфляцію(яка в цьому сценарії очевидно є і збільшує термін повернення вкладеного додатково, а сама інфляція в таких умовах — буде значно більшою ніж «звичайна»).
3. Знецінення ШІ. Гугл бере ці борги під гігантські дата-центри. Якщо ШІ швидко стане дешевим масовим товаром (через опенсорс моделі, або будь які інші фактори які на горизонті 25-30 років, з урахуванням «середньої інфляції» передбачити неможливо), надприбутків не буде. Це вдарить по компанії, і ціна бондів на вторинному ринку полетить у прірву.

І описане — не всі сценарії і навіть не самі «погані», а доволі консервативні.

Тому 100-річні бонди в ІТ — це не тиха гавань для консерваторів. Це вкрай агресивна ставка на те, що економіка ШІ працюватиме ідеально і без криз наступні кілька десятиліть.

Саме про цю системну крихкість і каже Талеб.

Віталя, до чого тут взагалі ШІ? Бонди це і в Африці бонди. Це популярний інвестиційний інструмент який використовується сотню років. Фонди і люди використовують їх як хедж від інфляції (щоб просто зберегти гроші), плюс деякі фонди зобов’язані мати певну частку портфоліо в бондах. Ті, хто купує бонди, у них немає цілі заробити, для цього є індекс, акції.

І вот 6% це доволі жирний купон, позволить не тільки зберегти гроші но і чуть заробити. Це краще ніж депозит тримати. Тому бажаючих купити було в 7 раз більше ніж гугл зарелізив.

Я не сперечаюсь з Талебом, і не сперечаюсь з гуглом. Я сперечаюсь з твоєю фін. безграмотністю.

Я навів вам конкретні розрахунки щодо ризику дюрації, впливу інфляції та втрат на вторинному ринку, які наочно демонструють хибність ваших тез про «гарантоване повернення за 16 років» та неможливість безпечно «вийти в будь-який момент» із 100-річних паперів.

Замість того, щоб конструктивно відповісти на ці макроекономічні аргументи, ви вирішили просто їх проігнорувати і знову перейти на особистості та емоційні оцінки.

Дискусія має сенс лише тоді, коли сторони аналізують аргументи та цифри одне одного, а не намагаються самоствердитися через образи. Тому подальше спілкування в такому форматі не має жодного сенсу. Цю гілку розмови я для себе закриваю. Бажаю успіхів.

В чому хибнисть моїх тез? Якщо ти веладвєш 100к в бонди гугла, ти їх гарантовано назад отримуєш через 15 років (а не через 100 років як ти намагався довести своєю математикою). Отримуєш навіть якщо гугл збанкрутує. Скільки будуть коштувати ці 100к через 15 років — це вже інше питання, на яке ти намагаєшся плавно зіскочити так як з першим питанням облажався.

Ще незрозуміло чому сюди ШІ приплів. Гугл просто потратив віжесь вільний кеш на capex і підняв додаткові гроші легким шляхом.

Ну а криза буде, через те, що безробіття виросте до 10+ відсотків і люди не зможуть виплачувати кредити, що потягне за собою інші сфери де влив ШІ не такий великий.

Ще один приклад складного розвитку подій, пов’язаного із закріпленням цієї технології на ринку. Цитую допис щодо нещодавньої ситуації навколо використання даних для тренування моделей:

> 𝐊𝐚𝐫𝐦𝐚 𝐢𝐬 𝐚 𝐛*𝐭𝐜𝐡
>
> So Anthropic has just announced that other labs (DeepSeek AI, Moonshot AI and MiniMax) have allegedly been using Claude to train their own models — 24,000 fake accounts, 16 million exchanges. And now it’s outraged.
>
> Rich coming from the company embroiled in a landmark copyright case over training its own model on millions of pirated books. A case that it has agreed to settle, subject to final court approval in April, by paying $1.5bn to the authors (Bartz v Anthropic).
>
> When it’s your novels, your articles, your translations being scraped without consent, Anthropic argues that’s ‘fair use’ and ‘innovation’.
>
> When it’s Anthropic’s outputs being scraped, it’s suddenly ‘fraud’, ‘abuse’ and ‘industrial-scale distillation attacks’.
>
> Reap what you sow. AI edition.

Лінк на оригінал посту: www.linkedin.com/...​-7431800655037689856-WIIh

Формування такого статус-кво навколо LLM створює суттєвий дисбаланс у сфері управління інтелектуальною власністю. Компанії, що розробляють моделі, фактично перетворюються на централізовані хаби акумуляції знань. При цьому поточна парадигма дозволяє комерціалізувати масиви даних без збереження інформації про першоджерела та без дієвих механізмів компенсації авторам.

У класичній моделі розробки завжди зберігався інститут атрибуції. Навіть коли open-source проєкти використовувалися в комерційних цілях без належних виплат роялті, будь-який код мав історичний слід і технічну прив’язку до розробника — через профіль на StackOverflow чи історію комітів у репозиторії. Авторство залишалося прозорим і забезпечувало професійну репутацію.

Масове впровадження LLM розриває цей ланцюжок. Модель видає результат, синтезований на базі праці тисяч інженерів, але остаточно втрачає зв’язок з оригінальними авторами. У довгостроковій перспективі це створює ризик демотивації контриб’юторів, що може негативно вплинути на всю екосистему відкритого програмного забезпечення та обміну знаннями в індустрії. Ознаки чого ми вже бачимо в тому числі і на прикладі падіння контриб’юції і на StackOverflow.

Ну... я подивився, щось запамʼятав, а потім просто використав але навіть не памʼятаю де я це побачив. Тут різниці ніякої немає з людьми.

Згоден з вами, що проблема визнання авторства в open-source існувала завжди. Але порівнювати людину і ЛЛМ у цьому контексті — це фундаментальна помилка масштабу та механіки екосистеми.

Коли людина шукає і бере чужий код, вона все одно взаємодіє з інфраструктурою. Вона залишає слід: перегляди, завантаження, зірки на GitHub, питання в issues. Ця статистика створювала для авторів проєкту реальний капітал. Маючи великі цифри, розробники могли шукати інвесторів, отримувати гранти або використовувати це як залізобетонне портфоліо при побудові кар’єри.

Більше того, є безліч кейсів, коли бізнеси, які роками безкоштовно використовували open-source рішення, згодом приходили до його авторів за платною експертизою, допомогою в масштабуванні або взагалі купували ці команди з технічних чи юридичних причин. Тобто соціально-економічний ліфт працював. Механізм не був ідеальним, але він існував, підтримував баланс і мотивував людей писати та викладати елегантний код.

Що робить ЛЛМ? Вона відчужує код індустріальними масштабами і розриває цей ланцюжок назавжди. Коли ви отримуєте згенерований сніпет, оригінальний автор не отримує нічого: ні статистики використання, ні зірочки в репозиторій, ні шансу на те, що ви колись станете його клієнтом чи роботодавцем.

ЛЛМ не «вчиться як людина», вона працює як проксі-сервер, який приховує авторів і привласнює собі їхній репутаційний та економічний потенціал. Знищення цього мінімального зворотного зв’язку — це прямий шлях до вимирання open-source контриб’юції як явища.

Можливо якщо розробники ЛЛМ почнуть платити авторам коду роялті(бо якщо ви навчаєте модель на опен сорс коді, а потім продаєте токени, то це фактично комерційне використання опер сорс продукту і в багатьох випадках — порушення ліцензії), або хоча б модель в вагомих випадках буде вказувати авторство — то це хоча б збереже поточний рівень «балансу» між бізнесом та опен-сорсом. Але сьогодні я не бачу суттєвих спроб рухати технологію в цей бік, або вирішити цю проблему якось інакше.

бо якщо ви навчаєте модель на опен сорс коді, а потім продаєте токени, то це фактично комерційне використання опер сорс продукту

а когда ты изучал open source репо, чтобы научиться программированию, а потом эти свои знания менял на зарплату — это не было

фактично комерційне використання опер сорс продукту

?

Знову ж таки, тут є велика різниця в механіці та масштабі.

Коли людина вчиться на чужому коді, вона засвоює концепції. Але її взаємодія з екосистемою неминуче створює органічну конверсію для авторів: трафік на репозиторій, зірки, форки та багрепорти. ЛЛМ працює інакше — вона акумулює цей досвід для надання централізованої послуги, але без зворотного зв’язку з авторами оригінальних рішень.

Моя приватна позиція завжди базувалась на інтелектуальній чесності: використовуєш опенсорс — дотримуйся ліцензії, вказуй авторство, підтримай проєкт чим можеш.

Звісно, ми не можемо ідеально проконтролювати доброчесність кожного окремого інженера на планеті. Але розробники великих ШІ-платформ мають унікальну перевагу: вони керують централізованими інфраструктурами. Це дає їм можливість стати архітекторами нового балансу в індустрії. Технічно та фінансово цілком можливо реалізувати механізми атрибуції або програми системної підтримки опенсорс-спільноти (наприклад, через фонди роялті від комерційних підписок). Це складна інженерна та бізнесова задача, але вона вирішувана. Сподіваюсь, у міру дорослішання ринку, фокус вендорів розшириться від гонки масштабування моделей до забезпечення сталого розвитку екосистеми, на якій ці моделі побудовані.

ЛЛМ працює інакше — вона акумулює цей досвід для надання централізованої послуги, але без зворотного зв’язку з авторами оригінальних рішень

звучит так, будто LLM — это какой-то новоявленный актор в экосистеме, который действует самостоятельно, но это не так. повторюсь, не нужно наделять AI coding агентов субъектностью. как раньше экосистему составляли и развивали конкретные люди-билдеры, так и сейчас ее развивают те же люди, только быстрее, потому что LLM предоставляет услугу билдерам, а не конечному потребителю (если мы про кодирование). басни про то, что «теперь любой CCO себе сам завайбкодит CRM» оставим обывателям.

в реальности, лично я вижу в последние месяцы настоящий взрыв нового опен-сорс софта и дискуссий в экосистеме Typescript, за которой я наблюдаю. билдеры получили мощнейший инструмент и контрибьютят в бОльших масштабах, постоянно взаимодействуя друг с другом в X/Reddit/Github. кстати, сегодня X забанил в API функцию reply на твит. резко лента стала чище))

вот сегодняшний пример: Cloudflare за неделю реализовали функционал Next.js, потратив $1100 на токены. понятно, что громкий заголовок и тд, тем не менее, там куча интересных архитектурных решений от инженеров Cloudflare, определенная практическая ценность и все в опен-сорсе.

поэтому я считаю, что отрасль и всех участников отрасли ждут большие перемены, к этому надо быть готовым. но в целом я настроен очень позитивно.

P.S. есть такая идиома про тех, у кого стакан наполовину полон или пуст. мне кажется, Виталий, что у тебя стакан почти пустой))

Кейс Cloudflare цікавий, але він стосується корпоративного сегменту, де розробка фінансується бюджетом компанії. Фундаментальна ж екосистема відкритого коду історично тримається на незалежних мейнтейнерах та контриб’юторах, для яких репутаційна економіка є чи не єдиним драйвером.

Я не наділяю ШІ суб’єктністю. Мова йде про зміну маршрутизації в індустрії. Інструмент стає монопольним прошарком між творцем коду та його споживачем, забираючи на себе весь трафік. Зараз ринок дуже ефективно утилізує той масив відкритого коду, який спільнота накопичувала останні 20 років. Питання полягає виключно в тому, за рахунок яких стимулів цей фундамент буде якісно оновлюватися в майбутньому, коли механізм атрибуції зникне остаточно.

Щодо метафори зі склянкою: в управлінні делівері, ризиками та системній архітектурі немає понять оптимізму чи песимізму. Є аналіз довгострокової стійкості системи (sustainability). Тому я дивлюсь часто на такі речі саме через цю призму — прораховувати структурні вразливості процесів на роки вперед, а не радіти поточному рівню води.

При цьому повторю — персонально я від ЛЛМ як технології і від її перспектив у захваті. Але технологічний ентузіазм не повинен вимикати інженерний прагматизм. Постійно ходити в рожевих окулярах — шкідливо «для зору» не менш ніж бачити тільки пустий стакан. Потрібен баланс — в тому числі і публічні дискусії, бо вони формують ставлення професійної спільноти до проблеми. А ставлення спільноти у вигляді масштабного діалогу — це саме той рушій, який і формує майбутнє, в якому ми всі опинимось.

У мене немає ілюзій щодо того, що бігтех прочитає ізольовану гілку на DOU і змінить стратегію. Але це частина ширшої професійної дискусії. І такі дискусії, набуваючи масовості, точно впливають на рішення вендорів щодо розвитку продуктів. Не тому, що вендори когось «бояться», а тому, що це формує ринковий попит. Якщо буде масовий запит на механізми атрибуції навколо ЛЛМ (не кажучи вже про роялті), вендор буде змушений на нього відповісти. Суто з бізнес-міркувань, загорнувши це в обгортку «відповідального ШІ» (Responsible AI). Розмови про це вже ведуться, і я бачу цей тренд усе чіткіше, наприклад, з боку того ж Microsoft.

І ще, може скластися враження по коментарям останнім що я якось проти антропіка виступаю. Це теж не так — просто моя бульбашка, особливо в лінкедін чомусь мені ілюстративні кейси приносить саме про антропік. Загалом же я думаю всі великі вендори ллм наразі в контексті «відповідального ШІ» мають великий простір для вдосконалення своїх стратегій. І безумовно будуть це робити — якщо буде попит або регулятори «змусять».

це прямий шлях до вимирання open-source контриб’юції як явища.

З якого такого переляку?

З дуже прагматичної причини: опенсорс тримається не лише на ентузіазмі, а на економіці репутації.

Зірки на GitHub, трафік, згадки в індустрії — це реальне портфоліо. Воно приносить авторам оффери, контракти та корпоративні донати. ШІ-інструменти об’єктивно змінюють цей баланс, роблячи розробника невидимим. Коли модель зручно видає ваш код у чиємусь редакторі, ви як автор не отримуєте ні визнання, ні фідбеку, ні шансу на монетизацію.

На самому лише альтруїзмі можна написати класний реліз 1.0. Але роками безкоштовно тягнути нудну рутину і фіксити баги (згадайте важкі історії підтримки Log4j чи core-js) без будь-якої віддачі — стає просто невигідно. Якщо зникає видимість, поступово зникає і головний стимул розвивати відкритий код далі.

Я не кажу цим що всі автори опенсорсу меркантильні — це далеко не так. В першу чергу це про любов та ідеі. Але — поруч з цим живе для таких авторів і можливість перейти від ентузіазму до бізнесу. ЛЛМ цю можливість, як здається сьогодні — знищує цілком.

Воно приносить авторам оффери, контракти та корпоративні донати.

Я думав, що реальна користь продуктів це все приносить... А тут виявляється достатньо зірочок на гітхабі назбирати...

Справа не в самих «зірочках». Зірки, форки та issues — це лише метрики, які показували реальну користь продукту для спільноти.

До появи ШІ-асистентів екосистема мала зрозумілий механізм маршрутизації уваги та зворотного зв’язку. Якщо ви вирішили складну проблему і виклали код, люди знаходили його через пошук. Вони приходили у ваш репозиторій, використовували код, відкривали PR чи issues. Цей цикл давав авторам найголовніше — розуміння власної корисності та визнання. А вже це визнання, за бажання автора, могло конвертуватися в інвестиції, кар’єрні пропозиції чи контракти.

Масове використання LLM змінює цей маршрут на структурному рівні. Уявіть, що ви сьогодні створили цікавий концепт і виклали його у відкритий доступ. Ймовірність, що інший розробник знайде саме ваш репозиторій, знижується, бо йому швидше і простіше отримати відповідь від свого ШІ-асистента.

З часом ваш код стає частиною навчальної вибірки для наступних ітерацій моделей. І хоча ваш підхід може стати в нагоді тисячам розробників, цей процес відбувається знеособлено. Ви як автор втрачаєте видимість: не отримуєте фідбеку, не бачите реальної цінності вашого рішення для індустрії, а зв’язок між творцем та користувачем розривається. При цьому ваша ідея та реалізація — можуть бути «продані» за токени десяткам або сотням тисяч розробників — але ні ви про це не дізнаєтесь, ні вони не дізнаються про вас, та ваш опенсорс проект.

Саме через ці структурні зміни в дистрибуції ПЗ (спричинені як розвитком хмарних платформ, так і ШІ) індустрія зараз активно шукає нові формати балансу. Ми бачимо тенденцію переходу великих проєктів від класичних відкритих ліцензій до нових моделей:
1. HashiCorp (Terraform) перейшли на BSL (Business Source License).
2. Redis змінили ліцензування на RSALv2 та SSPL.
3. Elastic, Sentry, MongoDB також адаптували свої ліцензії для контролю над масштабним комерційним використанням їхнього коду як сервісу.
4. З’являються ініціативи на кшталт RAIL (Responsible AI Licenses), які намагаються врегулювати правила використання відкритого коду саме для тренування ШІ.

Тому моя теза — не про меркантильність розробників і не про звинувачення вендорів. Вона про об’єктивний ризик для сталості екосистеми, яка історично трималася на прозорій атрибуції та соціальному капіталі своїх контриб’юторів.

це лише метрики, які показували реальну користь продукту для спільноти.

Умовну користь. Тому що реальна користь була в бізенсі, в імплементації, а не в зірочках. Донати не залежать від зірочок.

Ну... важко обговорювати, коли не задані умови. Я взагалі більше мав на увазі навіть проприєтарний код, з яким я працював. Якщо брати OpenSource, то зазвичай просто шукають те, що тобі треба. Принаймні це дешевше. Наприклад, я шукав емулятор терміналу на Python, знайшов його, мене задовільнило. Знайшов також проблему, створив issue, сам створив патч, контрибʼютив. Це типовий сценарій, а не шукати щось... І як тут допоможе LLM? Написати власний аналог pyte? Принаймі дорого. Допоможе у написанні фіксу? То це як раз те що треба!

А LLM забирає паттерни написання коду, це дрібниці, це те що є в головах також.

Пішло перевзування ©

а если серьезно, то автор соврал вот здесь This isn’t bear porn, пишет свою фантастику чисто под американцев с их фетишем на рабочие места, 10 раз написал про них

Я за себе не переживаю, я піду після того як попруть ШІ дисидентів.

Єдине про що шкодую що не можу ситуацію використати, всі самі смачні ШІ компанії приватні і недоступні рітейлу типу мене, залишаються лише гіганти типу гугла і мети де апсайду не так вже й багато. А опенаі, антропік, з тих пір як я за них топив, виросли в 10 раз. Вот і виходить незручна ситуація, що виявився правий, но бенефетів від цього багато не отримав.

А опенаі, антропік, з тих пір як я за них топив, виросли в 10 раз. Вот і виходить незручна ситуація, що виявився правий, но бенефетів від цього багато не отримав.

если считаешь что хорошо угадываешь про ии, то вот твой шанс polymarket.com/en/predictions/ai

Нє, я в такі тоталізатори не граю, тикати пальцем в небо яка модель в кінці якого місяця буде в топі якогось бенчмарка.

Автор будує цікавий мисленнєвий експеримент, але він спирається на дуже радикальний фрейм «максимального ROI», який поки існує виключно в маркетингових матеріалах вендорів. Багато тез тут відверто «натягнуті на глобус».

Головна логічна прогалина статті: автор ототожнює здатність ШІ швидко згенерувати код (MVP) зі здатністю компанії замінити повноцінний B2B продукт. Написати клон умовного Salesforce за тиждень — це лише 5% роботи. Інші 95% — це пошук Product-Market Fit, побудова архітектури, забезпечення Compliance (комплаєнсу), SLA, кібербезпеки та юридичної відповідальності. ШІ не може підписати договір про відповідальність за витік даних. Бізнес купує SaaS саме заради передачі ризиків, а не просто заради коду.

Якщо ж ми приймаємо утопічний сценарій автора — що ШІ стає настільки безпомилковим, що йому можна делегувати повну відповідальність за середню і нижню ланки (без нагляду), — то логіка руйнується. Якщо система стабільно працює автономно на цих рівнях, то вона так само легко замінить і С-level, і інвесторів. Економіка в такому вигляді просто перестане потребувати людей як агентів прийняття рішень взагалі. Це вже чистий сюжет роману «Ачелерандо» (Accelerando) Чарльза Стросса, де надефективні ШІ-корпорації розібрали планети на ресурси для обчислень, а залишки людства змушені були тікати з Сонячної системи, оцифрувавши свої свідомості на зореліт розміром з банку кока-коли. Це чудова наукова фантастика, але точно не економічний прогноз на 2028 рік.

Реальність, мені здається, буде іншою. При такому радикальному здешевленні генерації коду («вайбкодінгу»), навички простого написання коду дійсно будуть коштувати копійки. Але на вагу золота будуть «технобізнесмени» та системні архітектори — люди, які здатні інтегрувати ці стохастичні (ймовірнісні) моделі у жорсткі, надійні бізнес-процеси, нести фінансові ризики та виводити продукти на ринок. ШІ може згенерувати ймовірність успіху, але відповідальність завжди залишається за людиною.

вже боятися, чи можна ще трішечки почекати?

METR опубликовал апдейт того самого исследования, которое мы тут мусолим уже без малого в тысяче постов :)

итак:
— разрабы отказывались участвовать в эксперименте, потому что не хотели писать код без AI даже за деньги
— те, кто согласились, отказывались от сабмита некоторых задач, которые не хотели делать без AI
— сырые результаты показали, что у оригинальных участников ускорение примерно 18%, у новых участников — 4%.

но по мнению организаторов, это говорит о том, что полученные оценки эффективности, скорее всего, сильно занижены — девелоперы просто отказывались за $50 в час работать без AI. считаю, что для следующего исследования подопытных нужно искать на ДОУ — тут полно «старокодящих», да еще за такой рейт в очередь выстроятся))

и да, Claude Code уже сделал 4% коммитов в GitHub.

Це не апдейт того самого дослідження, це новий раунд того самого дослідження, щоб подивитись в динаміці. З вашої подачі складається враження, ніби вони перевернули оцінки попереднього дослідження — але це не так.

METR previously published a paper... using data from February to June 2025.
... we started a new experiment in August 2025...

І вони не кажуть

что полученные оценки эффективности, скорее всего, сильно занижены

Формулювання значно обережніше — мова йде про unreliable signal через проблеми вибірки та дизайну. Сирі результати справді показують uplift (~4—18%), але з великим шумом і обмеженою узагальнюваністю.

Якщо перекласти з наукової на людську:
ефект є, але він шумний, нестабільний і сильно залежний від контексту.

До того ж я будував аргумент не на дослідженні метр виключно, а на серії різних досліджень з різних джерел і за 2 тижні перебування статті тут — знайшов ще більше джерел які тут не вказані. Загальна картина поки не змінилася. Апдейти обовʼязково попадуть в репо. Та якщо, дані доступних досліджень та індустріальних звітів будуть показувати за часом іншу картину — то про це обовʼязково теж напишу. Тобто моя мета — взагалі не в тому щоб щось спростувати або довести. А щоб
1. Структурувати та систематизувати що відомо, окрім маркетингу про ефект від ШІ на індустрію.
2. На підставі даних, а не марткетингу, побудувати тренд — зрозуміти де ми зараз та куди йдемо.
3. Створити та поліпшити на підставі цього розуміння — рецепти та протоколи по яким з цим працювати умовно безпечно.
4. Та в ідеалі скласти ці протоколи в фреймворк безпечного та корисного використання ШІ код асистентів — для будь якого проекту та команди.

Тобто по суті — як раз допомогти з ШІ адаптацією. Тільки виходячи саме з ризик менеджменту, оцінки довгострокових ефектів, метрик які впливають на ТСО і загальний вплив на весь СДЛС.

І будь яка «робота» в такій площині, це завжди спроби побудувати розуміння як воно загалом працює при постійному браку даних. Тобто можно не тільки «помилятись» в контексті того що ситуація змінилась і дослідження застарілі — а навіть помилятись тут і зараз будуючи тренд. Бо неможливо зняти всі метрики з усієї індустрії — оперуємо тільки клаптиками доступних досліджень а вони показують тільки фрагменти. Це нормальне явище. І тому — в тому числі потрібна дискусія в професійній спільноті, публічна та відкрита.

Я підозрюю, що в короткій перспективі ми навряд чи побачимо радикально ясні сигнали.

Навколо теми зараз занадто багато хайпу, а в таких умовах будь-які вимірювання неминуче отримують підвищений шум:
— селекційні ефекти
— self-report bias
— швидка еволюція інструментів між раундами замірів

Тому поточна неоднорідність результатів мене, чесно кажучи, не дивує.

Мене теж, тому і стало цікаво займатися цим проєктом. Щоб скласти все до купи. Бо поки загальна картина не зрозуміла — це високі ризики та цікава тема для дослідження.
Тобто я сам хочу сприймати це все як тимчасові негаразди «кривої адаптації» — але що як ця крива 30 років і в реальності іі «не переживе» майже ніхто? Або хайп продавить логіку і небезпечне використання теку прийде в банкінг, критичні інфраструктурні проекти і т.п.? Хочеться вірити — що цього не буде бо на великих і важливих посадах — завжди тільки самі розумні люди. Але мені здається — історія, навіть наша сучасна, нас вчить — що це далеко не завжди так.

апдейт в том смысле, что новые итоги в рамках общей цели исследования. там и в url есть слово update. согласен, неточно выразился.

ефект є, але він шумний, нестабільний і сильно залежний від контексту.

безусловно, но организаторы еще упоминают, что

we are systematically missing tasks which have high expected uplift from AI

т.е. результаты могли бы быть выше, но это неточно)

апдейт в том смысле, что новые итоги в рамках общей цели исследования.

Я насправді так і подумав — тут без жартів, і без долі іронії. Просто вирішив уточнити, бо зі сторони ваша теза швидше читається як «переробили результати попереднього».

ты как будто бы сопротивляешься фактам. я сам писал про их ранний репорт про отрицательное влияние. на сейчас оно нейтральное (+4% это погрешность). те кто возился с этим год получили +20% сверху. к сожалению, эти 20% не говорят ни о чем из-за того что эти люди как-то развивались год и группа не полная, возможно отпали как раз те, кто тянул график вниз и у группы сейчас бы был тот же нейтральный результат. ровно как и в другую сторону, могли отпасть те кто тянул график вверх. более того группа очень малочисленная. единственное что можно точно сказать что −19% стало +4%. это все еще негативный результат т.к. профита фактически нет, а расходы выросли. но в рамках подхода результат отличный +20%. если через год проведут исследование снова и 2я группа не будет сильно сокращена и покажет +20%, то будет очевидно что 20% в год ожидаемый рост. но так как 1я группа не дает никакой инфы уже сейчас, то через год мы не сможем узнать остались они на своих 20% или выросли. хотя через год-два может оказаться что эти исследования больше не нужны и все видно и так

на сейчас можно точно сказать что этот подход не вредит производительности, но и скорее всего не окупается. чисто теоретически можно представить что +20% в год реальны и посчитать теоретическую окупаемость, но это вилами по воде

скорее всего не окупается

вот это самый большой открытый вопрос, да. пишут, что сам инференс вроде как вполне прибыльный, но все портят огромные расходы на RnD. посмотрим, куда все это придет, на какой точке рынок сбалансируется. но наша отрасль изменится неузнаваемо и простая интуциия говорит о том, что скорее всего, наиболее передовые и денежные проекты будут решаться с участием AI, а вот многим аутсорсерам возможно придется конкурировать в цене уже не с индусами, а с инференсом.

Claude Code уже сделал 4% коммитов в GitHub

Має бути більше. Бо я так розумію вони міряли за підписами коммітів.
А я знаю доволі мало людей, хто прямо дає вказівку свої «підлеглим» ставити в commiter та author {agent} {model} <noreply@anthropic|openai|whatever.com>. Я своїх сконфігурував робити так мабуть на 2-му місяці пляски з ними.

подопытных нужно искать на ДОУ

Невже ти не бачиш bias?

разрабы отказывались участвовать в эксперименте

Наркотична залежність вона так...

Хто мав досвід ШІ-розробки в команді? Чи не перетворюється це на п****ць з перелопачування мегабайтів чужих промптів, в яких навіть автор нічого вже не може зрозуміти? Чи не перетворються промпти на подобу юридичного сленгу, з купою надлишковості для усунення неоднозначності?

Як швидко зростає обʼєм промптів для великого проекту? Наскільки легко онбордити нових людей на великі AI-first проекти?

— разработка в команде ведется точно так же
— используй Claude Code как индивидуальный инструмент
— помни, что автором пулл реквеста являешься ты, а не Claude Code
— рассматривай Claude Code, как своего персонального джуна-помощника: ставь задачу и контролируй исполнение
— «качественно поставленный вопрос — половина решения». то же самое справедливо для coding ассистента. учитесь делегировать.
— всегда начинай с планирования, иди короткими итерациями
— дай доступные инструменты: доступ на чтение в DB, доступ к логам, MCP сервер с документацией по пакетам, скрипты для запуска дев environment. все то, что ты даешь джуну, чтобы он выполнил поставленную тобой задачу
— не держите сведения о проекте в голове — выгружайте в спеки. в этом тоже поможет Claude Code
— адаптируйте Claude Code итеративно

пара хороших ссылок:
boristane.com/...​og/how-i-use-claude-code — автор — тех лид в Cloudflare
openai.com/...​ndex/harness-engineering — командный guide от OpenAI

Це добре для того, щоб назначити винуватого. Але це провокую людей більше помилятися. Часто якісніше зроюити самому, ніж ставити задачу а потім контролювати виконання.

Часто якісніше зроюити самому, ніж ставити задачу а потім контролювати виконання

красноречивая цитата. значит, ты не умеешь делегировать, работать с джунами. декомпозировать задачу, давать контекст, поле для деятельности, итерировать. тебе проще самому. но подход: «поставил задачу — проверил исполнение — результат не устроил — проще было самому» — одинаково провальный как в работе с людьми, так и с AI.

учитывая, что навык делегирования является базовым для Senior (сам тайтл говорящий), то твой уровень — это крепкий middle, скорее всего сильный технически, но без умения эффективно работать с людьми.

значит, ты не умеешь делегировать, работать с джунами

По правді кажучи, останні 10 років я не бачив джунів на проектах, де працював :-) Але знову, це не писав «простіше», я писав «якісніше». Звісно що простіше дегелувати та не перевіряти.

Дякую за відповідь, це очевидно, якщо використовувати ЛЛМ як заміну написання коду руками.

Більш цікавить, чи хтось працював в «компаніях майбутнього», які малюють нам ЛЛМ-євангелісти, де «ЛЛМ-оператор» оркеструє сотні десятки агентів і закриває десятки фіч за години.

Бо поки індустрія «іспользуєт Claude Code как индивидуальный инструмент», не буде зсуву парадігми, навіть не буде стабільного покращення перформансу. Буде (може бути) швидке прототипування нових фіч ціною ускладнення підтримки та модифікації. Ніякого перенесення експертизи на бік ЛЛМ не відбудеться.

І мені цікаво, чи хтось має досвід specification-first розробки, бажано командної?

І мені цікаво, чи хтось має досвід specification-first розробки, бажано командної?

я слышал истории, как один человек оркестрирует десятки агентов, но у меня все же здоровый скепсис.

насколько я понимаю, скорость шиппинга при оркестрировании большого количества агентов достигается за счет выстроенного пайплайна и максимального устранения человека из процесса ревью. т.е. код пишет один агент, ревью проводит другой, комбинация из агентов, прогоняются тесты и, если все ок, то код считается готовым. ручной ревью делается, но не всегда/редко. попросту формируются guardrails из спек, тестов, линтеров, ревьюеров и если код прошел эти проверки, значит, он достаточного качества и нет смысла проверять каждую строчку.

полагаю, что такой командный опыт есть у компаний, которые работают на фронтире AI-powered разработки, те же Антропики с OpenAI. собственно, они и делятся своим опытом понемногу. думаю, со временем и мы адаптируемся, но пока я смотрю на Claude Code как на индивидуальный инструмент, который и в таком качестве бустит перформанс сильно. у меня нет такого выстроенного полностью пайплайна, только отдельные элементы и я поэтрому делаю ревью своего кода.

от себя скажу, что максимум, что я себе позволяю — пилить три фичи одновременно на одном проекте. далее уже происходит расфокус. это мой личный опыт. посмотрим, как будет дело развиваться дальше.

ручной ревью делается, но не всегда/редко.

У своєму пайплайні я прийшов до висновку, що рев’ю має більше сенсу робити не на рівні окремих змін у коді, а на рівні інваріантів системи після застосування 1..n work packages.

Я з перемінним успіхом рухаюся в бік aggressive automation, але швидко вперся в практичну проблему: якщо залишити класичний цикл
planning → code → test → fix → review → feedback loop,
то така автоматика за день може згенерувати рев’ю-борг на місяці вперед, та і сам пленінг від’їдає вагому частку часу.

Тому у себе я поки залишив жорсткий контроль на етапі первинного planning і фінальний QC. При цьому дивлюся вже не стільки на код, скільки на поведінку системи під навантаженням. Звідси запускаю коригуючу петлю і, за потреби, розбираю інциденти точково.

Результати поки що дуже нерівні: іноді виходить відмінно, іноді — зовсім ні.

Ви з якоюсь конкретною метою питаєте? Чи так — просто цікаво?
Я до чого — навряд ви знайдете на DOU когось саме з таким профілем. Але spec-first — не нова методологія, і по факту вона сильно перекликається з TDD, BDD, Contract-first, model-driven, codegen pipeline. А це вже розширює для вас поле пошуку. Люди з тими навичками, що ви просите — це дійсно лише на фронтірі; і я маю сумніви, що у них вже прям великий прогрес у цьому напрямку. Швидше багато команд експерементують, та «будують свої велосипеди», і дивляться хто першим зліпить щось накшталт k8s для агентів.

Просто цікаво. Не дуже віриться, що індивідуальне використання зробить прям революцію.

Чи не перетворються промпти на подобу юридичного сленгу, з купою надлишковості для усунення неоднозначності?

Це тримається в репозиторії, типу як Readme тільки для AI.

Чи не перетворюється це на п****ць з перелопачування мегабайтів чужих промптів, в яких навіть автор нічого вже не може зрозуміти?

Та мало що міняється.
Є ті ж MR, якщо хтось кидає на рев’ю АІ сміття, то після 1-2 коментів рев’ювати що кидаєш на рев’ю все стає ок)

Дуже термінове повідомлення усім вайбкодерам

www.instagram.com/reel/DVDFS9ZEkMW

А можна для дідів без інстаграму пару слів що трапилося?

Вайбкодер-євангеліст висловлює своє захоплення від налаштування ШІ-асистента

Підтверджую таким фактом: раніше я витрачав купу часу на пошук потрібної інформації щодо кодування проектів. Тепер є LLM. Але парадоксально — замість «сушити» вони додають ще більше води до моїх пошуків.
LLM не вміють спілкуватися лише ключовиками. А я б з ними залюбки тільки так і спілкувався.

Нарешті я завершив свою думку по цьому топіку.

Ми увійшли в дуже дивну еру, де код пишуть не інженери, а маркетологи.

Весь розвиток інжерерії до цього часу був під одним флагом — підвищення якості коду.

Перфокарти — початок
Асемблер — пишемо якісніше, складніше помилитися — х5 до швидкості розробки
С/Паскаль — пишемо якісніше процедурно, код можна читати людською мовою — х5 до розробки
С++/ООП — ми можемо створювати складні системи, 3 кита ООП — х3 до розробки
Java/Python/.NET — маємо автоматичне керування памятю — х3 до якісного ПЗ

----------------------
Зараз ми тут
--------‐-------------

ШІ — пише код, в кращому випадку середньої якості, в гіршому slop — +50% до швидкості, /2 до якості того коду і його розуміння девелопером.

Маркетологи хакнули інженерів.

На всіх етапах розвитку людство намагалось не тільки в рази пришвидшити розробку, але й зробити більш якісний, читаємий та зрозумілий код.

І тільки на останньому етапі, маркетологи в*бали дуже точну науку рандомним статистичним автоматом.

На рахунок ООП, C++ Java .NET не впевнений. Мова йде більше про екосистему (готові ліби) Лінус за 10 днів накидав прототип git на Сі. Щось мені здається, що Java розробник переускладнив би усе з самого початку.

это зависит только от человека, а не от языка на котором он пишет

Тоді що ми виміряємо? x3 продуктивність це про що?

не знаю что вы меряете, но не все гипотезы истинные

Так, ланцюжок від джави (чи навіть раніше від бейсіка) до ші і за ші можна розглядати на одній прямій по.. [термінологію чи площину кожен обирає свою щоб підкреслити свій ракурс розгляду] — автоматизація, спрощення, прискорення, слоп, etc.

Якщо вже говорити в термінах «хакнули», не оцінюючи вдало/невдало використання на конкретних напрямках, рівень відповідних технологій на сьогодні, і що в кінцевому випадку отримаємо, — то тоді скоріш малоб прозвучати не
М̶а̶р̶к̶е̶т̶о̶л̶о̶г̶и̶ ̶х̶а̶к̶н̶у̶л̶и̶ ̶і̶н̶ж̶е̶н̶е̶р̶і̶в̶
а, щось на зразок -
Науковці та інженери хакнули програмування, походу, зовсім не ставлячи то за мету.

Більше перевиробництва перед березневим астероїдом!

3 кита ООП — х3 до розробки

Зараз ці 3 кита рахуються оверінжінірінгом. Що сталося то? Як згадаю старі проекти коли всі дрочили на ООП і clean code, хай бог милує.

Примітиви звісно потрібні, но не те ООП і паттерни які тоді продавали

ШІ — пише код, в кращому випадку середньої якості, в гіршому slop — +50% до швидкост

В гіршому випадку середньої якості (оверінжінірінг з ооп і непотрібними абстракціями на майбутнє, все як ти любиш). В кращому... залежить від твоїх інструкцій і промтів.

Но ти том сам агентський кодинг не використовував, не створював маркдауни зі своїми правилами і вимогами, не писав скіли, не робив планування з агентом, не робив ШІ верифікацію ШІ згенерованого коду і не налаштовув цикли щоб ШІ поправляв сам себе. Для тебе ШІ, як і для половини народу тут, це в безкоштовний чатгпт промпт однострочний кинути.

В гіршому випадку середньої якості (оверінжінірінг з ооп і непотрібними абстракціями на майбутнє, все як ти любиш).

"Узнаю брата Колю"©

— Чат жипити хав ту би рич.
— Вери рич, вери рич !
— Ноу инвестментс, но инвестментс !

— Чат жипити врайт ми фейсбук.
— Но ооп, вери изли, вери изли !
— Но мистейкс, но мистейкс !!

x.com/...​tatus/2025285071540719682

Максимум половина червоної точки використовує правильно і має кратний буст продуктивності. Тому коли тут розказують про якісь дослідження на данних річної давності що продуктивність не виросла а то і впала, це нічого крім фейспалма не викликає.

Також, цей графік відповідь тим, сміявся з моїх коментарів що простір для росту ШІ компаніям ще мінімум 10х в плані ревеню, що при грос маржі 50-60% десятки мільярдів прибутку в рік що швидко позволить перекрити і відбити витрати на capex. Economy of scale.

Також, цей графік відповідь тим, сміявся з моїх коментарів що простір для росту ШІ компаніям

з твоїх коментарів сміються, бо ти настроїв агентів на пет проджекті і тепер вважаєш, що всі інші довбні

Не треба класти свої слова мені в рот. Я довбнями рахую лише тих, хто називає мене довбнем, бо їх досвід з безкоштовним чатгпт після кількох сесій гірший, ніж у мене з агентами, яких я пів року налаштовував.

для тебе усі довбні, хто не поділяє твою думку чи має якись інший досвід

В світі існують два типи думок. Його та неправильні. :D

Тут 90% мають інший досвід чи не поділяє мою думку, но «довбнями» я називаю лише кілька чоловік. Не задумувався чому? Щось в твоїй теорії не сходиться.

Не говорячи вже що довбнями я нікого не називав і на особистості не переходив, просто прямо вказував на безграмотність.

що в твоєму розуміння безграмотність. тобі десятки людей кажуть, що на реальних великих проєктах АІ робить пук среньк, а тобі все божа роса. ти просто шизонутий

От, до речі, влучний пост з LinkedIn, де людина чудово артикулює саме цю проблему. Порівнюються публічні позиції Бориса Черного (Head of Claude Code в Anthropic) та видатного математика Теренса Тао.

Statements from Boris Cherny (Anthropic):
— «Coding problem is solved, 100% of my code was made by Claude».
— On the question about frontier and where to go when code will be totally automated the answer was ... «Claude will generate ideas».
— On a question about skill atrophy his answer was ... literally nothing. He doesn’t care.

Statements from Terry Tao (Mathematician):
— Math has a future, AI is a collaborative tool that can lower the entry to the field.
— Human in the loop to filter out unviable AI-generated results. This makes sense. In math, advanced breakthroughs are based on foundational intuition. If a mathematician loses the ability to perform intermediate logical steps, they lose the capacity to conceptualize the frontier.

(Оригінал посту та роздуми автора можна почитати тут: www.linkedin.com/...​-7431202125663301632-dtGQ)

Це, на мій погляд, прекрасна ілюстрація позиціонування. Вендор взагалі не переймається такими «дрібницями», як знищення інженерного мислення на рівні цілої індустрії. Для вендора ситуація, коли через 10 років ринок перетвориться на натовп «AI code monkeys», які не здатні написати чи навіть перевірити рядок коду без спалювання токенів — абсолютно прийнятна і навіть бажана. Deskilling as a Service — target market.

Чим більше деградує інженерне ком’юніті — тим краще. Будуть ще більше токенів палити. Ось така вам візія майбутнього від представника Anthropic. Їхні ж власні дослідження (які я наводив) показують, що активне використання ШІ-асистентів зупиняє професійний розвиток людини? Їм плювати. «He doesn’t care». І чому це вигідно вендору — зрозуміло. Але чому це має бути цікаво і вигідно нам, інженерам?

Водночас погляньте на перспективу від фундаментальної науки (Теренс Тао). Там бачення зовсім інше і, як на мене, єдино правильне: ЛЛМ — це потужний інструмент і мультиплікатор. Але щоб він працював, нам, як і раніше, потрібні вкрай кваліфіковані фахівці, здатні перевіряти роботу чорної скриньки. Ми не можемо делегувати машині саме мислення. Бо як тільки ми втрачаємо здатність до проміжних логічних кроків — ми втрачаємо здатність рухати фронтир.

Чи варто тут згадувати що якщо бачення вендора реалізується то не буде у нас ніякого більше дешевого і швидкого створення додатків? Бо якщо весь ринок це AI Code monkeys то ціну токенів встановлює вендор який є монополістом — ви глобально на такому ринку без нього вже не можете створити нічого, тільки перемикнутись на закупівлю токенів конкурента

Бо якщо весь ринок це AI Code monkeys то ціну токенів встановлює вендор який є монополістом — ви глобально на такому ринку без нього вже не можете створити нічого, тільки перемикнутись на закупівлю токенів конкурента

это ты уже сгущаешь, есть куча моделей в паблике, там почти всегда отстающие модели, но в какой-то момент их возможностей будет достаточно

Це зрозуміло. Але треба також зазначити що вендор завжди буде мати перевагу. Так воно працює і сьогодні.

Для вендора ситуація, коли через 10 років ринок перетвориться на натовп «AI code monkeys», які не здатні написати чи навіть перевірити рядок коду без спалювання токенів — абсолютно прийнятна і навіть бажана.

Хтось переймається що інженери перестали писати на асемблері, перестали руками менкджити пам’ять через вказівники, і не вміють написати qsort в блокноті?

Це класичний аргумент, але в ньому закладена фундаментальна підміна понять. Ви плутаєте перехід на вищий рівень абстракції з делегуванням самого процесу мислення.

Коли індустрія відмовилася від масового написання коду на асемблері чи ручного керування пам’яттю, ми не перестали долати складність. Ми просто змістили фокус нашої когнітивної роботи. Замість того, щоб думати про регістри процесора та алокацію пам’яті, інженер отримав можливість думати абстракціями вищого порядку: архітектурою, патернами проєктування, розподіленими системами. Інструмент (компілятор чи збирач сміття) взяв на себе механічну рутину, але весь тягар побудови логіки, синтезу та архітектурного візіонерства залишився виключно на людині. Саме так ми продовжували рухати фронтир.

ШІ-асистент у його поточному вигляді «вайбкодингу» — це не новий рівень абстракції (як Python після C). Це спроба делегувати сам Inference (здатність будувати логічні ланцюжки).

Коли ви використовуєте високорівневу мову, ви залишаєтесь архітектором логіки. Коли ви просите ЛЛМ «зроби мені цю фічу» і сліпо приймаєте код — ви віддаєте чорній скриньці сам процес конструювання рішення.

Щодо qsort: так, писати його в блокноті щодня не треба. Але глибоке розуміння того, як він працює і чому його складність O(n log n), дозволяє інженеру бачити межі системи і долати нестандартні виклики. Якщо «AI code monkey» не здатна зрозуміти, яку саме логіку згенерувала модель під капотом, вона ніколи не зможе оптимізувати вузьке місце або придумати нове, більш елегантне рішення, якого ще не було в датасетах. Вона назавжди зупиниться там, де закінчується шаблон.

Перехід від асемблера розширив наші когнітивні можливості і дозволив будувати складніші системи. Перехід до бездумного генерування звужує ці можливості до рівня оператора промптів, який не здатен вийти за межі чужого минулого досвіду.

ШІ-асистент у його поточному вигляді «вайбкодингу» — це не новий рівень абстракції (як Python після C). Це спроба делегувати сам Inference (здатність будувати логічні ланцюжки).

Ну що за маячня. Такий самий новий рівень абстракції. Треба продумувати рішення на вищому рівні, які є сервіси, бази, структури даних для баз, обмін повідомленнями між сервісами, як це все і куди деплоїться і синхронізується, девопс продумувати, процесинг даних для вирішення бізнес вимог. Це тим чим ти більше займаєшся (звісно також зі ШІ но рішення приймати тобі) коли ШІ взяв на себе написання коду.

Да за останні пів року у мене просіли скіли написання коду руками. Но сильно виросли скіли архітектури, девопса, інфраструктури, сек’юріті, знання як працюють ЛЛМки, агенти, знання для написання скриптів для використання агентів. Не говорячи вже що знання продуктової частини продукту виросли.

Ви наводите чудовий приклад, але він лише підтверджує мою тезу. Ви зараз оцінюєте ситуацію, потрапивши у класичну когнітивну пастку — «прокляття знання» (curse of knowledge) або ж помилку того, хто вижив.

Ви судите про ефективність інструменту з позиції людини, у якої в голові вже давно сформований та загартований інженерний цикл мислення. Ви роками проходили цей шлях десятки тисяч разів: формулювання проблеми → висунення гіпотези → написання рішення → перевірка → бектрекінг (глибоке розуміння того, де саме зламалася логіка). Ваш розум натренований бачити систему цілком.

Тому зараз ви дійсно можете делегувати механічне написання коду і зосередитися на високорівневих абстракціях: архітектурі, інфраструктурі, DevOps. Ваші сьогоднішні результати — це дивіденди з того капіталу, який ви накопичили класичною інженерією до епохи ШІ.

А тепер уявіть ринок завтрашнього дня, який складається з «вайбкодерів».

Людина, яка приходить в індустрію і одразу починає працювати з LLM у режимі оператора, не формує цей інженерний цикл з нуля. Робота з чорною скринькою виховує зовсім інший когнітивний патерн: промпт → генерація → помилка → перефразування промпту. Це метод сліпого перебору, а не декомпозиції.

Про яку системну архітектуру, побудову баз даних чи сек’юриті може йти мова, якщо людина ніколи не розуміла причинно-наслідкових зв’язків у базовому коді? Архітектура — це не просто квадратики на схемі, це інтуїція, побудована на тисячах годин розв’язання низькорівневих проблем. Якщо ви віддаєте процес конструювання машині, ви ніколи не здобудете цієї інтуїції.

Ви змогли перейти на новий рівень абстракції, бо мали фундамент. Нове покоління, вирощене на бездумному делегуванні, цього фундаменту не матиме. Вони не стануть архітекторами, вони назавжди залишаться операторами чорної скриньки.

Уявіть студента політеху, якого одразу ставлять Архітектором складного продукту в умовному Microsoft чи Google, давши йому лише LLM у помічники. Чи життєздатна така схема?

Справжній Архітектор завжди гартувався двома речами:
1. Глибоким вивченням теорії (патерни, абстракції, алгоритми).
2. Болем, власними фатальними помилками та незліченним повторенням інженерного циклу вирішення проблем на низьких рівнях.

Без другого пункту не буває архітекторів — бувають лише люди, які прочитали розумні книги. Якщо повністю делегувати «біль» і низькорівневе подолання складності чорній скриньці, цей когнітивний цикл у голові просто не сформується. LLM не виховує нових архітекторів. Тому, коли сьогоднішні інженери з класичною базою підуть, індустрія залишиться з натовпом операторів, які теоретично знають усе, але практично не здатні втримати архітектурну складність реальних систем.

Ринок все порішає. Якщо ЛЛМки і агенти будуть достатньо розумні щоб брати навіть дизайн і архітектуру на себе, щоб дійсно все промтами робити без інженерного бекграунду — тоді нафіг цей інженерий бекграунд треба?

Якщо ж ні, то новим інженерам всеодно доведеться вчити якісь основи щоб ефективно вайбкодити, так же само як вони це роблять зараз.

Це ж було вже! Точно так само писали що без знань вказівників і пам’яті — кодинг неможливий. Виявляється можливий. Також виявляється що якщо приспічить, можна пізніше вивчити.

Но сильно виросли скіли архітектури

а в общих чертах что ты спроектировал кроме перестановок слогаемых в клаудном шаблоне?

Не говорячи вже що знання продуктової частини продукту виросли.

это ничего не дает

Так архітектура це про компроміси в координатах, ціна, час, якість(чисто субьективна штука в ініжінірнгу який задають перщі інженер) ну і там так далее... І це дійсно інший кут зору і дуже невелика частина девелоперів думають про це, бо це вже значно менше про елегантність технічного рішення а більше про практичність та чутливість до ризику супорту та іншого...

Основна масса рахітектів пишуть ту саму попсу на клаудних сервісах але виходить у всих по різному, вміння спроєктувати кфаку чи касандру то взагалі інше вже.

Коли відходиш від просто кодіноу як сіньор і починаєш архітектурити навіть свої пет проекти щоб довести до проду цей скіл качається добре, так, в першу чергу зміною точки зору погляду а не на вичення якихось інших дрочьоних архітектурни паттернів.

Так архітектура це про компроміси в координатах, ціна, час, якість

то что ты говоришь называется проектный треугольник, он не имеет прямого отношения в архитектуре, это даже не техническая ветка, а управленческая

Основна масса рахітектів пишуть ту саму попсу на клаудних сервісах але виходить у всих по різному, вміння спроєктувати кфаку чи касандру то взагалі інше вже.

у тебя сложилось ложное впечатление что солюшен архитектор занимается тем чем называется. а медвежатники, наверное, ты думаешь медведями занимаются

Коли відходиш від просто кодіноу як сіньор і починаєш архітектурити навіть свої пет проекти щоб довести до проду цей скіл качається добре, так, в першу чергу зміною точки зору погляду

нет, это просто веселое программирование, оно ничего не дает

а не на вичення якихось інших дрочьоних архітектурни паттернів

это тем более ничего не дает

Це в тебе ложне уявлення, бо зазвичай в аутсорс чи винесені так звані рд офіси нічого крім запланованої технічної роботи не зкидують.

а в общих чертах что ты спроектировал кроме перестановок слогаемых в клаудном шаблоне?

Все. У мене є своє бачення що я хочу. Потім посинаю обговорювати з клодом, брейнштормити, просити покритикувати, дивлюся на свій дизайн з іншої сторони, роблю з клодом додатковий ресьорч як прийнято це робити в 2026. Це процес дизайну і навчання, завжди взнаєш щось нове. З чимось погоджуєшмя, з чимось ні, залежить від твоїх цілей і твого здорового глузду. Не тому, що він слоп пропонує, а тому що оверінжінірінить, в якийсь системі можливо воно потрібно, но клоду не хватає здорового глузду щоб зрозуміти що для цієї задачі на даному етапі це поки не треба.

Але звинувачувати Клод в цьому немає смислу, так як це все дуже субєктивно, є багато правильних варіантів а твої думки, який саме варіант ти хочеш він читати не вміє.

хочешь говорить или не понял вопрос?

Ну і про фронтир в інженерії та програмуванні.

ЛЛМ не розумні, і самі по собі вони нічого фундаментально нового в плані коду не створюють. Вони навчені на величезних датасетах коду, який до них уже написали люди. Так, технічно вони не займаються прямим копіпастом, вони синтезують рішення, але це завжди лише інтерполяція — перекомбінування та мікс вже відомих людству патернів і алгоритмів.

Але фронтир вимагає екстраполяції — виходу за межі існуючих знань, створення нових абстракцій та парадигм, яких у тренувальних датасетах ще фізично не існує. Машина на це математично не здатна.

Якщо весь ринок буде складатися переважно з ШІ-операторів (AI code monkeys), то цей фронтир рухати буде просто нікому. Елегантне подолання системної складності на рівні коду перестане створюватися в принципі, бо ЛЛМ цього не вміють — вони вміють лише перетасовувати минуле.

У поєднанні з деградацією процесу навчання та знищенням інженерного мислення в головах — це повністю тупиковий шлях і дорога в нікуди. Це і є та сама візія апокаліпсиса від вендора.

Резюмуючи думку. ШІ-євангелісти багато в чому праві саме сьогодні. Їхній нинішній успіх базується на тому, що в їхніх головах ще не померло класичне інженерне мислення, виплекане роками хардкорного програмування. Вони використовують LLM як екзоскелет, але спираються на власні інженерні м’язи. Вони дійсно мають рецепт успіху для сьогодення.

Але промотаємо годинник на 10-20 років уперед. Переважна більшість розробників перетворюється на AI code monkeys — операторів, не здатних створити систему без спалювання токенів, не здатних перевірити згенерований код і, тим більше, не здатних створювати нові абстракції для подолання складності. Вся індустрія в контексті фундаментальної інженерії опиняється в глибокому застої.

Так, цей злам створить новий прошарок — «технічних бізнесменів». Це глибокі практики, яким плювати на чистоту коду, але які знають, як швидко згенерувати продукт, знайти нішу, захопити користувача і монетизувати ідею. Але поява таких людей ніяк не скасовує потреби в технічному подоланні складності, яке в загальній масі деградує. Людство ще не винайшло всього, що потрібно. Технологічний фронтир існує, і його треба рухати далі.

Яким буде реальний ринок праці в такому майбутньому? Він жорстко розшарується на 4 категорії:

1. Бізнесмени/Продукт-оунери — їх, як і завжди, будуть одиниці. Чому? Бо ШІ знижує поріг написання коду, але не поріг пошуку Product-Market Fit. Коли кожен зможе згенерувати апку за день, ринок потоне в інформаційному шумі. Виграватиме лише той, хто має талант до дистрибуції та маркетингу, а це завжди рідкість.
2. AI code monkeys — їхня ціна буде копійчаною. Поріг входу дорівнюватиме вмінню формулювати запити. Їх буде безліч, і вони конкуруватимуть між собою за статус кращого «перекладача» для LLM.
3. Класичні інженери (за сучасними мірками) — їхня ціна злетить до небес. Це ті одиниці, які розуміють, як система працює під капотом, здатні виправляти фатальні баги чорних скриньок та створювати нові алгоритми там, де LLM безсилі (бо в тренувальних базах цього ще немає). Вони стануть елітою індустрії.
4. Найменш цінне Commodity такого майбутнього — сам ШІ-згенерований код. Його ціна, цілком ймовірно, буде навіть від’ємною. Згенерувати мільйон рядків нічого не коштує, але підтримка цього незрозумілого «слопу», пошук у ньому галюцинацій та управління когнітивним боргом коштуватиме бізнесу колосальних грошей. Цей код перетвориться з активу на пасив (токсичний актив, як ті самі субпрайм-іпотеки), де компаніям доведеться платити елітним інженерам просто за те, щоб вони це знешкодили або вичистили з системи.

А як справи у тестувальників в цьому дивному новому світі, що ви описали?

Дякую за чудове запитання. Якщо не ворожити на майбутнє, а просто екстраполювати описаний вище тренд інтеграції ШІ, то картина для QA вимальовується дуже динамічна і цікава.

Суть у тому, що застосунки еволюціонують від лінійних до «поведінкових» — де частину бізнес-логіки виконують стохастичні (ймовірнісні) блоки на кшталт LLM. А стохастика завжди має відсоток галюцинацій. Це фундаментально змінює підхід до тестування:

1. Кінець суто мануального QA. У ймовірнісних системах класичні перевірки не працюють. Щоб оцінити фічу, тест-кейс треба прогнати 100 разів, зібрати статистику і виміряти відсоток відхилень на вибірці. Робити це руками неможливо, тому профіль QA неминуче мігрує в жорстку автоматизацію (AQA). До речі, сам ШІ тут дуже допоможе тестувальникам — генерація тестів є атомарною задачею, де ризик роздування коду мінімальний.
2. QA зміщується в Production. Моделі деградують під час роботи (відбувається дрифт). Відстежування якості на живій системі — це завдання, яке зараз часто лежить на DevOps, але воно може стане ключовою зоною відповідальності тестувальників майбутнього.
3. Синтаксичний vs. Семантичний дрифт. Злам формату даних (синтаксису) легко спіймати автоматикою. Але як поміряти семантичний дрифт — коли модель починає непомітно відхилятися від бізнес-змісту чи тону?

Саме тут і лежить головна цінність людини в QA майбутнього. Технічні метрики та математика не здатні повноцінно оцінити змістовий чи репутаційний ризик. Роль тестувальника трансформується: він стане інженером з управління ризиками, який єдиний здатен «відчути» межі безпеки системи та прийнятність її поведінки там, де алгоритми сліпі.

Або все буде якось зовсім інакше:)

Дякую за розгорнуту відповідь! Заскрінив:)

А до речі, чи існує десь англомовна версія цієї статті? Хотів би розшарити на лінкдіні зі своїми англомовними знайомими.

чому це має бути цікаво і вигідно нам, інженерам?

Я вже разів 5 писав відповідь на це питання.
Бо є запит ринку праці (і головне клієнтів) на такий досвід. АІ agentic development скіли виділяють тебе серед інших.

цей злам створить новий прошарок — «технічних бізнесменів». Це глибокі практики, яким плювати на чистоту коду

У вас є упередження що людина пише якісніший код ніж той АІ.
Але це не так) бо рівняйте код не з найкращими людьми а з середніми чи нижче середнього. Баги ж завжди були.
От я ніколи не документую свій код на рівні як це робить АІ. Тести мені теж лінь писати з 10ма асертами чи покривати всі кейси. А для АІ це займе кілька хвилин)

А якщо ще й налаштований процес з кількох АІ-рев’юверів, то виловлюються баги логіки які люди пропускають.

Бо є запит ринку праці (і головне клієнтів) на такий досвід. АІ agentic development скіли виділяють тебе серед інших.

На короткому горизонті (сьогодні/завтра) agentic/LLM tooling справді стає marketable skill. Але тут, здається, є ризик підміни попит на skill → об’єктивну користь для SDLC.
Ринок може бажати AI через хайп та очікування, але реальний ROI зазвичай сильніше залежить від процесів, домену, тестового контуру тощо.

рівняйте код не з найкращими людьми а з середніми чи нижче середнього

Тут я загалом згоден з тезою «порівнювати з медіаною», але є прихована передумова:
— людина без мотивації та/або під дедлайном
— проти LLM, якій поставили вимогу «зроби добре»

Це не зовсім симетричне порівняння. Бо медіанний інженер при правильній культурі/DoD також буде писати тести й доки — це значною мірою організаційне питання. Значна частина виграшу AI тут походить від нульової втоми, нульової ліні, та готовності робити нудні речі.

Водночас не варто ігнорувати, що LLM доволі регулярно генерують:
— правдоподібні, але порожні коментарі
— тести, що асертять поточну реалізацію, а не правильну поведінку
— покриття без сильного oracle

А якщо ще й налаштований процес з кількох АІ-рев’юверів, то виловлюються баги логіки які люди пропускають.

Я б сказав, що це доволі оптимістичне припущення. Multi-review справді може підвищувати recall на очевидних багах, але без сильного oracle і чітких контрактів він так само впевнено пропускає складні інтеграційні та поведінкові дефекти.
У моїх кейсах «консиліум моделей» частіше підвищував noise у post-review, ніж стабільно додавав signal.

Я б сказав, що це доволі оптимістичне
припущення

В мене до гітхаба прикручений codex, в п’ятницю він знайшов мені дві баги в бізнес логіці.
Сам я це пропустив.
Пофіксати зайняло 1 промпт, ну і руками джіру поедітати.

Я вже разів 5 писав відповідь на це питання.
Бо є запит ринку праці (і головне клієнтів) на такий досвід. АІ agentic development скіли виділяють тебе серед інших.

ты же в курсе что востребованность не связана с высокой оплатой труда? кассиры, курьеры, доставщики, уборщики. ты пишешь, как будто бы тебе норм чтобы в этом списке появились программисты

У вас є упередження що людина пише якісніший код ніж той АІ.
Але це не так) бо рівняйте код не з найкращими людьми а з середніми чи нижче середнього. Баги ж завжди були.

планка качества и так снижается с каждым годом, а тут хорошие шансы ее совсем обвалить и потом сражаться за еду с рикшами-свитчерами

а тут хорошие шансы ее совсем обвалить и потом сражаться за еду с рикшами-свитчерами

твои предложения?

учитывая то что у нас даже профсоюз не может появиться, то о каких-то организованных действиях речь не идет. но невооруженным глазом видно что итальянская забастовка давно началась причем везде и на это нельзя повлиять. пройдет 5-10 лет и компании осознают что они не получили ни увеличения доходов, ни снижения расходов. гребцы поймут что теперь они дешевые и легкозаменяемые на любого человека с айкью 50+. а компании, которые продают ллм снимут все сливки, часть объявит себя банкротами (но по факту просто уйдут с рынка, достаточно заработав), а остальные монополизируют рынок и начнут вести себя соответствующим образом
этот сценарий мне кажется самым реалистичным. но опять же, все может пойти не так и ии пузырь лопнет завтра, либо наоборот найдется способ подключить мозг к оборудованию и появится возможность немного сокращая жизнь операторов делать аги, а еще есть яо, которое вообще все может поменять

короткий ответ: предлагаю оппортунизм

ты же в курсе что востребованность не связана с высокой оплатой труда? кассиры, курьеры, доставщики, уборщики. ты пишешь, как будто бы тебе норм чтобы в этом списке появились программисты

Ти ж в курсі що написав дурницю?
Треба порівнювати програмістів до програмістів, бо вони конкурують між собою.
А не до кур’єрів.

На власному досвіді я знаю що це пов’язано з високим рейтом.

ага, гребцам преподносится как «выживут лучшие», а компаниям «вы сможете уволить самых дорогих»

Ось про документацію та юінте тести то +100500, що мені іще особливо подобаєтся, можна його нагнути нагенерувати едж кейсів для юзер флоу дати права на визову команд в консолі і нехай локально ганає все стільки потріьно, туди ж і генерацію апі запитів, я стільки часу зєкномив на цю сушку мізків шо капец.
Також генерація тестових даних. хоч база хоч будь що.

Мне эта история напоминает предыдущие, кода на рынок выкатывали «революционные» лекарства и строительные материалы. А потом от лекарств начинались лютые побочки, а от стройматериалов — онкология. Так и тут — доведут дело до крупной техногенной катастрофы, потом опомнятся.

Цікаве спостереження за результатами дискусій у коментарях. Опоненти, які звинувачують мене в упередженості або «хейті» до ШІ, часто використовують одну й ту саму тезу: «Дослідження, на які ти посилаєшся, вже застаріли. Вийшла нова модель — і тепер усе працює інакше».

У зв’язку з цим маю кілька думок:

1. Я не є противником штучного інтелекту. Навпаки, я запеклий фанат і активний користувач цієї технології. Моя мета — щоб ШІ приносив реальну додану вартість. Саме для цього потрібен чесний діалог із професійною спільнотою: ми маємо визнати проблему безвідповідального використання та спільно напрацювати протоколи безпеки.

2. Якщо прийняти аргумент про те, що «нова модель усе пофіксила», виникає логічне запитання: чи правильно я інтерпретую вашу позицію? Стверджуючи сьогодні, що нова модель виправила недоліки попередніх, ви фактично визнаєте, що пів року тому, коли ви доводили безумовну користь ШІ для коду, ви помилялися. Адже дані за той період підтверджують мої тези, і тепер ви з ними згодні.

3. Питання до опонентів: чи не здається вам, що ви наступаєте на ті самі граблі? Ви захищаєте ту саму позицію, що й рік тому, попри те, що час уже кілька разів довів хибність ваших попередніх прогнозів.

Я цілком допускаю, що можу помилятися. Я формулюю тренди на основі доступних даних, які завжди приходять із затримкою та описують минуле. Цілком можливо, що злам тренду відбувається прямо зараз, а статистичне підтвердження ми побачимо лише за 4–5 місяців. Це нормальний стан речей, коли йдеться про стратегічні рішення та індустріальні масштаби. Проте ігнорувати системні ризики, сподіваючись на чергове «оновлення моделі», — це шлях до катастрофи SDLC.

Якщо коротко, то погугліть Solow productivity paradox.
У ваших «дослідженнях продуктивності» та сама проблема.

Ви захищаєте ту саму позицію, що й рік тому, попри те, що час уже кілька разів довів хибність ваших попередніх прогнозів.

Яку позицію?
АІ вже тут і забирає роботу (роблячи роботу замість людей), акції софт компаній падають на 30-50% при рості прибутків. Безробіття програмістів в США найвище хз з яких часів.
Епам у квартальному звіті минулого тижня прогнозує ріст 3% продаж в рік (тобто прогнозує падіння бо є ще інфляція), попередні роки він ріс 15%+.

Юзання АІ дозволяє хоч трохи підняти свою цінність на ринку праці, тому його і треба юзати.

Що з цього минулий рік заперечив? Навпаки, він тільки це підтвердив.
Вчора вийшла нова «кібер секюріті модель» і акції сектору кібер безпкеки −10% в день.

Які ще підтвердження вам треба?)

Якщо коротко, то погугліть Solow productivity paradox.
У ваших «дослідженнях продуктивності» та сама проблема.

Це, до речі, найсильніша частина вашого аргументу.
Для тих, хто не знайомий із парадоксом Солоу: його суть у тому, що технології часто впроваджуються швидше, ніж це відображається у вимірюваній продуктивності.

Юзання АІ дозволяє хоч трохи підняти свою цінність на ринку праці, тому його і треба юзати.

На рівні окремого інженера це часто (хоч і не завжди) так — особливо в задачах із високою часткою механічної роботи.

Що стосується решти аргументації — тут, на мою думку, виникає класична помилка post hoc ergo propter hoc,тобто змішування кореляції з причинністю. Те, що певні ринкові або галузеві зміни відбуваються одночасно з поширенням AI, ще не означає, що саме AI є їхньою головною причиною.

Щодо парадоксу Солоу, я частково торкався цієї теми у своєму попередньому коментарі. Так, теоретично ми можемо перебувати в точці зламу тренду прямо зараз, але об’єктивно підтвердити це ми зможемо лише згодом. Моя позиція як лідера є прагматичною: я не готовий ризикувати модульними чи функціональними командами, спираючись лише на сподівання. Обережне впровадження, валідація гіпотез та робота в межах «безпечного поля» — так. Вихід за ці межі без доведеної ефективності — ні. Коли мова йде про мої персональні ресурси, час чи кошти, я можу дозволити собі значно більший рівень ризику, бо це лише мої збитки. У бізнес-контексті відповідальність інша.

Важливо також розрізняти локальну та системну ефективність. Те, що окремий інженер за допомогою ШІ суб’єктивно відчуває себе «ціннішим» або швидшим, ще не означає автоматичного зростання цінності для продукту. Якщо інженер генерує код у два рази швидше, але цей код створює «затори» на етапах рев’ю, тестування або підтримки через надмірну складність — загальна пропускна здатність системи (throughput) падає. Професійно відбудований SDLC дозволяє нам бачити ці аномалії в реальному часі. Для мене дані з SDLC — це випереджаючий індикатор (leading indicator) майбутніх проблем, тоді як квартальні звіти чи ціни на акції — це лагуючий індикатор (lagging indicator), який відображає лише минулі стратегії та поточні страхи інвесторів.

Падіння акцій сектору кібербезпеки або прогнозів EPAM — це реакція ринку на очікування та хайп, а не доказ технічної переваги ШІ. Ринок часто помиляється в оцінці швидкості реальних змін. Щодо «кривої навчання»: вона дійсно існує, але ризик у тому, що вона може стати фатальною для бізнесу. Технологія може бути перспективною, але якщо вартість «навчання» індустрії в масштабах TCO та технічного боргу виявиться занадто високою, ми отримаємо системну кризу ще до того, як побачимо ROI.

Щодо тези про звільнення — часто за ними ховається банальне виправлення минулих управлінських помилок. На прикладі Amazon ми бачимо коригування стратегії «land grab», яку компанія сповідувала останні 10–15 років. Вони агресивно наймали топових інженерів, щоб просто «володіти талантами», але не змогли забезпечити їм належну утилізацію. Сьогодні ШІ для них — це зручний інфопривід, щоб скоротити роздутий штат і пояснити це ринку як технологічну трансформацію, а не як стратегічний прорахунок менеджменту.

Додам ще кілька думок щодо кейсу EPAM, оскільки це часто наводять як аргумент «занепаду» через ШІ. Тут пояснення може бути значно прозаїчнішим і стосуватися класичного бізнес-циклу, а не технологічної сингулярності.

EPAM роками розвивався екстремально високими темпами, агресивно нарощуючи хедкаунт та експансію. Будь-яка система такого масштабу рано чи пізно досягає точки, де подальше екстенсивне зростання стає неможливим без втрати керованості. Зараз ми, ймовірно, спостерігаємо період стабілізації структури. Це природний етап, який часто супроводжується корекцією доходів та прибутковості.

Але найцікавіше в іншому: EPAM — це якраз один із найпотужніших гравців на ринку в плані впровадження ШІ. У них є власні центри компетенцій, свій AI Accelerator та готові комерційні рішення на базі ШІ. І тут виникає логічне протиріччя для моїх опонентів:

Якщо ШІ — це чарівна паличка для продуктивності та вибухового зростання, то чому компанія, яка вклалася в нього чи не найбільше в індустрії, прогнозує сповільнення росту?

Виходить, що або ШІ не дає того миттєвого бусту, про який малюють у презентаціях, або ринкові та структурні чинники (про які я писав вище) мають на порядки більший вплив на реальний бізнес, ніж наявність ШІ-асистента в руках розробника. На прикладі EPAM ми бачимо, що масова інвестиція в ШІ поки що не корелює з вибуховим зростанням продажів — це радше гра в довгу, а не «заміна всіх на роботів вже сьогодні».

Ви знову вернулись до простинь тексту(

подальше екстенсивне зростання стає неможливим без втрати керованості.

3% ріст продаж. 3%!!!
І це прогноз. Ви розумієте що це не зменшення зростання а різкий спад де нових проектів буде менше за відмираючі старі?
Тобто вся ота машина з сейлів, маркетингу, в кращому випадку покриють закриті проекти?
Наскільки поганим має бути ринок щоб таке очікувати?

Падіння акцій сектору кібербезпеки або прогнозів EPAM — це реакція ринку на очікування та хайп, а не доказ технічної переваги ШІ. Ринок часто помиляється в оцінці швидкості реальних змін.

Я вже вам писав, запитаю ще раз. Думаєте топ менеджмент Епаму, з його доступом до даних, роблячи прогноз на рік, дурніший за вас?

Моя позиція як лідера є прагматичною: я не готовий ризикувати модульними чи функціональними командами, спираючись лише на сподівання

Не ризикуючи ви ризикуєте ще більше)
Зараз очікування клієнтів що юзаючи АІ делівері буде швидше і якісніше. Чи ризикнете ви сказати «та ні, ми не юзаємо» на пресейлі? Для мене очевидна відповідь що ні, бо тоді нових проектів ви не побачите.

Ви робите досить емоційні висновки та схильні до швидкого навішування ярликів, але давайте повернемося до логіки бізнес-процесів.

Про прогноз EPAM та «розумний менеджмент»
Топменеджмент EPAM якраз тому і розумний, що складає прогнози з урахуванням ринкового контексту. А сьогоднішній контекст — це ірраціональний хайп. Прогноз у 3% не суперечить моїй тезі: він відображає ірраціональну поведінку ринку (де клієнти можуть очікувати нереалістичних результатів від ШІ) та власні плани компанії щодо стабілізації структури. Звіт — це не лише про те, «скільки коду ми напишемо», а про те, як компанія адаптується до перегрітого ринку після років гіперстрибків. Це класичне «перетравлення» попереднього масштабування.

Про пресейли та використання ШІ
Ваша теза про те, що ми нібито маємо казати клієнту «ми не юзаємо ШІ», — це вигадана вами дихотомія. Ми впроваджуємо ШІ, але робимо це відповідально. На професійному пресейлі позиція звучить інакше: «Ми використовуємо ШІ як інструмент пришвидшення, але тримаємо його під суворим контролем SDLC, щоб ви через рік не отримали некерований технічний борг». Для серйозного бізнес-клієнта це звучить значно переконливіше, ніж обіцянки «магічної кнопки».

Про ризики
Не ризикувати стабільністю команд та якістю продукту заради короткострокового хайпу — це і є прагматичне лідерство. Ризик «не встигнути за хайпом» часто менший за ризик «залити репозиторії клієнта непідтримуваним сміттям». Ми використовуємо технологію там, де вона створює реальне value, а не просто ілюзію швидкості.

Ми використовуємо ШІ як інструмент пришвидшення

так как вы используете AI у себя? весь сыр-бор как раз из-за отсутствия собственных референсов, устаревшие отчеты вместо них. расскажите, что и как вы используюете, может и спорить-то не о чем.

За 1 тиждень ви змінили думку з

Це дурна робота — просто за визначенням.
....
Прості задачі, код який не приведе до ризиків, мвп зробити, одноразовий скрипт написати і т.п. Ну для фану можно погратися з більш складними рішеннями де це вже «агент на агенті» — але чисто для себе. Бо в реальний роботі це зʼїдає час, а не економить, дорожче ніж без цього і ризиків більше

На

Ми впроваджуємо ШІ, але робимо це відповідально. На професійному пресейлі позиція звучить інакше: "Ми використовуємо ШІ як інструмент пришвидшення, але тримаємо його під суворим контролем SDLC

Чого у вас так за тиждень погляди змінились?)
Хоча можете і не відповідати, знлву буде простиня слоп тексту

Чого у вас так за тиждень погляди змінились?)

ты много додумал, в этих двух цитатах нет и намека на изменение взглядов

А це норма перевзування. Спочатку ШІ говно, генерує слоп код який тупі вайбкодером пушать в продакшн не перевіряючи, тільки шкодить бізнесу.

Потім через рік самі вайбкодить, і оправлують це тим, що роблять це ВІД-ПО-ВІ-ДАЛЬ-НО, що перевіряють код, що ШІ всеодно говно, але тільки вони настільки професійні що вміють правильно його використовувати, а всі інші це говнокодери, вайбкодери яких треба тримати по-далі від ШІ.

Вже кілька чоловік на ДОУ подібні тези використовують.

А це норма перевзування

не, это не переобувание. первая цитата — это то, что Виталий реально думает и подтверждает в каждом комменте. а вторая — это та лапша, которую они вешают клиенту на пресейлах, он же сам написал. это из той же серии, что «у нас все сотрудники — сеньоры с 10+ лет опыта», а на деле — джун джуном погоняет за 3 копейки. так сказать, блеск и нищета украинских галер :)

ШІ швидко розвивається і тепер деяуий код можна реально юзати. Але коли його багато і одразу, він просто закладний для аналізу і плюс часто є задача аля «засунути ту штуку в не призначений для цього отвір». Де ші трохи поки що не витягує.

Якщо коротко, то погугліть Solow productivity paradox.

По-перше, Solow productivity paradox це 1987 рік, коли IBM PC коштував як автомобіль, софт був примітивний, і це була іграшка для окремих ентузіастів або дорогий інструмент для конкретних вузьких задач. Коли проникнення 2-3%, то побачити рість продуктивності важко. Для великої компанії часто це була автоматизація бухгалтерії, а не повсякденна робота. Звіст продуктивності почався у 1995 році, коли персоналки стали масовими, з’явилися мережі та e-mail.

AI Productivity Paradox вимиріється не взагалі на рівні великої фірми, а на рівні продуктивності як окремого розробника, так і саме розробки софта. Мінімальні витрати, не треба купувати залізо, перебудовувати процеси. Лаг адаптації саме тут очікується мінімальним.

акції софт компаній падають на 30-50% при рості прибутків

Ну... акції це оцікування в масах, ті самі бульбашки. Більше того, більше всього падають акції компаній, що продають корпоративний SaaS (управління проектами, документообігу, HR, аналітика). Тобто скоріше ринок очікує, що непотрібним стане конкретний софт (промп до LLM замусть запиту звіта), а не спроститься розробка.Тобто ринок очікує зміну того, що розробляти, а не що розробка стане непотрібною.

Юзання АІ дозволяє хоч трохи підняти свою цінність на ринку праці, тому його і треба юзати.

Досить дивна теза. Інструмент доступний всім, потребує лише навичку спілкування на рідній мові, чому роботодавець має платити більше? Скоріше навпаки, якщо ти можеш писати код, де LLM не допомогає ніяк, то ти дуже цінний. Ну а так да, це створює потенційні ринки в компаніях, які зроблять ставки на переважне використання LLM для розробки (рої, процеси) куди можна втиснутися як експерт, який розуміє як це робити. Проте туди вже ломанулося багато людей, і без вміння себе піарити там робити нічого.

Вчора вийшла нова «кібер секюріті модель» і акції сектору кібер безпкеки —10% в день.

Ой... ніколи такого не було, що ринок панічно реагує на заголовки. Аналітику будувати на щоденних трендах... Таке...

Коли проникнення 2-3%, то побачити рість продуктивності важко

проникновение AI на сейчас еще меньше

Мінімальні витрати, не треба купувати залізо, перебудовувати процеси. Лаг адаптації саме тут очікується мінімальним.

шо-шо-шо? да автор тут на 15 экранов распинается, как сложно провести правильно адаптацию и выстроить SLDC.

якщо ти можеш писати код, де LLM не допомогає ніяк, то ти дуже цінний

странная логика. а если можешь писать без гугла, то ты еще ценнее? а если карандашом на тетрадном листике в лыжах и в гамаке, так вообще тебе цены нет?

код — это коммодити. ценность имеет решение задач с помощью кода. и скорость их решения. а как код был написан — вообще не имеет значения.

проникновение AI на сейчас еще меньше

100% розробників користуються, проведи опитувння, хто бодай одного разу не спробував

шо-шо-шо? да автор тут на 15 экранов распинается, как сложно провести правильно адаптацию и выстроить SLDC.

Це нагадує як складно написати архітектуру, воз й нині там. Тут ентимема у тому, що можна провести правильно адаптацію. Можна спробувати, не факт, що це спрацює. Станом на зараз для мене врішення цього питання немає, ци ризики: або вийде, або ніт.

странная логика. а если можешь писать без гугла, то ты еще ценнее?

Вартість коду залежить від того, скільки людей здатні його написати. Мова йде не про використання, а про допомогу. LLM, як і Google колись, просто змінює цінність: чим більше допомоги, тим менша вартість. Навіщо платити більше, якщо джун може загуглити? Або зараз якщо джун може написати промпт?

100% розробників користуються, проведи опитувння, хто бодай одного разу не спробував

выше постили уже картинку. даже в этом топике человек 5-6 от силы профессионально используют agentic coding. ты просто, это... не путай ChatGPT с agentic coding. не знаю, это тут в десятый раз пишется, или уже двадцатый? а то запромптят бесплатный ChatGPT «implement clone of Slack. make no mistakes» и делают потом выводы :)

Вартість коду залежить від того, скільки людей здатні його написати.

LOL

Або зараз якщо джун може написати промпт

ну да, нужно же только промпт написать

не путай ChatGPT с agentic coding.

Що в агентів під капотом? Часом не LLM та SLM? Якщо викинути обидві технологогії з agentic coding, що залишиться?

по-моему так можно сказать вообще про все на свете

Мені цікаво в автора дізнатися про деталі. Пан неодноразово робив акцент на тому, що там є якась суттєва різниця.

разница как перевозить кирпичи в тачке или нести в руках. существенная, но результат примерно одинаковый

Якщо викинути обидві технологогії з agentic coding, що залишиться?

Думав пройти повз бо відповідати на таке трата часу але ок.

Контекст коду для конкретного репозиторію і проекту.

Контекст вимог, найкращих практик для конкретного проекту

Контекст найчастіших проблем для конкретного проекту.

Контекст історії вимог по фічах (ми таке автоматом генеруємо щоб АІ потім знав чого було так а не інакше)

Кілька агентів які виступають умовними фільтрами галюцинацій і неякісної роботи, підготовка тех вимог, імплементація, написання тестів, рев’ю, документація для майбутніх правок.

Інтеграція через MCP з фігмою, локальною БД, браузером. Оце покращується буквально кожного місяця.

Я навіть теоретично не можу уявити як це зробити через чат.
Вже зараз ппи стандартному «фронт, бекенд, база» такий сетап зробить фічу, напише тести, перевірить що працює (поки тільки АПІ, тому бекенд + база, але ми маєм плани зробити е2е), напише MR опис.
Мені залишається вручну потестувати, переглянути код.

Я навіть теоретично не можу уявити як це зробити через чат.

Я от просто зараз зайшов подивитись у коннектори, доступні з коробки для Claude — і там дуже довгий список.

res.cloudinary.com/...​/dfozsb9fwcmyhumse6eu.png

Коннетор до GitHub доступний прямо з вікна проєкту вже десь рік мабуть. А окремий сторедж для контексту — то й взагалі здається був від самого початку.

Сергей, ну Claude и Claude Code — сильно разные штуки, правда. быстрее попробовать, чем перечислять)

я тебе кину в личку guest pass на неделю базовой подписки Claude Code, у меня как раз есть сейчас) just for fun

Це я відповів на цілком конкретне висловлювання.
Так-то я знаю у чому їх різниця, і я принципово не бачу обмежень зробити щось у чаті замість кода. Так, не дуже зручно, не вийде коротенько діфи глянути, пайплайни налаштувати тощо, ну і моя безпосередня участь буде потрібна більше... Але прямо вигадати таку задачу, яку я не зможу зробити у чаті мені не вдалось.

PS: Я маю максимальну підписку. Але все одно дякую.

ну видишь, мы очень по разному используем. я, например, не могу представить себе проектную задачу, которую могу сделать в Claude вместо Claude Code

мы очень по разному используем

Це вже більш філософське питання, як на мене. Не думаю, що прямо дуже по різному, бо там не те щоб багато варіантів.
Коли я бажаю покодити — то я запускаю сессію CC у терміналі/дектопі.
Але я здебільшого займаюсь підготовкою документації та Work Packages. І я знайшов, що робити це в чаті банально зручніше, бо можна одразу дивитись на повний артефакт та різонінг. А те що потім треба окремою дією залити артефакти на FTP — я вважаю це справедливою платою за цю зручність.

Далі вже watchdog все це посортує і затригерить нейронку, яка підготує промпти та контекст і заспавнить стільки агентів, скільки вважає за потрібне, роздасть їм завдання і вкаже чергу виконання.

Що робить мій дубовий агент на віндсьорфі — запускає на віртуалках консьюмери, конектиться до них, читає логи, і верифікує код, якщо ж баги то пише фікс, комітить, стопає консьюмери, скидує офсет на локальній кафці, також чистить данні в еластіку та монгі, потім запускає консьюмери і далі по новій тестує. Так усе розгорнуто локально. Це не обовзяково робити на вашому проекті а просто умовний приклад що може агент.
В нього банально доступ до консолі в павершелл із коробки, він мені за лічені секунди проскнив 70к файлів медіатеки і видав усі види файлів що в мене є, не потрібно нічого писати самому, просто пара фраз у іде.

Генерація тестових данних, прогін по купі едж кейсів...Тепер увесь цей дрочь жере як мін раз в 10 менше, особливо на складних розподілених додатках.

Якщо потрібно нагенерить меседжів у кафку, апі запитів, скине середне за багаторазовий прогін, видасть результат вже агрегованим та відсортованим.

Короч жорзтка грань взаємодії з компом стриється, якщо раніше ти мав писати код та скрипти сам то зараз можна просто написати живою мовою.

Скоріше за все, він натякає, що не у всіх є бюджет запускати купу агентів... бо токени там летять ...

Знову дурниці городите від незнання.

Щоб було зрозуміліше, LLM це як гола вінда. Агентський стек це різноманіття софту на вінді. Чи можна зробити презентацію на вінді? Можна щось зробити в пейнті, але краще таки купити підписку на офіс і зробити в паверпойнті.

І вот такі як ви, ходять і розказують що важко зробити щось складне в пейнті. Так ніхто в пейнті і не робить.

Знову дурниці городите від незнання.

Можна цю фразу хоч триста разів повторити. Але це мед для моїх вух. Якщо людина починає розмову з конфронтації та образ, значить їй нема чого сказати.

Щоб було зрозуміліше, LLM це як гола вінда. Агентський стек це різноманіття софту на вінді.

Та ладно! Серйозно? ВАУ! Я прямо шокований! (Ніт).

Весь той тулсет, що імплементований в так званих агентах, зроблений для того, щоб універсальну та непередбачувану річ зробити більш утилітарною та корисною. Казати, що чатик та агенти «єта другоє», а також звинувачувати всіх в тому, що вони не бачать очевидного та тупі — це такий собі спосіб вести аргументовану розмову.

А задайтеся простим запитанням, навіщо агентам контекст. Без загальних фраз, на кшталт, щоб «розуміти» краще проект. Зможете пояснити?

Весь той тулсет, що імплементований в так званих агентах, зроблений для того, щоб універсальну та непередбачувану річ зробити більш утилітарною та корисною.

Мінуси? Якщо це працює і робить ЛЛМку на порядок кориснішою, які мінуси? Саме на порядок, не в рази а десяток разів. Як це можна називати тим самим? Тільки безграмотна людина, яка не розуміє матчастини може казати «та то те саме». А потім ще обурюється коли поправляють.

Зможете пояснити?

Вже мільйон раз пояснювали. Взагалі поняття контексту в сучасному агентському воркфлоу де стейт і пам’ять зберігається в файлах і де активно юзаються сабагенти з чистим контекстом — дуже розпливчисте.

Ви маєте рацію в тому, що агентський стек робить базову LLM значно кориснішою і функціональнішою. Але випускаєте з уваги головне — системну складність та економіку процесу (TCO).

Якщо ми поглянемо на роботу так званих «агентів» через призму закону необхідної різноманітності Ешбі, класифікації причинно-наслідкових моделей Джуди Перла («Книга Чому») та класичної теорії управління, то отримаємо таку картину:

1. Навіть з агентським тулсетом, LLM залишається стохастичною «чорною скринькою», яка може контролюватися виключно через коригуючий зворотний зв’язок.
2. Контролер, який забезпечує цей зв’язок, має бути за своєю складністю таким самим (або складнішим), ніж система, яку він коригує.
3. Оскільки критично важлива частина контексту будь-якого ентерпрайз-проєкту завжди знаходиться не просто у файлах (як стверджували вище), а «в головах» розробників (історія рішень, неявні трейдофи, бізнес-логіка), цей контролер — це не просто ще один сабагент з іншим промптом. Цей контролер — це симбіоз LLM та живої команди.

І тут виникає фундаментальне питання балансування SDLC: скільки часу команда повинна інвестувати в налаштування та підтримку такого агентського воркфлоу, щоб фінальний результат був дійсно якісним і безпечним?

Бо якщо до впровадження агентів ми витрачали, умовно, 10 годин на тиждень на написання складного коду та живе мануальне рев’ю, а після їх появи починаємо витрачати ті ж самі 10 годин на постійний тюнінг, написання скриптів інтеграції, налаштування контексту та розбір логічних галюцинацій агента — то заради чого це все робилося? Де ROI? Де ми зекономили? Вартість розробки в таких умовах може ще й вирости.

Саме тому я не вірю в появу універсально корисних ШІ-асистентів або агентів «з коробки», які самі закриють всі проблеми. Їхня ефективність — це завжди питання глибокої кастомізації під унікальні потреби конкретної команди. І якщо не бігти сліпо за хайпом, а холоднокровно аналізувати реальні показники делівері та якості коду, може так статися, що далеко не завжди це в принципі економічно доречно використовувати.

І ніякі поточні реалізаціі в вигляді згодовування ЛЛМ документації в режимі «дати почитати» — це не вирішують. Може теоретично вирішити якщо ціна навчання ЛЛМ впаде настільки що команда будь яка може собі дозволити буквально кожну добу тренувати модель на нових датасетах, донавчаючи ЛЛМ тому що сталося в «світі навколо іх проєкту» за останню добу. Тоді питання буде тільки в тому — як забезпечити такій ЛЛМ доступ до максимально можливого обсягу проектної інформації, а це вже не тільки код, але і робочі чати, листування, транскрипти мітингів. Але це — поки що неможливо все разом. Доповню — я не кажу що це неможливо допиляти під якийсь окремий ізольований проект. Можливо. Я кажу що поточне рішення — не універсальне, з агентами. Чи зʼявиться універсальне — взагалі питання. І поточна реалізація має обмежену зону де це можна застосувати безпечно, зі зрозумілим РОІ і зрозумілою користю.

Якщо ми поглянемо на роботу так званих «агентів» через призму закону необхідної різноманітності Ешбі, класифікації причинно-наслідкових моделей Джуди Перла («Книга Чому») та класичної теорії управління,

«так званому» PMO&Delivery Head стоило бы посмотреть через призму задач программистов. вот уж воистину, горе от ума! откуда у человека, который должен заниматься сугубо прикладными задачами, если верить его лычке, столько стремления писать полотна псевдонаучного текста? незакрытый гештальт, в аспирантуру не взяли?

невозможно на серьезных щах комментировать этот поток сознания! не пробовал, не умеет, не знает, не понимает, но выдумывает собственное представление, приписывает другим выдуманные тезисы и потом их сотнями строк «развенчивает», считая себя умнее тех, кто в общем-то и двигает индустрию вперед, заносит те деньги, с которых вся украинская программистская деятельность и кормится.

Мінуси?

Ніхто не каже про мінуси. Навпаки, все зроблено так, щоб уникати певних недоліків поточних LLM. Інакше агенти не були б потрібні від слова взагалі.

Якщо це працює і робить ЛЛМку на порядок кориснішою, які мінуси?

Оптимізація лайна не робить продукт цукеркою.

Тільки безграмотна людина, яка не розуміє матчастини може казати «та то те саме».

Скільки пафоса... аж смердить, фу. Фундаментальні недоліки LLM агенти не виправляють. Саме про це постійно йде мова. Тому нема різниці, буде LLM гола чи запакована в набір агентів, результат буде приблизно однаковим, попри заяви євангелістів про «павєртє, єта другоє». Але ми на третє коло вже йдемо.

Я вище більш сухо описав. З вами згоден — частково. Ви праві як на мене в тому що ставити на те що агентський підхід спрацює як універсальне рішення від вендорів з коробки — скоріше за все не варто. Яким може бути рішення — теж описав. Агенти — але тільки через глибоку кастомізацію командою. Але тоді ми отримуємо цілу низку нових питань і нових проблем, від банальних — а скільки це буде коштувати команді і чи в цього буде РОІ, хоч колись? До питань — побудови цього «велосипеду» під кожну команду і іі потреби — а це вже питання РОІ на рівні компаніі і індустрії. І закінчуючи питаннями кардинальної перебудови не тільки СДЛС а і зміною того що ми знаємо під терміном — інженерна культура розробки ПО.
Тобто мені здається розмова часто іде в принципі на різних рівнях. Чи можливо побудувати якийсь кастомний велосипед під конкретну команду особливо коли наша ціль — саме в побудові цього велосипеду і ми не зважаємо на РОІ, ТСО і т.п.? Та звісно можливо.
Але чи можливо такі велосипеди будувати всім завжди, при будь яких розмірах команди, коду, вимог до якості, поточного стану фінансового організацій та спроможності інвестувати? Тут вже чіткої відповіді не буде

Вот читаю ці потуги, і не розумію як це працює. Це якби чувак з маскою для снорклінга розказував дайверам що акваланг це те саме що і маска і взагалі для дайвінгу ні сноркл ні акваланг не працює. Я би ще зрозумів якби це розказував професійний фрі дайвер, якому тільки маску дай (хоча він такої хєрні молотити не буде), но коли це робить сноркліст в рятівному желеті який до того ж ще маску задом наперед надів... яку ціль він переслідує?

Ти розповідаєш про персональний досвід та власні відчуття. А сперечаєшся при цьому з цифрами, спостереженнями, фактами. Це класична помилка фанатів, вони не хочуть чути опонента та не можуть спілкуватися про фундаментальні речі, бо тоді їм треба буде визнати, що світ не рожевий.

Це з якими цифрами і якими фактами? З якою швидкістю росте кількість юзерів агентів? З якою швидкістю ростуть підписки і ревеню ллм провайдерів? Так вони не на твоїй стороні.

Приведи конкретні цифри і факти. Тільки не треба тих «досліджень» що джуни з чатгпт 4о на одній задачі 30 хв не показали особливого приросту швидкодії. Не ганьбися, перевіряй на що посилаєшся і сам почитай, а не цитуй когось «булись же десь дослідження»

З якою швидкістю росте кількість юзерів агентів? З якою швидкістю ростуть підписки і ревеню ллм провайдерів?

А як вони спростовують неефективність? Що спростовує хибну субʼєктивну оцінку користі та очікування вигоди в майбутньому?

З якою швидкістю росте кількість юзерів агентів? З якою швидкістю ростуть підписки і ревеню ллм провайдерів?

Мільйони мух не можуть помилятися... Цей аргумен що мусить доводити?

Приведи конкретні цифри і факти.

Навіщо? Ви ж їх відкинете як нікчемні.

— та було ж купа досліджень що ШІ говно і не працює, ніякого бусту продуктивності і лише щкодить
— посилання на ці дослідження будь ласка
— во (посилання на ліве дослідження)
— ви самі то хоч саме дослідження читали? Там нічого із заявленого немає, і прийшли до зовсім іншого висновку
— ці ЩІ евангелісти продовжують ігнорувати факти і цифри
— як факти і цифри? Приведи їх
— ще й обзивають довбнями всіх, хто не згоден з їх думкою
— так посилання на дослідження будуть? Факти, цифри?
— ви нікчемні, всеодно будете їх відкидати

З якою швидкістю росте кількість юзерів агентів? З якою швидкістю ростуть підписки і ревеню ллм провайдерів?

Ви зараз підміняєте метрики.
Зростання користувачів та доходів — це показник моди на інструмент, а не доказ того, що SDLC став ефективнішим.
За цією логікою, якщо Steam стабільно росте з моменту запуску, то ігро-шлак мав зникнути як клас ще років десять тому.

У нормальній інженерній розмові дивляться на інше:
— cycle time end-to-end
— defect leakage
— rework
— cost of verification
— system throughput
...а не на кейсіи рівня «мені Codex знайшов два баги.»

Картина, до речі, неоднорідна: від помітного бусту на механічних задачах до кейсів, де досвідчені деви на знайомому репозиторії стають повільнішими через overhead перевірки.
Це не «хейт» і не «хайп» — це те, що показують контрольовані експерименти.

Тільки не треба тих «досліджень»

Оце якраз показовий момент.
Фактично ви зараз формулюєте позицію:
«Я прийму тільки ті дані, що підтверджують мою тезу.»
У такій рамці вести технічну дискусію дійсно непросто.

Ви зараз підміняєте метрики.

Це єдині тверді метрики які доступні і на які можна спертися. Коли людина заявляє що ШІ евангелісти ігнорують цифри і факти, я хочу побачити про які цифри і факти річ. Но вони в упор не хочуть їх приводити так як їх немає а ті що є, їм не зручні, доводиться оправдуватися що «мільйони мух не можуть помилятися»

Якщо єдиною «твердою» метрикою вважати графік підписок, то будь-який хайп автоматично стає технічним прогресом.

Це єдині тверді метрики які доступні і на які можна спертися.

Ні. Це єдині метрики, які легко порахувати ззовні.
Метрики SDLC (cycle time, leakage, rework, verification cost, throughput) існують і давно використовуються в інженерній практиці. Просто вони:
— контекстні
— дорожчі у зборі
— і не зводяться до одного красивого числа
Саме тому adoption-графіки всюди, а реальні delivery-метрики — у внутрішній аналітиці команд.

І вище я писав — дані по нім неоднородні:
— Microsoft/Accenture field experiments (Copilot): більше PR/тиждень (що саме по собі ще не гарантує покращення end-to-end delivery)
— GitHub Copilot lab study: ізольована задача → швидше
— METR RCT: досвідчені OSS-деви на знайомих репозиторіях → повільніше (без узагальнень)
— Anthropic research: піднімає питання skill formation/deskilling (не productivity, але вартий згадування)

Це не «хейт» і не «хайп» — це нормальна картина молодої технології з сильним розкидом ефектів.

Якщо ж заздалегідь оголосити всі такі вимірювання «незручними», то будь-яку дискусію справді можна звести до графіка підписок 🙂.
У такій логіці ми давно живемо в утопії, бо за adoption та revenue:
— StackOverflow ще у 2010-му мав підняти якість коду до небес
— Jira — зробити команди надпродуктивними
— low-code — прибрати технічний борг як клас

Я не говорю що вони в принципі не існують. Я говорю в контексті ШІ, що неможливо виміряти. Все дуже залежить від інструментів які використовуються, досвід роботи з інструментами, мотивація. Ти можеш робити роботу швидше, но зарекордити той самий час, просто читати реддіт замість того, щоб брати наступну таску.

Всі доступні «дослідження» рахують якусь середню температуру по лікарні, прирівнюють людину яка написала кілька десятків промтів і у якого агенти паралельно рутину роблять (яких одиниці в любій компанії), до людини у якої промти в стилі «зроби мені ААА без помилок», до людини яка взагалі ШІ не використовує, максимум безкоштовний чатгпт замість гугла (і таких більшість в компанії).

Я говорю в контексті ШІ, що неможливо виміряти.

Якраз навпаки — це можливо виміряти.
SDLC-метрики існують саме для того, щоб прибрати суб’єктивщину рівня «хтось пішов читати Reddit». Вони дивляться на системний вихід, а не на те, чим конкретний дев займався між комітами.

Ви праві в іншому: ефект від AI дуже неоднорідний і сильно залежить від контексту, рівня команди і зрілості процесів. Саме тому серйозні експерименти і показують розкид — від помітного бусту до нульового або навіть негативного ефекту в окремих сценаріях.

Але з цього випливає не те, що «неможливо виміряти», а те, що не існує одного універсального числа, яке доведе користь/шкоду AI для всіх команд одразу.

Якщо ж заздалегідь оголосити всі такі вимірювання «незручними»

точно так же, если их объявить единственно верными и не подлежащими сомнению. а в период бурного роста и изменения новых технологий, как раз к прошлым измерениям и нужно относиться с подозрением и отдавать преимущество сиюминутным, самым свежим результатам.
о чем тут неоднократно говорилось.

точно так же, если их объявить единственно верными

Я поки що бачив переважно спроби спростувати саме ті дослідження, де AI показує неоднозначний або слабший ефект. Зворотну картину — щоб хтось системно ігнорував або заперечував дослідження з позитивними результатами — я, чесно кажучи, тут не спостерігав.
Але ок, припускаю, що такі кейси можуть бути — я теж не читаю абсолютно всі коментарі в треді 🙂.

отдавать преимущество сиюминутным, самым свежим результатам

Якраз у цьому і проблема: по-справжньому нових контрольованих досліджень поки що небагато — принаймні я їх не бачив у достатній кількості. Те, що зараз масово циркулює в обговореннях — це переважно self-report або вузькі lab-задачі.
Вони корисні як сигнали, але слабкі як узагальнювані висновки про end-to-end продуктивність у реальному SDLC.
«Найсвіжіші результати» в таких умовах зазвичай мають найбільший шум.

Якщо цікава особисто моя позиція: я не стверджую, що ефекту немає. Я стверджую, що якісна картина поки що дуже неоднорідна — і це нормально для молодої технології.

Вже мільйон раз пояснювали. Взагалі поняття контексту в сучасному агентському воркфлоу де стейт і пам’ять зберігається в файлах і де активно юзаються сабагенти з чистим контекстом — дуже розпливчисте.

Ні, не пояснювали. Описували ефекти. Це не пояснення.

Ого... виявляється, написати промпт «claude, spawn multiple engines»... це таємне знання, доступне лише 5-6 професіоналам?

Ти написав промпт, але ти зробив це без поваги... ;)

Навіщо платити більше, якщо джун може

Стратифікація такого типу, різна оплата за однаковий результат джуномідлосинйорам, виглядає як умовно скажімо бізнес ідею по оптимізації витрат. Про саму цінність чи здатність вирішити яку-небудь задачу — стратифікація сама по собі не говорить.

По-перше, Solow productivity paradox це 1987 рік

Там 1 в 1 причини і наслідки.

Інструмент доступний всім, потребує лише навичку спілкування на рідній мові, чому роботодавець має платити більше?

Ясно, ще один з досвідом юзання чату гпт для генерації SQL скриптів який думає що в нього є досвід agentic development)

є досвід agentic development

Як на мене, тут поки не з’явилось принципово нових вимог. Індустрія й раніше знала, що інваріанти, контракти і контекст мають бути винесені в артефакти. Просто з появою agentic tooling це перестає бути nice-to-have і стає операційною вимогою. У зрілих командах цей зсув виявився радше еволюційним, ніж революційним — звідси, ймовірно, і такий розкид практичного досвіду.

І мені поки не зовсім очевидно, які саме принципово нові передумови додає agentic підхід на рівні окремого інженера. Швидше зросла ціна неявності та неповного контексту, ніж з’явився якісно новий інженерний скіл.

Швидше зросла ціна неявності та неповного контексту, ніж з’явився якісно новий інженерний скіл.

Скіл на рівні як TDD + пайплайни писати.
От років 5 тому на хороших проектах питали як ти б робив TDD і давали відповідний лайв кодинг, тепер дають лайв кодинг з умовою що можна юзати агента

1. Немає безвідповідального використання. Є спроби адаптувати потужну недетермінову технологію в детерміновані бізнес процеси і робочі воркфлоу методом проб і помилок так як ніхто не знає як правильно, но тим, хто робить це правильно, у них не виникає сумнівів в корисності технології.

2. Нова модель просто вирішує більш складні задачі з меншою кількістю промтів, Ось і все. Не треба додумувати. Задачі вирішувалися і з старими, тільки з більшою роллю людини.

3. Про яку позицію і які прогнози річ?

Немає безвідповідального використання. Є спроби адаптувати потужну недетермінову технологію...

Я б тут не погодився з категоричністю. Справді, індустрія зараз активно вчиться вбудовувати стохастичні моделі в детерміновані процеси — це факт.
Але на практиці вже накопичилась достатня кількість кейсів, де відсутність guardrails призводила до цілком конкретних проблем: від сліпого копіпасту згенерованого коду в прод до використання некоректних або галюцинованих конфігів. Називати це виключно «адаптаційним шумом», на мою думку, занадто оптимістично.

Нова модель просто вирішує більш складні задачі з меншою кількістю промтів...

Так, якість моделей зростає — зокрема, зменшується обсяг prompt babysitting з боку інженера. Але сама по собі поява нової моделі не обнуляє автоматично попередні емпіричні спостереження по продуктивності і не гарантує миттєвого ефекту на рівні реального SDLC.

если столяр раньше сверлил дырки ручным буравом, а взяв электродрель, просверлил себе дырку в ноге, то кто виноват? столяр или дрель с электричеством?

просто не нужно наделять AI coding агента какой-то субъектностью, все результаты его работы — плохие и хорошие, принадлежат исключительно оператору агента. и проблемы появляются либо потому что workflow не соблюдаются, либо потому что workflow еще не созданы и не апробированы. та самая адаптация.

условный Claude Code — это инструмент, скорее индивидуальный, чем коллективный. и его действие — это amplifier, усилитель. у кого все хорошо с процессами — у тех все хорошо с Claude Code. а AI slop в репо стали заливать ровно те, кто и раньше говнокодил.

а кто из акробатов виноват что один разбился? тот кто прыгал или тот кто ловил?

ты же знал что страховку иногда не используют чтобы поднять ценность трюка?

если столяр раньше сверлил дырки ручным буравом, а взяв электродрель, просверлил себе дырку в ноге, то кто виноват?

Аналогія частково працює, але є ньюанс масштабу. Радше сказати «просверлил себе дырку в ноге дуже швидко тисячі отворів, з яких невелика частка — у неправильному місці.»

плохие и хорошие, принадлежат исключительно оператору агента

Це занадто чиста модель. Звучить логічно і з тезою про AI-amplifier я загалом згоден, але тут ігноруються системні ефекти. Власне, стаття підкреслює вплив нової динаміки, якої не було раніше: багато змін одразу, зміни виглядають правдоподібно, помилки просочуються через рев’ю та накопичується дрібний дріфт.
AI не приніс принципово нових типів помилок — змінився характер їх розподілу. Генерація суттєво здешевшала, а вартість верифікації — ні.

У результаті зміщується вся error surface: багато правдоподібних змін заходять у репозиторій швидше, ніж процеси встигають їх якісно відфільтрувати. Саме цей розрив і починає системно впливати на якість — навіть у командах із формально налаштованим workflow.

Інструменти для верифікації навіть кращі ніж для кодинга. Тут проблема у воркфлоу, щоб грамотно в процеси втулити. У мене кілька агентів і кілька моделей консенсусом код ревьювлять. Вони не ідеально працюють перевіряючи чистоту дизайну і коду, так як це субєктивно — дизайн гарний для одного, но оверінжінірінг для іншого, но вот з точки зору регресії фунціоналу, слідуванням специфікації, багів, дир — перевірять краще більшості сінйорів.

Тут просто фунціоналу стало більше, розробка пришвидшилась, тому і абсолютна кількість багів виросла. Взяти того ж краба, в світі до АІ розробка зайняла би років 2 командою із кількох чоловік, всі баги б розтягнулися на 2 роки. Тут же чувак зробив за пів року і всі баги висипались відразу. І складається враження що там дира на дирі, хоча реально нічого катастрофічного немає, лише косяк з конфігурацію бази із великого. Но з точки зору якості коду, там звичайний код тієї ж якості який би писали руками 2 роки.

Сіньор код ревью роблять якісне тільки на доу в коментарях, в іншому випадку трехба ходити іще перевіряти після них бо зазвичай або клікають аппрув і похрін або утсраюють срачі на якихось таки тупих питаннях, так що цей процес також має встановлюватись через інженерні практики та контроль ліда архітекта, ну і шкіряні мішку куди більш недетерміновані ніж ші. Забув, недопив кави, думав про цицьки і нажав аппрув...Насправді код ревью це частина процесу мінімізації технологічних ризиків/incident та частина інженерної культири в проекті, таке не зробишь з допомогою скулілів/інтсрукцій/промптів. А якщо ваша контора росте швидко то це стає іще більшою проблемою, а якщо вона при цьому іще трансформує процеси то в квадраті, а якщо ваша контора змінює аудит систему то це вже в кубі складніше, останні 2+ роки дуже багато часу витратив на це, у продуктовій конторі з декількома командами, аутсорс плюс інхаус.

Тобто навчити людину робити якісне кодревью це робота, навчити робити команду це багато роботи, зробити це процес сталим та стабільним це багато роботи і багато часу, бо неможна просто задати інструкції людям і вони все будуть памятати одразу.

В нас колись банально нейм конвеншени заняли в мене купу часу повторювати в чатах, хоча я писав прості людські доки і робив мітинг із записом відео :-)

Інструменти для верифікації навіть кращі ніж для кодинга.

З цим я частково згоден. За наявності щільного unit/integration покриття AI справді добре ловить явні регресії та функціональні баги.
Але моє зауваження вище було трохи про інше: контракти між модулями, складність подальших змін та повільний дріфт maintainability — тобто речі, які зазвичай проявляються вже на дистанції. Тут автоматична верифікація поки що менш надійна, ніж класичні регресії.
І коли швидкість генерації різко зростає, ці речі починають накопичуватись навіть при формально нормальному workflow — особливо якщо тестове покриття не ідеальне (а воно майже ніде не ідеальне; бо як казав мій перший техлід — а тепер і я кажу — неможливо завершити писати тести, можна просто припинити це робити).

І трохи оффтопом: використання кількох review-agent’ів може давати виграш, але на моїх петах кращий ROI поки що показувало інше — чіткі тестові сценарії на етапі planning і явно заданий DoD. Сам «консиліум» моделей частіше підвищував noise у post-review, ніж стабільно додавав signal.

Пішло перевзування

2025

x.com/...​/1990363106535776520?s=46

«Вот вам предсказание. 2026 год станет годом разочарования в ИИ.

Корпорации внезапно поймут, что массовое внедрение ИИ приносит не доход, а убытки. Прогресс развития ИИ существует замедлится. Акции Nvidia, OpenAI и прочих отреагируют падением.

TODO: Проверить в 2026.»

2026

x.com/...​/2024923138094489925?s=46

«И хотя у OpenAi проблемы, но Антропик и Гугл настолько перевернули ВСЕ, что этот мой прогноз не сбывается

Количество кода, написанного руками, упало с 70% до 5%

Производительно на многих тасках выросла в 3-4 раза. Где требования неочевидны и надо подумать головой на 30-40%»

Жаль всяким Бондаренкам та іншим ШІ дисидентами на ДОУ не хватить духу признати свої помилки, навпаки включать дурачка і будуть писати що завжди були за ШІ, просто були проти слоп ШІ коду який пушать в продакшн не компілюючи і не перевіряючи (ніхто так не робив і не робить, хіба що на персональних ноунейм проектах, но у них своя реальність).

Черговий свідок ШІ пузиря і ШІ слоп коду, який всіх вчив як скоро ШІ загнеться і як він руками буде виправляти навайбкодений код, а в результаті сам став вайбкодером і признав свою помилку, за що респект

т.е. просто рандомный чел с интернета?

Що значить рандомного? Такі рандомні, на думку місцевих гребців, які такі ж рандомні, якраз авторитети і все розуміють як все насправді, не те що тупі бізнеси і інвестори, які ведуться на хайп і роздувають бульбашку.

тупі бізнеси і інвестори, які ведуться на хайп і роздувають бульбашку.

Дот ком криза. Це ж вже було ©

Там рітейл бульбашку створив, рандомні домогосподарки, які несли гроші у всі дотком стартапи на ІРО

Ну це дійсно смішно. Я памятаю історію розробки ПЗ більше 30 років. Памятаю як люди ще писали великі проєкти на С++, Кобол. Сайти вручну верстали на голому хтмл. Кожен другий використовував бд «на файліках».
А потім зявились IDE, Делфі, VB, Java, C#. І людям РЕАЛЬНО в 10 разів стало простіше писати складні проєкти. Інтерфейси робили драгендропом а не рисували через віконну функцію.

Але тоді бульбашки не було, мовчки зрізали бюджети в 3-5 разів та делівири проєкти набагато швидше.

Зараз всраті ШІ єнвангелісти по всім дослідженням можуть розраховувати ну максимум на 50% прискорення розробки, причому за рахунок зниження якості ПЗ, але ринок акцій відправили в туземун.

Так так, бульбашки немає.

Вот тільки делфі прискорив кодинг інтерфейсу, причому не без компромісів, ШІ прискорив майже все — всі платформи, мови, кодинг, дизайн, планування, ревью, документинг, ресьорч, дебагінг, при правильному конфігуванні може робити частину задач автономно (фокус на словах «правильному» і «частину», а то через місяць всякі Бондаренко будуть мене цитувати ніби я заявив що ШІ може замінити всіх інженерів у всіх задачах)

делфі прискорив кодинг інтерфейс

То тобі троха потрібно матчастину почитати. Різниця між тим же С++, та Java й іншими. І інтерфейси там далеко не на першому місті.

мови, кодинг, дизайн, планування, ревью, документинг, ресьорч, дебагінг

Може ти розпиши типовий штат ІТ компанії, та визначиш кого ти оптимізуєш. Бо виявиться що кодінг на 50% покращили, а дизайнер та той що писав доки був в команді один на 30 чоловік.

бульбашки не було

чому не було, коли — т̶а̶н̶ц̶ю̶ю̶т̶ь̶ програмують всі — тобто коли в програмування йдуть всі з любим бекграундом, галери, etc, — то і є бульбашка, чим не gold rush програмування?

але ринок акцій відправили в туземун.

В гугл мітс появилась фіча перекладу, я говорю англійською а інша людина чує моїм голосом іспанську.

Це технологічний прорив, тому і акції ростуть)

Ah sí, que muy guay)

- хтось так — And here you are, function make_profit(argument), print it, make_profit(of over 100 dolares)
-- ШІ тренований на програмерах і багах — Y aqui esta, funcion generar ganancias, argumento, imprimir hay argumento, entonces hay mas de 100 euros
- хтось — Really, and what’s a profit?
-- ШІ транслятор — Me jodes? unos 20 verdes
- хтось — Que padre!

Одним словом контекстні фічі з лінгвокодотрансформаціями — аля «профіт» від різниці євро в долар та «are you kidding me, about $20» — можуть накрутитися до чогось не зовсім очікуваного у сприйнятті з перемішуванням стилів та контекстів. Як справиться з тим ШІ у meeting використаннях — певно питання досі відкрите.

От все хотів тебе спитати.
Ще до ШІ 50% мого коду писала сама IDE. Ну типу натискаєш дві кнопки далі автодоповнення.

Так от, наприклад я хочу написати пузирьок сортування.

Варіант 1. Я йду в IDE та мовчку пишу пузирьок на 10 рядків коду де більшість автозаповення, або взагалі його копіпащу з стековерфлоу.

Варіант 2. Я йду в клауд код, пишу йому абзац тексту, що мені потрібен пузирьок. Він пише той код, я трачу час щоб той код хочаб трохи зрозуміти та перевірити що він працює.

То в 1му випадку ми рахуємо що 100% коду написали самі. (Хоча насправді автодоповнення, стековефлоу, копіпаста)

В 2му випадку ми 3 хвилини тринділи в чаті з ШІ, чекали автогенерацію, перевіряли той код чи правильно він взагалі написав, перевіряли чи воно працює, але записали собі що 0% коду написали самі. Профіт.

Є реальні дослідження, без маркетингової шолупоні, що продуктивність або та сама, або в загальному делівері на середніх та великих проєктах виросла на 30% макс, якщо грамотно той ШІ інтегрували в процеси.

В 2му випадку ми 3 хвилини тринділи в чаті з ШІ, чекали автогенерацію, перевіряли той код чи правильно він взагалі написав, перевіряли чи воно працює, але записали собі що 0% коду написали самі. Профіт.

Є здоровий глузд, чуйка. Там де швидше руками — пишеш руками, там де ШІ — ШІ. Все просто.

Є реальні дослідження, без маркетингової шолупоні

Немає і бути не може. Ви або далі заголовку не читали або читали чиюсь криву інтерпретацію. Нормальні тулзи з’явилися лише в середині 2025, грамотно інтегрувати ШІ в процеси одиниці, хіба що самі ШІ компанії які всередині ганяють агентів і моделі задовго до релізу. В рандомних компаніях, тільки починається інтеграція ШІ в процеси і інженери тільки починають налаштовувати воркфлоу.

Розбуди коли нова ллм модель буде писати код хочаб в х3 рази краще, ніж моделі випущені рік чи два тому.

Тоді всі ці дослідження 2024-2025 року можна буде переглянути.

І да, дивно читати про «нє внєдрєно».
ШІ агенти в курсорах-копайлотах вже добровільно-примусово змушують використрвувати в майже всіх ІТ конторах 3й рік.

Ну тобто ти нічого не чув про агентський воркфлоу, про контекст інжінірінг, тулінг. Ти не знаєш що навіть старі моделі з сучасним агентами, які їх ганяють, працюють в рази краще.

Іншими словами ти дупля не відстрілюєш що таке сучасний ШІ для інженера, в твоєму розумнєіні це зайти в чат інтерфейс, вбити промт, отримати код, вручну вмержити кудись в проект. Таке було роки 2 назад, коли робилися «дослідження» на які ти посилається, но яке це має відношення в 2025, не говорячи вже про 2026?

Ну тобто ти нічого не чув про агентський воркфлоу

Та он навіть на доу вже кілька тем. Десь клауд поклав, десь збитків на 1.7 млн за 4 хв зробив. Агент від жпт відрізняється тим, що його меньше контролюють люди та бють по рукам коли творить якусь діч (OpenClaw привіт). Будущєє, нє ?

Интересно, когда AI не было, кого программеры винили за свои косяки?

Так було ж кілька тем про дири в лінуксі. Будущєє, нє?

в лінуксі. Будущєє, нє?

Make linux great again?

Сучасна «субпрайм-криза коду» виникає через те, що ШІ затоплює репозиторії гігантськими обсягами низькоякісного синтаксису, збільшуючи когнітивну складність на 39%. Ми часто плутаємо швидкість друку з реальною інженерною продуктивністю, змушуючи досвідчених розробників витрачати час на розплутування машинної складності замість створення цінності.

Традиційні фреймворки провокують появу «AI slop» (кодового сміття), оскільки ШІ схильний до галюцинацій та помилок при написанні тисяч рядків взаємопов’язаного процедурного коду.
Виходом із цієї кризи є перехід до декларативних Low-Code систем, де архітектура базується на метаданих та системі «Dimensions» (вимірів). ШІ набагато точніше генерує структуровані JSON-моделі, ніж складні алгоритми, що дозволяє автоматично вибудовувати інтерфейс та правила обробки даних без ручного написання зайвого коду. Такий підхід перетворює ШІ з ненадійного «автора тексту» на точний інструмент «друку» додатків, де логіка безпеки, валідації та розрахунків відокремлена від сценаріїв.

Завдяки функціонально-аспектному програмуванню (ФАП) обсяг коду скорочується у надцять разів, що робить його компактним та легко читабельним для людини. Це дозволяє уникнути технічного дефолту, оскільки більшість системи конфігурується в runtime, а людина завжди може легко перевірити та виправити стислу бізнес-логіку. Майбутнє розробки — це симбіоз ШІ та жорсткої архітектурної платформи, яка перетворює промпти на працюючі системи без накопичення когнітивного боргу.

Якщо це не працює для людей, то чому це має працювати для LLM? Проблема фіксу багів нікуди не зникає.

Якщо це не працює для людей, то чому це має працювати для LLM? Проблема фіксу багів нікуди не зникає.

Це дає змогу не генерувати AI slop, а генерувати чіткі та компактні декларативні специфікації, які стають прозорими «кресленнями» для системи замість безкінечних і структурно заплутаних процедурних алгоритмів. Такий підхід перетворює ШІ на інструмент точного конфігурування, де замість роздутого синтаксису він створює структуровані правила, що дозволяє людині легко верифікувати логіку та зберігати повний інтелектуальний контроль над продуктом. Завдяки скороченню обсягу коду у десятки разів баги перестають ховатися під шарами машинних галюцинацій, що зупиняє накопичення токсичного технічного боргу та забезпечує системну стабільність, недоступну при звичайному «вайб-кодингу» у традиційних фреймворках.

Вибачте але ви зараз все таки описуєте концепцію. Тобто — можливо те що ви описали — і є відповідь. Але поки що стверджувати що це буде працювати — зарано. Додатково — ви рекламуєте свою платформу. Може — вона допоможе, може ні. Індустріально чи хоча б якось більш менш масштабно — не доведено як ефективна відповідь. До того ж навіть концептуально не знімає питання — навчання інженерів, розрив циклу інженерного мислення і т.п. Особливо якщо припустити що ШІ код асистенти будуть застосовані по відношенню до таких лоу код платформ. Бо сьогодні в силу відносно не великого відсотку розповсюдження такої концепції — вона «гірше» покрита і ШІ код асистентами. Якби такі платформи домінували то вендори б таргетували саме іх і ШІ код асистенти би «робили» легше роботу з ними. І тоді взагалі — а в чому різниця?

В любій справі в нас є Виконавець та Інструмент. Зараз індустрія намагається максимально покращувати Виконаця (ШІ), ігноруючи інструменти та використовуючи все те з чим працювала людина. Але інструмент навіть важливіше покращувати ніж виконавця. Оскільки ми бачили багато прикладів з історії коли інструмент настільки спрощувався, що виконавець взагалі міг бути майже не компентентним, але завдяки покращеному інструменту робив дуже професійні речі.

Тож підсумовуючи. Так, на сьогодні ШІ погано пише код. Хтось думає що добре пише код.
Але коли покращать інструмент розробки, всі ті проблеми що в вас описані в статті будуть вже не актуальні. Умовно Шумахера (ШІ) будуть саджати не на Жигулі (купа токенів, складність, обмежений контекст, тяжкий ревью, когнітивне навантаження, багато багів і тд) а за Ферарі (Інструмент, Лов Код) і там буде повністю інший результат на складних проєктах.

Воно буде працювати. Тому що специфікація декларації простіша, шансів на помилку менше. ШІшечка доволі непогано повторює структури декларацій, навіть незнайомих, бо це «натурально» для тих принципів, на яких вона побудована.

А це ненатурально для людей?

Натурально, але тут в ШІшечки більше шансів принести справжню користь без серйозних наслідків для системи в цілому.

Все одно розривається інженерний цикл в голові. І все одно ШІ це стохастична коробочка. Щоб іі навчати — треба багато датасетів і ти її як не навчай — вона завжди буде на аутпуті частково брехати. Тобто видавати той самий тех борг. Можливо якщо це нормально поєднати з створенням корегуючого зворотнього звʼязку то запрацює. І можливо його «простіше» створити для лоу код підходу. Так само як сам такий підхід — можливо частково зменшить процент галюцинацій. Але — це все «там можливо і сям можливо» незрозуміло сьогодні, а питання створення нормального корегуючего зворотнього звʼязку — взагалі не вирішене.
Так то ідея жорсткі декларації — це покращення. Але не гарантія в силу самої специфіки що таке ЛЛМ.
І це у нас виходить одна з причин проблеми — з одного боку в тебе «вимирають» за часом досвідчені розробники якщо ШІ кодить, з іншого вони мають перевіряти і корегувати її роботу. Але якщо вони вимруть то нема кому це робити. А ще ця коробочка не детермінована, тобто в тебе в принципі нема гарантій що коли подаєш один і тот же інпут що ти отримаєш однаковий завжди аутпут. І відповідно — нема бектрекінгу. Якщо в тебе звичайний код, і не працює формула А+B=C ти побачивши код — розумієш де зламалось і що виправити в коді. Якщо ми делегуємо це вже ЛЛМ — як повезе. І людина в цьому ланцюгу втрачає розуміння — а що і як мені треба виправити на вході щоб отримати очікуваний вихід. І це працює по різному в залежності від моделі, вендора, залежить фіг знає від чого і т.п. Це все натуральним колдунством залишається виходить. Або принципово міняти своє мислення і вчитися будувати софт на таких стохастичних блоках та з помічниками, завжди розуміючи чітко — воно бреше. Кожен аутпут — потенційна брехня. А от щоб вже на це наважитись — треба чітко побачити переваги і РОІ. Не тільки перспективи. А доказовість того що це все має сенс. Бо те що воно перспективно — зрозуміло і так. А що якщо ми навіть в кейсі з ШІ код асистентами ще будемо 30 років «адаптуватись» і випускати нові моделі — поки заявиться РОІ? То навіщо це пересічному розробнику сьогодні тоді взагалі?

Щоб іі навчати — треба багато датасетів і ти її як не навчай — вона завжди буде на аутпуті частково брехати.

Це треба просто прийняти як додаткову умову та будувати процеси з урахуванням такої поведінки та негарантованості результату. Це не є проблемою, бо вирішується ця проблема шляхом валідації результату детермінованими правилами.

а питання створення нормального корегуючего зворотнього звʼязку — взагалі не вирішене.

В розподілених реактивних системах ситуація аналогічна. Ніхто не може точно сказати, що робить система в даний час. Але всі приймають це як належне, та будують додаткові механізми, щоб переконатися, що вона працює вірно взагалі. Там активно розвинути моніторинги, валідації, контрольні точки, та купа іншого.

Якщо ми делегуємо це вже ЛЛМ — як повезе.

Це працює з людьми так само. Довіряй, але перевіряй

треба чітко побачити переваги і РОІ

Немає зараз типових успішних прикладів впровадження ШІ в робочі процеси. Зараз йде процес адаптації. Треба просто почекати, допоки не буде набрано критичну масу помилок. Мене турбує більше не ROI а деградація продукта в цілому та небезпека, яку може нести неконтрольована зміна кодової бази. Це вбиє будь-який продукт навіть при позитивному ROI

Натурально, але не працює зовсім. Кількість low-code проєктів на рівні статистичної похибки. Чому LLM допоможе?

Ще раз, в цьому тексті ШІ можна легко замінити на розробника (джуна). Питання в тому, чому це не працює для людей? Людині теж простіше правити конфіги, ніж писати код.

Ще раз, в цьому тексті ШІ можна легко замінити на розробника (джуна). Питання в тому, чому це не працює для людей? Людині теж простіше правити конфіги, ніж писати код.

Чому не працює? Є купа прикладів де джуни створюють та розгортають доволі складні застосунки на лов код, майже нічого не знаючи про Computer Science.
Adalo, Bubble, Microsoft Power Apps, SeaTable, Wix, Weebly, Squarespace і багато інших.

Є купа прикладів де джуни створюють та розгортають доволі складні застосунки на лов код, майже нічого не знаючи про Computer Science.

Питань більше не маю.

Хотілось би побачити конкретні цифри і методи замірювання що ШІ доданий код нижчої якості в середньому по гітхабу. Як взагалі це можна виміряти? Як взагалі можна визначити код писала людина чи ШІ, і яка долі в пулл реквесті ШІ. Тільки зараз з’явилися акаунти ботів які пулл реквести щодня створюють.

Також, хотілось би побачити докази, що криво згенерований ШІ код добавлений саме в репозиторії, який мейнтейнить не тільки сам автор (ну щоб підтвердити гіпотезу що бідні сінйори вимушені зараз розгрібати ШІ код).

Короче ви прочитали жовті заголовки, деякі коментаріі тут, і створили собі зручну картину світу.

Уявімо що ми вже в 2035 році і існує AGI, який без проблем генерить код великого застосунку, з рівнем помилок середнього сініора.

Ти йому даєш промпт, він генерить код.
Наприклад це простий веб магазин, на традиційних технологіях це 50 мб сорців в архіві,
100 тисяч рядків коду.

Питання
1. Скільки токенів він має обробити ? Скільки коштувало щоб сгенерити 100 тисяч рядків коду ?
2. Як тобі проревьювити цей код, що там все вірно та немає помилок.
Нагадаю помилки можуть бути різного характеру — перформанц, архітектура, не допоняв вимоги і тд.?
3. Як цей код переписувати, якщо проєкт отримує різко півот, сквозну функціональність?

Тобто проблема не в ШІ, він буде з часом розумнішим, проблема в тому що він пише на традиційному стеку розробки.

Уявімо, що є тепер low-code. І твій магазин сгенерив знову ШІ. Але замість 100 тис рядків коду на Java/JS/TS/Bash/Whatever там вже 5 тис рядків декларативного коду і чиста архітектура.

1. Тобі це коштувало дешево, бо мало токенів опрацьовано.
2. Тобі набагато легше проревьювити цей код.
3. Тобі набагато простіше дописати/переписати цей код.

То є різниця ?

Чи навіть давай зробимо ще простіше, ти же ШІ євангеліст.
Беремо і задаємо твоєму улюбленому ШІ питання.

Як ти бачиш майбутнє розробки. Серед можливих варіантів:

Людина пише традиційним способом
ШІ пише традиційним способом
Людина працює у low-code середовищі
ШІ працює у low-code середовищі.

І отримуємо в будь-якій LLM приблизно такий вивід.

Я бачу майбутнє як еволюцію середовища, а не заміну ролей — і найбільш стійка модель виглядає так:

Людина пише традиційним способом — залишиться для ядра систем, інфраструктури, high-performance задач і нових фреймворків. Це не зникне, але стане більш нішевим і “архітектурним”.

ШІ пише традиційним способом — вже відбувається, але створює багато “AI-slop”: швидко, масштабно, з ростом когнітивного боргу. Працюватиме, але вимагатиме сильної верифікації.

Людина у low-code — стане масовим рівнем розробки для бізнес-систем, внутрішніх сервісів, MVP. Це знижує поріг входу і скорочує цикл створення продукту.

ШІ у low-code — на мою думку, це найбільш перспективна модель. Коли архітектура декларативна і обмежена метаданими, ШІ не “вигадує код”, а конфігурує систему в межах правил. Це зменшує складність і підвищує передбачуваність.

Ймовірно, майбутнє — це комбінація 1 + 4: людина визначає архітектуру та інженерні принципи, а ШІ швидко конфігурує систему в структурованому low-code середовищі. Тобто не “хто пише”, а “в яких межах дозволено писати” стане ключовим фактором.

Якщо проєкту не потрібна гнучкість і у вас стандартні вимоги, то навіщо тут взагалі генерація через ШІ чи low-code? Ми просто беремо вже готове Open Source рішення, яких на ринку 7000+. Вони давно написані, протестовані спільнотою і вирішують типові задачі з коробки.

А от якщо гнучкість реально потрібна, то жоден low-code цього не забезпечить. Будь-який серйозний крок вбік від закладених вендором шаблонів перетворюється на стіну.

Не кажучи вже про величезну проблему непорозуміння вимог. ШІ не ідеальний і регулярно криво розуміє бізнес-логіку. Шукати й виправляти архітектурні чи логічні баги в чорному ящику абстракцій low-code... це ще те задоволення.

Є вже універсальні лов-код які зможуть стати основною мовою комунікацій між ШІ та людиною. Пишеш що завгодно. Від лендінг пейдж до low-code на low-code. Рекламувати не буду, цей топік не про це.

Нехай це буде зрозуміле бачення, що очікує нас в майбутньому.

low-code виник досить давно, десь в 90-ті, якщо розглядати Visual Basic, Access, PowerBulder, та не став мовою комунікації між людиною та розробником, якщо не брати до уваги винятки на рівні статистичної похибки. Чому ми думаємо, що людині буде простіше домовитися з LLM, ніж з розробником? А головна проблема в тому, що з часом готових low-code блоків не вистачає, що перетворює розробку в пекло, як би розробники low-code платформи не переконували, що у них є блоки на всі випадки життя.

low-code виник досить давно, десь в 90-ті, якщо розглядати Visual Basic, Access, PowerBulder,

А як можна оцінювати технології по їх минулому?
ШІ теж 40 років тому був ніким. 20 років тому був ніким. 10 років тому був ніким.
А зараз є всім. Не можна всі технології міряти тим, чим вони були в минулому.
Минуле існує для того, щоб лише врахувати помилки, та зробити більш якісні технології.

Бо вирішення питань складності та кастомізації немає. А що революційно змінилося з тих часів?

Бо вирішення питань складності та кастомізації немає.

Є вирішення через CMDD
youtu.be/...​j-35M?si=UzS2Cy9EoX_Zpbki
youtu.be/...​yJ0zI?si=mrazpPjv95mSCuz

Також є бенчмарк RealWorld. Це спеціальна арена де більш як 100+ різноманітних веб технологій змагаються в написанні кастомного рішення.

fraplat.com/?tag=realworld

Розробка на лов код зменшує кількість коду порівняно з іншими веб фреймворками в 7-15 разів, а значить когнітивна складність для ШІ зменшується ще в надцять разів.

Єдина проблема, що такі рішення ще не розповсюджені.
Індустрія поки що грається в вайбкодінг та AI slop.
Але для нових технологій, що займуть масмаркет завтра а не сьогодні, це нормально.

RealWorld міряє стандартний CRUD, з яким LLM і так прекрасно впораються, де тут кастомність? Типові задачі. Теж мені, написати аналог medium це рокет саєнс. Але навіть оптимізація SQL, як на мене, low-код буде лише заважати, бо буде ховати деталі, які критично потрібні.

Розробка на лов код зменшує кількість коду порівняно з іншими веб фреймворками в 7-15 разів, а значить когнітивна складність для ШІ зменшується ще в надцять разів.

Такий код не містить когнітивної складності для LLM.

Але навіть оптимізація SQL, як на мене, low-код буде лише заважати, бо буде ховати деталі, які критично потрібні.

Вони критично непотрібні в low-code системах. Бо якщо тобі треба оптимізувати SQL з low-code системи, значить в тебе щось пішло не так. В low-code системах може бути складна реляційна архітектура даних, але доступ до неї з low-code системи буде через API чи RPC. Тому оптимізація можлива. Але, архітектура low-code систем не вимагає складних реляцій чи прямого доступу до даних. Там все лінійно й примітивно, більше схоже на NOSQL підхід.

Бо якщо тобі треба оптимізувати SQL з low-code системи, значить в тебе щось пішло не так

Дуже схоже колись казали про орм, але, як бачимо, потреба в написанні sql руками нікуди не зникла

ORM була мертвонародженою з самого початку. Такий собі франкенштейн від любителів натягувати ООП сову на будь-які глобуси.

Ну все ж таки в 90% orm працює, усілякі crud’и, адмін панелі, де нема конкурентності. А де вже user requests, та тисячі rps, там вже трохи думати треба.

Воно працює не тому що ефективне. Є багато прикладів в історії, коли технологія використовувалася через брак альтернатив. Але, коли вони таки зʼявлялися — швидко помирала. Один з найяскравіших прикладів — Adobe Flash. Хто про нього зараз згадує?

Блін чувак ну шо ти несешь? Ти хочеш сказати що возня із сирими скл і купа бойлеплейту краще ніж підключити пакет і мати можливість працюівати із скл данними одразу через колекції рантайму\мови із доменними моделями одразу?

Тебе вже зовсім попаяло? Я не знаю на чому ти пишеш але на дотнеті ніхто в здоровому глузді не несе таку маячню, навіть під кайфом ящо чесно не несуть.

Блін чувак ну шо ти несешь?

Давай спочатку почитаємо, що несеш ти...

Ти хочеш сказати що возня із сирими скл і купа бойлеплейту краще ніж підключити пакет і мати можливість працюівати із скл данними одразу через колекції рантайму\мови із доменними моделями одразу?

Архітектури бувають різними. Прикинь. Не тільки такими примітивними, до яких ти звик. Для простих задач ORM вельми непоганий. Але, такі задачі закінчуються вже через рік розвитку продукту. І тут починаються труднощі. При зміні обʼєктної моделі треба мігрувати купу даних. Швидкодія деяких операцій вимагає оптимізацій за допомогою ручного написання SQL. Ні про які матеріалайзед вʼю ми взагалі мову не ведемо, бо це протирічить сутності ORM. Збережені процедури? Теоретично можно, практично — ні.

Є архітектури іншого рівня, коли структура даних оптимізована під швидкодію, назовні виставляється RPC API через збережені процедури. Вся бізнес-логіка зашита на стороні DBMS. При такому варіанті розробка та модифікація буде йти швидше, ніж з використанням ORM.

Тебе вже зовсім попаяло?

Те, що ти переходиш на особистості, каже про твою слабку позицію, брак знань та велике власне его. Окрім усмішки така поведінка не викликає.

Я не знаю на чому ти пишеш але на дотнеті ніхто в здоровому глузді не несе таку маячню, навіть під кайфом ящо чесно не несуть.

Мільйони мух не можуть помилятися. Я в курсі.

А тобі я дивлюсь подобається сцяти проти вітру? :-) В цілому рівень своєї ікспердизи ти вже показав ;-)

Ти не спростував поки що нічого з того, що я сказав. Називаючи себе вітром аргументованої розмови не буде...

Спростовувати навіщо? Ти ж все одного не розумієш і просто гнеш свою тупу лінію що от орм погане от ші погане...Як бабка на лавочці :-) Я не збираюсь бабкам розказувати про щось нове, бо вони хочуть говорити які усі шльондри та тупі а от у їх часи! :-)

орм погане

Покажи мені складний проект з використанням ORM, в якому

  • Немає проблем з продуктивністю
  • Немає проблем з міграцією даних
  • Немає жодного рядку коду SQL
ші погане.

Ніколи не казав, що ШІ — погане. Має недоліки — так. Але погане — ніколи.

Я не збираюсь бабкам розказувати про щось нове

Твоє так зване нове, це давно забуте старе для мене.

Блін чувак ти намагаєся втягнути в болто померлого бо зна коли холівару котрий закінчився тим що всі юзають орм. Ти десь у десятих застряг чи шо? Онукам цій байки будеш розказувати.

Твоє так зване нове, це давно забуте старе для мене.

Ти просто окрім сторої призми погляду вже нічого немаєш, тому усе будеш бачити в старих кольорах.

що всі юзають орм.

Не всі. Не треба перебільшень та маніпуляцій.

Ти десь у десятих застряг чи шо?

Це, по ходу, ти застряг в світі SQL та RDBMS...

Ти просто окрім сторої призми погляду вже нічого немаєш

Знову цей пафос? От скажи мені, навіщо тобі ORM (Object-Relational Mapping) для, скажімо, MongoDB? Або для ElasticSearch?

ORM для еластіку, ти щось приймаєш? Ти в курсі взагалі що це таке? ))))))))) Прям безнадьога скажи? ))))

Ніколи не казав, що ШІ — погане. Має недоліки — так. Але погане — ніколи.

Да буквально годину назад:

Оптимізація лайна не робить продукт цукеркою.

Ця фраза настільки загальна, що може примінятися до будь-чого. Я не можу бути проти ШІ, бо використовую це постійно.

Тут або два Шпака пишуть, або у тебе роздвоєння особистостей. В одній гілці критикуєш ШІ і розказуєш що користі немає і буст продуктивності бачать лише ШІ евангелісти в своїх рожевих снах. В іншій пишеш що сам постійно використлвуєш (мазохіст?) і що ШІ має невеликі недоліки.

Якщо неуважно читати написане та не думати про те, що тобі кажуть опоненти, то так буде й здаватися. Моя позиція не змінилася. Можу повторити, якщо вона до сих пір незрозуміла.

Я розумію недоліки ШІ в поточному його стані розвитку та не вважаю, що ця технологія зможе істостно допомогти мені персонально в написанні коду (через власні розробки які не мають прямих аналогів в доступності, щоб ШІ зміг хоч якось ефективно робити). Але, при всьому цьому є купа інших задач, в яких ШІ показує набагато більшу ефективність навіть без агентів.

Той факт що для тебе агент і ллм це те саме і дає такий самий результат говорить лише про те, що ти плаваєш на поверхності і взагалі не занурювався в агентський інжінірінг.

Тому пиши як є: мого досвіду з агентами поки недостатньо для побудови воркфлоу для ефективного вирішення моїх інженерих задач.

І не намагайся переконати тих, хто вже це зробив, потратив на це пів року і отримує дивіденди, що вони довбні. Це як доказувати велосипедистам що їзда на двох колесах неможлива і треба мінімум 3, бо ти спробував і коліна розбив.

Той факт що для тебе агент і ллм це те саме і дає такий самий результат говорить лише про те, що ти плаваєш на поверхності і взагалі не занурювався в агентський інжінірінг.

В них під капотом однакові LLM, які працюють за однаковими принципами. Те, що до «універсальної» LLM додали локальний контекст не змінює нічого в роботі LLM. Те, що агенти дають кращий практичний результат як й будь-який спеціалізований інструмент не є секретом Полішинеля. Я ж кидав вже приклад, проста задачка, згенерувати JOLT трансформацію для простого JSON’а. Якщо ти впевнений, що так звані агенти дадуть кращий результат, то можеш це мені довести за три секунди.

Тому пиши як є: мого досвіду з агентами поки недостатньо для побудови воркфлоу для ефективного вирішення моїх інженерих задач.

Мого досвіду достатньо, щоб переконатися, що жоден агент не зможе мені ефективно допомагати на даному етапі розвитку AI через брак вхідних даних, на яких модель можна було натренувати, та рівня похибки у векторах, які будуть робити результат гіршим за очікуваний. В мене не середньостатистичні формошльопські задачі на популярних фреймворках.

І не намагайся переконати тих, хто вже це зробив, потратив на це пів року і отримує дивіденди, що вони довбні.

Мені не треба буде це робити, за мене це зробить бізнес, який втратить черговий мільйон від помилки самовпевненого розробника, який не спромігся прочитати навайбкожене. Р — ризики.

Я ж кидав вже приклад, проста задачка, згенерувати JOLT трансформацію для простого JSON’а.

Це штучна задачка, яка до того ж легко вирішується мільйоном способів, но ти навмисне загнав агентів в вузькі рамки якоїсь ноунейм бібліотеки (JOLT).

В любому випадку, вирішується елементарно і просто. Якщо JOLT для тебе важливий і це основа твого проекту, то просто пишеш скіл для JOLT з прикладами типових трансформацій. Як пишеться скіл? Да тим же самим клодом (під клодом я маю на увазі клод код звісно), кажеш погуглити документацію для JOLT і зробити на її основі скіл. Можна context7 MCP сервер підключити, якщо бібліотека хоч трохи відома, вона там має бути.

Це базові знання агентського інжінірінга, які я накидав за 5 хв, які з легкістю справляється з твоєю задачкю. А ти навіть до цього етапу не дійшов і підняв лапки, і при цьому рахуєш себе професіоналом в агентській інженерії.

Мого досвіду достатньо, щоб переконатися, що жоден агент не зможе мені ефективно допомагати на даному етапі розвитку AI через брак вхідних даних, на яких модель можна було натренувати, та рівня похибки у векторах, які будуть робити результат гіршим за очікуваний.

Вот, черговий раз доказ що ти дупля не відстрілюєш різниці між агентом і ЛЛМкою. Агентський стек для цього існує щоб підсунути моделі недостающі знання, в твоєму випадку це знання про JOLT які підсовуються через скіли і context7 MCP сервер. Це базові речі agent and context engineering.

Мені не треба буде це робити, за мене це зробить бізнес, який втратить черговий мільйон від помилки самовпевненого розробника, який не спромігся прочитати навайбкожене.

Поки я бачу як летять акції IBM на 10% за день (тому що агенти змогли в кобол) і акції секьюрних компаній (тому що агенти успішно ловлять баги і дири)

Це штучна задачка, яка до того ж легко вирішується мільйоном способів

Саме про це я казав, що як тільки ми йдемо трохи в сторону від чогось популярного, якість роботи LLM стрімко падає. Це не є несподіванкою та передбачуване. Але, це суттєво починає впливати на прийняття рішень. Або використовувати тільки популярні та відомі LLM рішення, щоб отримати хоч якийсь буст, або змінити роль AI інструментів, щоб не попадати на генерацію непотрібу, помилки, переплати за підписки, тощо.

Якщо JOLT для тебе важливий і це основа твого проекту, то просто пишеш скіл для JOLT з прикладами типових трансформацій.

Це не просто. Треба буде надати сотні прикладів, а їх треба десь ще взяти. Було б просто — воно б працювало вже з коробки.

Це базові знання агентського інжінірінга, які я накидав за 5 хв, які з легкістю справляється з твоєю задачкю. А ти навіть до цього етапу не дійшов і підняв лапки, і при цьому рахуєш себе професіоналом в агентській інженерії.

Так де приклад трансформації? Ти накидав розумних слів, дай результат краще.

Та я ніколи не вважав себе професіоналом в агентській інженерії, я не розумію з якого переляку пан зробив такі висновки...

Поки я бачу як летять акції IBM на 10% за день

Хайп він такий... Акції під час доткомів ого-го як летіли... Спочатку вгору, потім вниз...

Та воно і в великих проєктах чудово працю а на якісь особливо складні запити або хранімку або сирий скл залишають і ніхто не їбеться як ідіот із сирими скл і купою бойлерплейту щоб мапити вхідні параметри із вебу та зворотнью із скл на доменні модельки. Я працював на таких проектах і не раз і не два, вигоди від сирого скл немає, ну хіба що ото скиглити що ділди в хранімках писали все і бізнеслогіку в тому числі і всем ок біло.

ділди

это же опечатка, да? 😂

RealWorld міряє стандартний CRUD, з яким LLM і так прекрасно впораються, де тут кастомність?

Не зовсім зрозумів. Не я цей приклад придумав.
RealWorld (conduit) це самий популярний бенчмарк на сьогодні в веб розробці серед кастомних фреймворків (82к+ зірочок на гітхаб).
Він чудовий тим, що якщо ти пишеш свою веб технологію, та хочеш її порівняти з іншими конкурентами, то просто пишеш свою реалізацію RealWorld та порівнюєш її з 100+ FE/BE/FullStack вже готовими реалізаціями на інших веб технологіях.

Мені, наприклад, більше подобається кастомний бенчмарк — написати лов код на лов код. Але ангуляр не пишуть на англуляр, а реакт не пишуть на реакт. Нема з ким цей рокет бутстрап порівнуювати.

Такий код не містить когнітивної складності для LLM.

Ну як мінімум LLM потрібно обробити в 15 разів меньше токенів (в 15 разів дешевше коштує), а людині в 15 разів меньше ревьювити коду.

Не зовсім зрозумів. Не я цей приклад придумав.
RealWorld (conduit) це самий популярний бенчмарк на сьогодні в веб розробці серед кастомних фреймворків (82к+ зірочок на гітхаб).

Сім сутностей, 20 ендпоїнтів, для трейні це тиждень робити на будь якому фреймворку. Про що взагалі можна обговорювати? За часи студенство на Delphi я б таке накидав за день. 82к зірочок вимірюють не якість бенчмарку, а кількість людей яким потрібен приклад як написати CRUD на фреймворку X. Це переважно студенти та джуніори на старті. Але це не дасть відповідей технологія поводиться коли проєкт росте роками, команда змінюється, з’являються нетипові вимоги, треба дебажити щось нестандартне, продуктивність стає критичною. А тут рівень лабораторної роботи: здав та забув.

Ну як мінімум LLM потрібно обробити в 15 разів меньше токенів (в 15 разів дешевше коштує), а людині в 15 разів меньше ревьювити коду.

Знову, тут треба дослідження. В агентних системах токени витрачаються переважно не на код, а на: системний промпт (інструкції, контекст, інструменти) який повторюється в кожному запиті, результати виконання інструментів (файли, виводи команд, помилки), історію розмови яка росте з кожним кроком, і роздуми моделі (CoT/thinking). Яку частку там містить код сказати складно.

Ще раз, не так страшні перші 90% проєкту, як 90% проєкту © Лао Дзи. Що ще раз доводить, що написання коду це ніщо у порівнянні з підтримкою. От якби low-code славилися тим, що підтримувати не треба... то всі б на них перейшли миттєво. Але досвіт тут прямо протилежний: швидкий старт та переписування з нуля

Ми просто беремо вже готове Open Source рішення, яких на ринку 7000+. Вони давно написані, протестовані спільнотою і вирішують типові задачі з коробки.

Звучить гарно тільки на папері. В реальності воно працює гарно певний час, потім бізнес виростає з «універсального» солюшина, та хоче кастомізації. І тут починаються вже справжні проблеми. Вирішуються вони шляхом закидання ресурсами.

А от якщо гнучкість реально потрібна, то жоден low-code цього не забезпечить.

Тут не згодний. Low-code побудований зазвичай на інших принципах, це не імперативні системи та підходити до них як до таких не можна. Вони доволі потужні та універсальні, хоча й вимагають трохи інших підходів при використанні. Там багато функціональщини, декомпозиція робиться за принципом покрокової модифікації вхідних даних, дуже багато конвейєрних операцій, чергування, роутинг, фільтрація, обʼєднання.

ШІ не ідеальний і регулярно криво розуміє бізнес-логіку.

В low-code системах це легко перевіряється. Ти кидаєш в мʼясорубку барана, на виході очікуєш фарш. Якщо це не так, змушуєш переписати.

В реальності воно працює гарно певний час, потім бізнес виростає з «універсального» солюшина, та хоче кастомізації

З OpenSource ці проблеми вирішуються, бачив неодноразово. А от з low-коду зазвичай це граблі, бо будувати нові блоки для елементарних задач це та задача.

res.cloudinary.com/...​/iusenuolbvu60qx5hqrx.png

Вони доволі потужні та універсальні, хоча й вимагають трохи інших підходів при використанні.
Ти кидаєш в мʼясорубку барана, на виході очікуєш фарш.

Ну чесно, якби це було так, то всі давно писали би на low-коді.

воно працює гарно певний час, потім бізнес виростає з «універсального» солюшина, та хоче кастомізації. І тут починаються вже справжні проблеми.

Це ж буквально про лоу код

Це про ваше розуміння того, що таке low-code

Причому, «історія вчить що нікого нічому не вчить».

Був колись гайп по DSL. Бо про обмеженість no/low-code відомо давно.
А гайп по DSL стверджував що:
для домену краще створити DSL,
а у майбутньому з’являться галузеві DSL

І стихло все, тому що виявлось
створення DSL не така вже проста штука.
а після створення ми все одно стикаємость з — «абстракції течуть», і є потреби, які неможливо описати на існуючому DSL. Його треба — розширювати.
і тд.

І от, ШІ знову витягує ту ж ідею:
а давайте для спілкування з ШІ створимо окрему, спеціалізовану, скорочену мову.
Якою ми опишемо — доменні, галузеві потреби...

І стихло все, тому що виявлось
створення DSL не така вже проста штука.

Мені здається що проблема було в дещо іншому. DSL розробляти люди, які роками жили в конкретній парадигмі розробки та намагалися будувати DSL схожим хоч на щось з того, чим володіли розробники на момент створення мови. Тому DSL більше схожі на RPC ніж на справжні Languages. Там де DSL давали розробляти не технарям — могли бути успішні приклади.

створення DSL не така вже проста штука.

Це типова пастка архітектора.
Якщо нам потрібно вирішити задачу Х, ми маємо її на 100% описати на DSL.

Але нам не потрібно її на 100% описувати на DSL.
Нам не потрібен абсолютно універсальний DSL.

Типове архітектурне рішення — ми пишемо 80% на DSL,
а 20% або кастомізація на звичайних мовах або інтеграція з сторонніми системами.

Уявімо що ми вже в 2035 році і існує AGI
Наприклад це простий веб магазин

а якщо буде AGI, то людям точно ще будуть потрібні прості веб магазини?

а якщо буде AGI, то людям точно ще будуть потрібні прості веб магазини?

Точно будуть потрібно, поки на руках є пять пальців, та зручно на тому ж телефоні мовчки дивитись картинки з товарами, свайпати та тапати.

Що завадить AGI створити мікропристрій, що буде зчитувати думки і передавати у смартфон? (якщо вже фантазувати про нездійснене, то чому рано зупинятися?)

чи змінтить людську свідомість так, щоб шкіряни мішки перестали цікавитися магазинами, бо AGI вирішить, що нехер засірати планету

Із нейроінтерфейсами бавився айбі єм іще в нульових, були прототипи, навіть в серіалі Доктор Хаус був такий. дорого і складно...але якщо заллють нормально грошима то і таке зроблять.

Факаплять. Ніхто не доводить іншого. Але, якщо бездумно використовувати технології, то шанси факапів будуть тільки зростати.

так крайнiм буде усе одно Вася, а не LLMка

хто отримає зарплатню, той і крайній

а нащо AI, якщо він так само факапить?
Ви (анонімні адепти-евангелісти) во всю піарите підхід «інженери не потрібні, запускай 50 агентів і кури бамбук поки продукт сам створиться».
А тут, виявляється, ніфіга не так, і адепти, як типові соціалісти (ваш братуха, дореч, у NY тіки шо сфейлився) — вигадують нову тезу «чому цей соціалізм поганий, а новий точно буде працювати».

Ви мене з кимось сплутати, я не євангеліст, хоча і юзер.

АІ факапить швидше 🤣

Добавлю трохи контексту, а то не люблять тут далі жовтих заголовків читати

Код писала і сабмітила людина, ніхто не знає яка там доля ШІ
Ця людина вайбкодить до 400 комітів в день Якщо один із 400 комітів глючний, то це дуже непоганий рейт, дай боже всім так
Код пройшов перевірку у аудиторів (людей)

Прям як у лікарів. Якщо вилікував — бог допоміг. Якщо помер — лікарі убили. Вот і тут — будь який цій баг, глобальний збій, на ШІ списують.

Код писала і сабмітила людина, ніхто не знає яка там доля ШІ
Ця людина вайбкодить до 400 комітів в день

Ну тобто якщо людина дай бг щоб вісім годин в такому режимі витримувала, то це трохи більше хвилини на комміт. Дійсно, і яка ж там доля ШІ в тому коді, прямо загадка століття...

Ця людина вайбкодить до 400 комітів в день

якщо працювати десь 10 годин, то це буде 1 комміт кожні 1,5 хвилини.
ця людина єбанута чи навіщо так себе не любити?

Код пройшов перевірку у аудиторів (людей)

Це взагалі нічого не значить. Люди могли просто неуважно підійти, бо задача була з високим когнитивним навантаженням, тому детально ніхто не вчитувався.

Ну да, машини ламаються, літаки падають, особливо в кривих руках при недбалому використанні і обслуговуванню. Одні і ті ж літаки в якійсь Уганді падають щороку, а в Австралії — раз в 30 років.

В чому новина? В тому що ШІ глючить? Ну так для цього і треба пів року щоб зрозуміти обмеження, прокачати чуйку, написати промпти, створити воркфлоу.

В чому новина? В тому що ШІ глючить?

В вартості помилки. Але до вас це не доходить поки що.

Ну тобто якщо один літак із тисячі падає, то всі мають пішки ходити? Чи як це працює в вашому світі?

Чи давай згадаємо скільки даних витрачалися через косяки людей. Чи ето другоє?

Плюс в даному випадку це збіг кількох обставин — глюка ШІ, кривості АРІ команди павершела, шкіряного мішка який дає автоматичний, повний доступ до критичних даних і запускає ШІ без сендбокса.

Ну тобто якщо один літак із тисячі падає, то всі мають пішки ходити?

Це така у вас логіка? Якщо літаки падають, то треба зважити ризики, прийняти міри для того, щоб не падало, щось заборонити, щось дозволити, протоколи поміняти. Зважити ризики ще раз, а вже потім, якщо ризики все одне високі, тоді вже пішки ходити. До того моменту, поки знову ризики не стануть прийнятними.

У мене логіка що ризики і втрати допустимі якщо переваги їх перекривають.

Тим більше допустимо, де ризики мають пряму кореляцію з кривизною рук користувача, де він шкодить лише собі.

У мене логіка що ризики і втрати допустимі

Не для людських життів. Навіть для грошей це працює до певного часу, поки шкода не вбиє компанію.

Ну так можна і випадково нажати кнопку видалити, чи переплутати диск для форматування і шо? Чи хочеш сказати ти ніколи не помиляеся коли скрпити пишешь?
Чи ти одразу запускає усі скрипти на проді? Чи в тебе завжди відкрити вікно з адмінськми правами для виконання скриптів на прод базі?

Так можна було сказати що програміст дав скрипт і він випадково не той слеш поставив і тепер у кліента видалені всі файли а в ньойго через це інфаркт, висновок — програміст вбив клієнта, вони терористи.

Вже перейшов на повністю жовті заголовки та статті в стилі «вчений ви\їбав кореспондента». Безнадьога як вона є ))))

Ну так можна і випадково нажати кнопку видалити, чи переплутати диск для форматування і шо?

Можна. З дуру можна й прутня зламати. Але одна справа, коли ти це робиш сам, а інша — коли за тебе це робить хтось чи щось. Розмова не про те, чи помиляються люди чи машини, чи ні. А про наслідки помилок та шанси їх виникнення.

Але одна справа, коли ти це робиш сам, а інша — коли за тебе це робить хтось чи щось.

Та ні, різниці немає.

Яка різниця чи це джун зробив багу чи АІ?

Неправильне запитання. Мова йшла про різницю між власними помилками та помилками інших, яким задача була поставлена. Неважливо хто чи що зробило помилку.

А іще недавно люди встановлювали віруси і віддавали авторизаційні коди та вводили паролі усим підряд. І шо? Видалили браузери? Операційні системи і перейшли на дос чи ассмеблер?

Мене цікавить як вона доробилась до такої посади🤦‍♂️

Ти думаєш всі директори мусять розбиратися у всьому тому, що роблять їхні підлеглі, або навіть більше?

Хоча б мінімальне розуміння ризиків мало би бути.

Погоджуюся та не погоджуюся водночас. Погоджуюся, що не всі ризики були прораховані та не вжито всіх заходів до того, як було видане завдання (зроблений бекап). Але заходи таки було вжито, дана інструкція ШІшешці, що нічого видаляти не треба. Але, якщо подивитися на ситуацію з іншого боку, то людина була явно в запарі, що захотіла якось впорядкувати роботу. Це не каже нічого про людину, скоріше про той пресінг, який є в компанії.

res.cloudinary.com/...​/ufozde4wyps1p2ss46en.jpg

Глибоко в тилу нашого Штірліца затримав ворог. Він так і не міг здогадатися — що ж його видало. Чи то будьонівка, яка зʼїхала на бік, чи то купол парашута, який понуро волочився за ним.

Прикольно, коли просю Сонет накидати план подальших дій, воно пише простирадло. Через 2 дні читає те, що саме і написало і каже, що тут якась куйня написана 🤣

Скоро дійдем до того, що на роботу будуть брати тільки тих, хто може хоч щось написати робоче без ШІ

скоріш булоб — виправити-підправити ШІ написане, або супроводжувати написане з ШІ (хоча і не думаю що то у найближчій перспективі та — тільки тих)

Після "

Claude 3.5/3.7

далі не читав. При наявності зараз 4.6 та 5.3 всі метрики вже давно застаріли.

Звісно, бо експерименти швидко не робляться.

В 2028 пан Богдан буде казати «Після 4.6 та 5.3 далі не читав, при наявності 6.7»

В 2028 такії питань як тут обговорюються не буде))

ШІ-оптимісти такі оптимісти)

В 2028 пан Богдан буде казати «Після 4.6 та 5.3 далі не читав, при наявності 6.7»

І буде правий)

Цікаве питання для дискусії на підставі дослідження Anthropic, яке я наводив нижче.
Дослідження показало, що джуніори перестають вчитися, якщо працюють з LLM. Мова йшла про конкретні скіли (наприклад, Python), але разом із ними раніше програміст роками розвивав ще й інженерне мислення.

Диплом — це лише папірець. Справжнє інженерне мислення формується в процесі кодингу, коли ви постійно вирішуєте задачі. Цей процес триває роками, десятиліттями.

А як це працюватиме, коли ми перестаємо писати код і розуміти його? Через промпти?
Тут є велика різниця. LLM — це стохастика. Щоб отримати робочу відповідь, часто треба не «глибше зрозуміти проблему», а просто «переформулювати запит». Це вчить нас підбирати ключі до чорної скриньки, а не будувати системи.

Порівняйте два процеси:

Коли ви думаєте самі (Інженерний цикл):
— Чітко формулюєте проблему.
— Шукаєте і конструюєте способи рішення (гіпотези).
— Пишете реалізацію.
— Тестуєте.
— Якщо результат незадовільний — ви змушені пройти весь ланцюг заново, знайти помилку у власній логіці й навчитися.

З LLM (Операторський цикл):
— Ви спитали.
— Воно щось відповіло.
— Запустили.
— Якщо не працює — просите перегенерувати.

У другому випадку випадають критичні ланки: формулювання проблеми не прокачалося, створення гіпотез не відбулося, розуміння причинно-наслідкових зв’язків («чому не працює?») замінилося перебором варіантів.

Звісно, тут «сиві та чубаті козаки» можуть пригадати минуле і сказати: «Та це ж вже було!». Коли переходили на мови вищого рівня абстракції, коли з’явилися IDE, або взагалі — коли відмовилися від перфокарт.

Але є фундаментальна відмінність. В усі часи попередніх технологічних зламів цикл Проблема → Гіпотеза → Рішення → Перевірка → Бектрекінг залишався незмінним. Інструменти змінювалися, але тягар побудови логіки лежав на людині.

А при цьому зламі — здається, ламається саме він. Ми вперше делегуємо не інструмент, а сам процес мислення.

Коли переходили на мови вищого рівня абстракції, коли з’явилися IDE

Приклад-аналогія з ide не дуже, вони практично зразу з початку 90х були (тобто якщо не брати вже занадто доінтернетовські часи десь з есемок), з однієї сторони нп з turbo/borland c+pascal і не згадаю чи взагалі можна було поза ide працювати, потім з unix то стало зазвичай не звертати на то увагу, а зараз нп nvim то ide чи не ide — хз. Плюс до того — відповідний «ide» функціонал часто розмазаний поза звичайними редакторами. Тобто відносно відповідного інструментарію в цьому плані — ні по революційності змін ні по масштабу тих змін, — не дуже проглядається як аналогія.

По масштабу -можливих- змін і пов’язаними з тим суперечками відносно умовно ментальної «деградації» — в історії існує інша аналогія, але вона скоріше в корзину ші-ентузіазму вийде.

Я з вами згоден частково — просто такий аргумент наводять. Комусь і вім досі саме те що треба. Особливо з плагінами. А я колись багато взагалі писав «наживо» прямо із міднайт командеру. І руцями запускав компіляцію з командної строки. Так, я був колись диким юніксоідом, чи лінуксоідом, здається перепробував тоді все що хочеш. Але не чисте програмування, а скоріше інтеграційні задачі + колупання в ядрі щоб запустити якусь дичину, редагування 2ічного коду бінарей, адаптація сирих сорсов під різні ембедед системи через шрут середовище і т.п. + хард кор адмінство всього що тільки під лінукс та юнікс тоді було, включно з підняттям лан провайдеру для не великого міста(з друзями під пиво). Тобто — може поява ІДЕ не такий зсув. Але мало сенс перерахувати щоб пояснити що всі такі приклади не релевантні з іншої причини.

Аж спогади нахлинули. Генту, лфс. На компіляції драйверів генту — спалив тоді якимось чином відяху в своєму першому «ігровому» ноуті. Як так вийшло — досі не розумію бо де компіляція та сбірка драйверів а де відяха? Скоріше за все це все таки був дефект конструктивний заліза. Або саме мій драйвер і спалив відяху:)

мало сенс перерахувати щоб пояснити що всі такі приклади не релевантні з іншої причини

Спробую за ші-ентузіазм зіграти з можливою аналогією: — якщо розглянути таку зміну як винахід writing-reading і поява книжок. І достатньо відомі суперечки відносно reading-writing та негативного впливу змін з тим пов’язаних на власні можливості (нп скептицизм Plato on writing, memory, and understanding). Які в цьому випадку аргументи можуть бути — що з ШІ з часом не таксамо буде?

О це ви правильно копнули(за межі ери компʼютера), капелюх в пол. Мені треба подумати. До того ж час сімейного вечірнього серіалу. Не думаю що наші Ші євангелісти до такої відповіді б дійшли. Дякую

А це сильний хід. І у ньому на мою думку дійсно є щось фундаментальне.
Якщо я правильно розумію, ви натякаєте на деякий паттерн у технологіях:
— письмо — боялись втратити пам’ять, натомість здобули трансформацію передачі знань
— друкарство — знання знеціняться, натомість ми отримали їх демократизацію
Але тут є ньюанс. Письмо просто фіксує думку, воно не створює нову.
ШІ з свого боку — генерує рішення, пропонує структуру, а іноді підміняє сам процес мислення.
Тобто коли порівнюємо письмо та ШІ ми порівнюємо зовнішню пам’ять та зовнішне мислення (не певний, що це гарні терміни, але ліпших мені щось не придумалось).
Тобто аналогія з письмо валідна, на мою думку, але вона не гарнтує безпечного результату. Тут усе залежить від обраної стратегії. ШІ може радикально її підсилити.

Вся справа в нас — людях; і я не хочу робити песимістичні висновки. Просто поставлю риторичне питання: скільки людей обере режим «відповідь тут і зараз», замість спитати «а які варіанти ми можемо застосувати»?

ви натякаєте на деякий паттерн у технологіях: ...

Про конкретизацію у прикладах не думав, але так — все як завжди пов’язано з трейдофс, аналогія в тому що: — можливо втрачати якісь природні можливості, але отримувати значно більш з тим що приносить винахід.

Факти з трейдофс важко заперечувати, і зазвичай фокусуються на чомусь одному — чи що втрачаємо, чи що отримуємо. Тобто все відносно балансу з тим: будемо щось втрачати — так, чи надбання чогось (враховуючи трейдофc) отримаємо достатні — назараз можливо недостатні ще, з ШІ-розвитком надалі — можливо так.

Вся справа в нас — людях; і я не хочу робити песимістичні висновки.

Зараз звичайний хайп значною мірою супроводжує все що пов’язано з ШІ (як завжди коли з’являється щось нове і достатньо суттєве), а коли туман з ним трохи розсіється — можна буде тоді щось конкретніше побачити по результатам. Тобто у мене позиція поки досить проста — хай ентузіастами (і не тільки) технологію відполіровують — почекаю, потім може більше оптимістично-чи-песимістично на можливості використання дивитися буду, а поки мінівикористання можливостей як ШІ-браузера цілком задовольняє).

Я вам напишу розгорнуту відповідь пізніше, все ще сімейний час але я покрутив вашу тезу в голові. Коротко — якось воно буде і буде як і завжди «нормально». А розгорнуто буде пізніше. Такі діалоги для мене — золото. Дякую ще раз. І до речі — нам з вами треба було почекати на відповідь адресатів все таки:)

треба було почекати на відповідь адресатів все таки

на мене то зовсім немає потреби у відповідях чи сперечатись з «адресатами» — то особливо нікому і не адресувалося, так одна з аналогій була що згадалась

Тобто у мене позиція поки досить проста — хай ентузіастами (і не тільки) технологію відполіровують — почекаю, потім може більше оптимістично-чи-песимістично на можливості використання дивитися буду,

Позиція логічна, я так робив в свій час з noSQL чи k8, але потім все одно прийшлось вчити.
Бо мінус такого підходу що без знань нового (чи «хайпового») є велика ймовірність залишись без роботи (принаймі хорошої).
Тому хочеш 3 квартиль Джині (що зараз $7к+) => треба вчити і пробувати хайпові штуки. Щоб могти розгорнуто відповісти зі свого досвіду на питання «плюси і мінуси X, коли використовувати X vs Y».
За цей досвід, експертизу, і готові платити вище ринку.

Бо більшість завжди пасивна. Тому більшість не пробує АІ, хіба що на рівні чатГпт.
За відносно невеликі зусилля (менші за здачу сертифікації) можна отримати суттєву перевагу на ринку праці.

Щось схоже було на початку 201Х з клауд сертифікаціями.

Щоб могти розгорнуто відповісти зі свого досвіду на питання «плюси і мінуси X, коли використовувати X vs Y...

От я начеб-то і погоджуюсь із загальнним напрямком думки. Але вся біда в тому, що порівнювати «X vs Y» у цьому контексті, це як порівняти самовар та паровоз — теоретично можна, але на практиці я не бачу у цьому особливого сенсу.

Знову ж, я маю наголосити, що не мав змоги користатись ШІ на комерційних проєктах; але з того, що робив для власних петів — сетап не сильно-то масштабується, і кожен окремий кейс потребує індивідуального підходу.

Та і свої «найжирніші» проєкти я витягав за рахунок софтскіллів і знання домен специфік, а не якихось конкретних інструментів/практик.

«X vs Y» у цьому контексті, це як порівняти самовар та паровоз — теоретично можна, але на практиці я не бачу у цьому
особливого сенсу.

Наприклад, в нас проект зробити інтернет магазин, адмінку доставки, товарів, модуль ціни і знижок, інтеграції з A, B, C.
Чи вартує юзати АІ, якщо так то для чого і в якому обсязі?
Які тулзи, як буде виглядати робота.

Цілком норм питання, де тут самовар і паровоз?)

що не мав змоги користатись ШІ на комерційних проєктах

Як і переважна більшість тут. Але замість того щоб попробувати виправдовують свою лінь)

Я мабуть не дуже вдало висловився. Спробую пояснити.

Чи вартує юзати АІ, якщо так то для чого і в якому обсязі?

Це має бути визначено на етапі system design, якщо по-хорошому. А відповідь залежить від купи факторів, як то наявність публичного API у сервісів для інтеграції, кастомер флоу і кількості розвилок у цьому флоу, тощо. Тобто відповіді на два абсолютно ідентичних хай-левел описа, можуть бути діаметрально протилежними.

Оце я мав на увазі, коли казав що не бачу особливого сенсу у порявніні X vs Y. Ми підлаштовуємо сетап під проєкт, а не викручуємо проєкт під сетап.

А якщо це питання на рівні окремого дева — не бачу в ньому сенсу тим паче: хоче — най користується, не хоче — най не користується.

Тобто відповідь на два абсолютно ідентичних хай-левел описа, може бути діаметрально протилежною.

Так на інтерв’ю очікується що ви ці питання задасте, або зоча б скажете «з мого досвіду, якщо А то Б, якщо С то Д».
А як це зробити якщо досвіду немає)

А свої проекти того досвіду не дадуть) так само як свій проект не зробить з джуна за кілька років сіньора

на інтерв’ю очікується що ви ці питання задасте,

Так це очікувалось... Не знаю, скільки себе пам’ятаю, я їх ставив, де вони були доречні.

«з мого досвіду, якщо А то Б, якщо С то Д»

Я ж як раз про це і кажу. Цей досвід з LLM — він не переноситься.
Хіба що я по колу буду гастролювати по проєктах-конкурентах, що виглядає як непоганий план (це був жарт, коли що — не треба так робити).

Кожен проєкт потребує окремого аналізу. Але щоб сказати це, мені навіть відос на YouTube дивитись не треба =D

Хіба що я по колу буду гастролювати по проєктах-конкурентах, що виглядає як непоганий план (це був жарт, коли що — не треба так робити).

Мене один раз переманювали конкуренти, було дуже круто попасти на «такий самий але інший» проект.
Наступний теж хочу так, вже навіть конкурентів нагуглив в своєму місті)

Наприклад, в нас проект зробити інтернет магазин, адмінку доставки, товарів, модуль ціни і знижок, інтеграції з A, B, C.

Невже немає нічого готового?

Та таких «проєктів» мішок та маленький возик.

Невже немає нічого готового?

На це питання ми маємо відповісти на етапі system design.
Тут ШІ може допомогти з чернеткою, проте особисто я показую найліпші результати за допомогою whiteboard, кольорових маркерів та кружки з кавою.

Знову ж, я не маю особистого досвіду з інтернет магазинами, але з того, що розповідали колеги я зрозумів, що 9 з 10 можна скласти з блоків умовного WordPress з подальшим «допрацюванням».
А от для етапу цього допрацювання, попередній досвід вже не має великого значення. Кожен раз це буде штучний продукт.

9 з 10 можна скласти з блоків умовного WordPress з подальшим «допрацюванням».

Ну так, можна.
І не тільки у WordPress.

я його і навожу як метафору:
джун каже що зробити інет магазин у вордпресі — 3 години.
досвідчений — не менше тижня, а зазвичай менше 2 не виходить.

Зараз кажуть, що завдяки ШІ можна викинути отой SaaS для ланцюга постачання, і згенерувати за 2-3 дні своє.

ну або — ШІ збільшить продуктивність програміста у x10 і ті.

Джун каже, за 3 години зробить...

Та куча сервісів для такого.
Але для співбесід інтернет магазин, таксі (убер), доставка з ресторанів, це все хороші топіки бо будь хто має досвід як користувач і розуміє про що йде мова.

Невже немає нічого готового?

Звісно що немає, і не може бути.
Кожен інет магазин вигадує — свої знижкі.

Те саме стосується фільтрів по товарах.

Є — ліби, фреймворки, платформи для цього.

Ну так вони ж для всього є.
То навіщо і до ШІ було стільки програмістів?

Взяв лібу, фреймворк, платформу, для свого домену, щось там десь у конфіг дописав про дрібні свої особливості, і все.

Чим взагалі займаються міліони програмістів останні десятиліття?
Незрозуміло...

Не знаю... я таким не займаюся...

а це стара проблема у наших айтішних дискусіях.
вперше для мене її висвітлив Спольскі у «П’ять світів».

Зараз їх більше. мінімум на два — мобайл розробку тра додати, та використання ШІ у продуктах (RAG, ШІ агенти для користувача, обробка інформації за допомогою ШІ, ...).
А, і ще, третю, геть окрему — ML, DataScience

А раніше з нею стикнулася наука:
радіофизик з ядерним фізиком — не взмозі зрозуміти один одного.

так і в нас — програмісти з різних світів мають ну зовсім різні проблеми, буття. А ще ж впливає — на якій ролі програміст, у якого розміру компанії, проекті...

зараз це проявляється:
один каже: та в мене ШІ вже майже все робить!
другий відповідає: та не може бути, воно ж, те ШІ дурне геть, щоб щось робити.

радіофизик з ядерним фізиком — не взмозі зрозуміти один одного

це звідки твердження? і зрозуміти в чому саме

только вчера был собес. продуктовая компания, команда — 26 человек (всех в производстве, включая QA). все сеньоры, джунов нет. все активно пользуются Claude Code, кто-то Cursor. есть свои пайплайны проверки кода. проблем нет. все эти мифические когнитивные выгорания, сеньоры с красными глазами после ревью миллионов строк говнокода и прочие ужас — отсутствуют. что они делают не так?

что они делают не так?

Ніхто не каже, що вони роблять щось не так. Хай продовжують.

Це правильна і глибока аналогія, давайте спробуємо цей напрямок дискусії розвинути. Те, що ми спостерігаємо зараз — це злам, який за масштабом не порівняти ні з появою IDE, ні навіть з інтернетом. Це щось фундаментальніше, що змінює саму «тканину цивілізації».

Але в аналогії з Платоном і появою писемності є один критичний нюанс. Коли з’явилася книга, яка робила такий серйозний зсув, вона інфільтрувалася в суспільство дуже повільно. Письмо розповсюджувалося тисячами років. Це було природним фільтром для людства: час давав можливість на швидкості людського мислення зрозуміти технологію, відфільтрувати негатив і використовувати тільки користь. У наш час — особливо після появи інтернету — зміни такого масштабу можуть розгорнутися на все людство за лічені роки, майже миттєво. При цьому швидкість нашої думки та біологічного осмислення не прискорилася так кардинально. Ми просто не маємо цього буфера часу.

Крім того, є принципова різниця в тому, що саме ми делегуємо:
1. Писемність/Книги (External Memory): Це дозволило нам винести Дані на зовнішній носій. Це був пасивний інструмент. Щоб отримати знання, людина мусила прочитати, інтерпретувати і синтезувати інформацію. Писемність звільнила наш мозок від запам’ятовування, щоб ми могли краще думати.
2. ШІ (External Reasoning): Це вже не пасивна пам’ять, це активний агент. Ми делегуємо йому не зберігання, а саму Обробку (Inference).

Якщо ми віддаємо машині і Пам’ять (Google), і Мислення (LLM), то що залишається оператору? Тільки «Воля» — бажання отримати результат. Але воля без розуміння процесу — це магія. Ми ризикуємо перетворитися на шаманів, які просять духів (LLM) про дощ, абсолютно не розуміючи метеорології.

Може здатися, що все це якась філософія, далека від реальності. Але я хочу нагадати кінець 90-х і появу інтернету, бо саме схожі відчуття я маю і сьогодні. Зрештою, для нас тоді все впиралося саме у філософію (white hat / black hat). Ми вчилися витягувати з мережевих протоколів, операційних систем, заліза та софту те, що розробники й вендори від нас приховували, і що ці речі «з коробки» робити взагалі не вміли. Тобто саме філософія та бажання докопатися до суті були рушієм для розвитку інженерного мислення. Звісно, в деталях ці речі сьогодні публічно і розказувати не можна, але саме той гарт змушує зараз дивитися на «чорні скриньки» з такою пересторогою.

Щодо вашої тези — почекати, поки шлях проторять ентузіасти — це розумно. Але і самим ентузіастам хочеться сказати: будьте обережні. Романтизм першопрохідця, яким зараз лихоманить всю нашу індустрію, має інший, зворотний бік. Першопрохідці зазвичай тільки в романах були першими в нових садах Едему — в реальності ж вони часто ходили по кістках тих, хто йшов туди до них і не дійшов.

І все ж, історія нас вчить тому, що людство якось переживало такі злами — і врешті-решт набувало кращої якості. Тому я думаю, що коли ми вийдемо на це нове плато — все буде добре. Але це не означає, що цей період турбулентності не буде іти рука об руку із серією криз.

Я трохи розмірковував про це з іншого кута, і в мене є есе на англійській про перехід від стабільності «Книги» до невизначеності «Дзеркала». Сподіваюсь, вам сподобається:
medium.com/...​and-the-book-0085eb181cfa

Після цього діалогу та на підставі коментарів розумію, що є сенс написати більш розгорнуту версію цих думок. Резюмуючи все сказане: сподіваюсь, що ми, людство, пройдемо цей етап, максимально оминаючи лиха та катастрофи. Саме тому публічний діалог зараз вкрай потрібен. І я сподіваюсь, що ми переживемо це по-людськи.

Ми вперше делегуємо не інструмент, а сам процес мислення.

Менеджери цим займаються вже давно)

А в чому прикол того ШІ.
В інтернеті мають бути більше в 100 разів статей ?
Має бути в 100 разів більше відео та рілзів?
Має бути в 100 разів більше веб сайтів в інтернеті, в 100 разів більше відео іграшок ?
В 100 разів більше сгенерованих картинок ?
Більше книжок ?
Хто це все має читати, дивитись, використовувати.

Вони зараз кажуть що їм треба 10 гігават електроенергії на датацентри.

Вибачте, але ШІ поступово займає нішу крипти. Там вже тіж самі токени, та безглузді підрахунки хешей за гігавати електроенергії.

Ну тут є відповідь — парадокс Джевонса. Про те що коли чогось стає більше і воно стає дешевше — то збільшується споживання. Тобто більше контенту і ціна його створення стає меньшою — більше споживають. Але можуть бути і якісь природні обмеження для цього споживання. А от чого сьогодні не вистачає для ШІ — це саме РОІ доказового. Навіть в якості ШІ код асистентів. Якщо перечитаєте коменти — то практики тут наполягають на тому що «ім стало так зручніше» та «вони відчувають що стали швидше». А як щодо РОІ? Якщо ви стали на 300 процентів більш продуктивним то чому не стали на 300 процентів багатшими? Де велью? Не платять? А чому? Може бо і бізнес для якого ви створюєте продукт — не отримує більше грошей. Тоді куди поділась ця продуктивність в ланцюжку створення цінності? І чи не відбувається таким чином девальвація коду да і все? Бо юзер продукту за стрімкий розвиток продукту і переваги над конкурентами — платити то готовий. І якби це відбувалося — То і грошей би практики вже заробляли значно більше. Дослідження теж показують змішану і не зрозумілу картину. РОІ не видно ні в практиці, ні в звітах аналітичних толком, ніде. А от що точно росте — це інвестиції в самих вендорів. Тут факт. Але і там — нема РОІ

чому не стали на 300 процентів багатшими

ну вот я, например, второй месяц уже как взял парт-тайм и закрываю его на 30 часов в неделю. и это плюс к фуллтайму. и еще делаю свой проект. да, стал богаче. и все успеваю, не выгораю, у меня семья и двое детей, спортзал и досуг. и все это потому что стал на те же задачи тратить времени меньше, чем раньше. подписка за 100 долларов на Claude Code себя полностью оправдывает. уверен, другие тоже могут такой опыт подтвердить.

остынь. тебя уже несет в твоем крестовом походе против AI.

ну вот я, например, второй месяц уже как взял парт-тайм и закрываю его на 30 часов в неделю. и это плюс к фуллтайму. и еще делаю свой проект. да, стал богаче. и все успеваю, не выгораю, у меня семья и двое детей, спортзал и досуг

учитывая то что сумма часов превышает количество часов в неделе, то ты просто не загружен на столько сколько репортишь, но в этом нет заслуг ии, это ремоут дает. без ремоута ты бы просто в офисе торчал без задач

+ питання росту персональних навичок які дозволили взяти 2 роботу. Бо за 3 роки скіли то теж виросли — і не повʼязані з Ші. Я знав людину ще в 2011 яка працювала програмістом на 2 роботах роками. Одна робота була в офісі а друга віддалено — людина вигрібала за рахунок експертизи. Не показник

нет, это дает именно AI. потому что я ровно тот же скоуп задач делаю быстрее. считай, что у меня де-факто сдельная оплата.

без ремоута ты бы просто в офисе торчал без задач

но я не в офисе. да и в офис бы не пошел. последний раз в офисе работал 15 лет назад.

если ты думаешь что отрицанием и личной позицией сможешь перебить факты, то нет, не сможешь

бугагага та ви тут вже неділю тільки цим і займаєтесь )))) а от «факти» ось зараз пишуть\дебажать\деплоять код.

я это не отрицаю, а личную позицию я почти никогда не говорю. так что нет, я уже все «воскресенье» не этим занимаюсь

Це якесь дивне викривлення. Я використовую ШІ, всі кругом хто кодить використовують ШІ, вчора наприклад тільки обговорювали з колегою як опус поплив на задачі повʼязаній з оптимізацією памʼяті і вже 40 хвилин ганяє токени де людина досвідчена написала би 5 строчок коду за 2 хвилини. Хоча в іншому кейсі — можна реально зібрати за 3-4 години пруфік з нуля, на який пішли б тижні. Але це ж персональний досвід. І зовсім не означає що на рівні команди, компанії, або індустрії — вже є РОІ або не росте ТСО. Чомусь люди плутають доступні дані і метрики і своє власне «мені подобається», «мені зручно» та «мені здається я став швидше». Тобто я не знаю розробників сьогодні взагалі — хто б цим не користався, нема таких. Хто ці міфічні розробники які сьогодні не подивились коробкове рішення яке їм обіцяє робити частину їх роботи за них? Де вони ховаються

Хто це все має читати, дивитись, використовувати.

Жарт ще з 2023 року:

Джон просить ШІ написати емайл, з наданих 5ти тез.
Сара отримує ємайл, і просить ШІ переказати його зміст у 5ти тезах.

Свіже дослідження від антропік дропнуте на арксів на тему того як Ші впливає на продуктивність і здатність до навчання працівників.

Резюме
“Our main finding is that using AI to complete tasks that require a new skill reduces skill formation.”

“Contrary to our initial hypothesis, we did not observe a significant performance boost in task completion in our main study.”

“Participants who fully delegated...tasks showed some productivity improvements, but at the cost of learning...”

“We find that AI use impairs conceptual understanding...without delivering significant efficiency gains on average.”

“Together, our results suggest that the aggressive incorporation of AI into the workplace can have negative impacts on the professional development of workers if they do not remain cognitatively engaged.”

arxiv.org/abs/2601.20245

Коментувати не буду:)

Але можна побудувати «radical negative frame». Ті, хто сьогодні женуться за хайпом бездумно — перетворюються на AI code monkeys і Іх ціна на ринку — копійки. Паралельно з цим відбувається ще і модель колапс. Злітає до неба ціна тих хто оминав хайп, ставився відповідально, розумів що треба кодити руцями теж і робити код ревью построково і обмірковано і відповідно — не розучився інженерії і програмуванню. В першу чергу іх купляють за великі гроші самі вендори — щоб створювати нові мови програмування, навчати моделі і продавати ринку ці рішення, ринку на якому більшість це — AI code monkeys. Найбільш дорогий скіл — вміти програмувати на рівні «весь продукт з нуля без АІ взагалі».
Альтман в твітері про це не розкаже, бо саме такий стан ринку — золота мрія будь яких вендорів. Дати ринку цінність додаткову за яку платять — це теж ім цікаво. Але якщо вийде просто створити максимальною залежність, так щоб майже жоден програміст через 10 років не зміг писати код не спалюючи токени — це ще більш вигідна схема. І більш проста.

Можна навіть назву цій моделі дати — Deskilling as a Service (DaaS).

Завтра це буде доступно хоч на екрані смартфона, хоч на смарт-годиннику — все для вас. Тільки не переставайте палити токени і деградуйте з комфортом.

Зі статею згоден, але з вашими висновками ні=)

Очевидно що потративши менше часу на імплементацію будеш менше знати про систему.
Та сама проблема коли сервіс робили одні люди, а супортають інші. Чи коли новий тім мембер приходить в команду.
Фіксається це документацією, гайдами, тестами.

Злітає до неба ціна тих хто оминав хайп, ставився відповідально, розумів що треба кодити руцями
Найбільш дорогий скіл — вміти програмувати на рівні «весь продукт з нуля без АІ взагалі».

Звучить як мрії адміна на початку 201Х, що от ті всі девопси з їхніми тулзами стануть не потрібні а ті хто вміє рахувати маску мережі і обжимати кабелі, от ті стануть на ціну золота)

На то вона і еволюція що завжди треба йти вперед

Фіксається це документацією, гайдами, тестами.

Мені краще кодова база.

Мені краще кодова
база.

Та код завжди буде доступний, але з коду не зрозуміло хто і для чого його використовує.

Тому я завжди добавляю перших два рівні С4 діаграми для кожного сервісу і «чіт код» сторінку з основними кверями до кібани, як і де деплоїти і т.п.

Теж мені тайна... Простий grep дає відповідь. А історія git ще каже хто написав та навіщо.

щось типу `git blame -cC <file> + git show <commit>`
а grep?

Простий grep дає відповідь

Grep по чому?
Це може бути сторонній сервіс не в нашому репозиторії.

Наприклад для сейлів які поацюють в Salesforce юайці ще підтягуються додаткові дані з твого сервісу.

grep по всьому, що є в наявності. Наші модулі ядра окремо, ядро Linux Kernel окремо, драйвера вендорів окремо. Зазвичай у тебе буде або repo зверху, або сабмодулі або... Ну а grep тому що IDE зазвичай лагають, коли сирцевого коду більше гігабайту. Не думаю, що з web сервісами це буде складніше.

Я не робив висновків. Я описав «radical negative frame»

на тему того як Ші впливає на продуктивність і здатність до навчання працівників.

Навчанню джунів (50 чоловік) без особливого досвіду використання ШІ, на одній 30хв задачі (заюзати бібліотеку яку раніше не юзали)

В якості ШІ використовувався чат інтерфейс (навіть не агент) з gpt 4o (іншими словами продвинутий гугл а не ШІ)

Не знаю яке це має відношення до продуктивності. Хай візьмуть сінйора, з клод кодом якимось, з налаштованим воркфлоу (промти, скіли, сабагенти) з досвідом активного використання ШІ хоча б пів року і порівняють зі звичайним сінйором без ШІ. І порівняти на різному класі задач — скільки фіч заделівирив, скільки багів закрив, скільки код ревью зробив, скільки сивих волосин з’явилося.

Хай візьмуть сінйора, з клод кодом якимось, з налаштованим воркфлоу (промти, скіли, сабагенти) з досвідом активного використання ШІ хоча б пів року і порівняють зі звичайним сінйором без ШІ. І порівняти на різному класі задач — скільки фіч заделівирив, скільки багів закрив, скільки код ревью зробив, скільки сивих волосин з’явилося.

А якщо того першого сініора ШІ своїми галюнами, або кривими промптами намагався втопити в купі нагегерованого коду, який не мав багато сенсу, та зробив лише болото яке неможливо заставити нормально працювати.
Тоді що? Хто виграв?

Мені здається ви не зрозуміли принцип змагання. Це нормально — я також не одразу ухопив суть.
Якщо сіньор з ШІ показує гарний результат — то от дивіться, як метрики підскочили. Якщо поганий — то це профнепридатний сіньор, і його рахувати не будемо.

профнепридатний сіньор

Цього ніхто не приховує, навіть більше, цього сіньйора ще і звільнять пізніше

Сінйор генерує код і вирішує задачі, які відповідають його рівням компетенції і адекватності. Тулзи які він для цього використовує на якість результату не впливають.

А у випадку з ШІ, впливають лише з позитивної сторони — мінімальна якість задана самим інженером, так як він перевіряє і самбітить результат роботи, а вот максимальна якість необмежена. Мене ШІ безліч раз спасав від багів, ейдж кейсів, недопрацювань прямо перед комітом. Чи знаходив на ревью баги, які я упускав.

Іншими словами, з допомогою ШІ неможливо заделівирити гірший результат ніж якби ти робив сам. А вот кращий — легко.

Іншими словами, з допомогою ШІ неможливо заделівирити гірший результат ніж якби ти робив сам. А вот кращий — легко.

Влучне зауваження. Але воно працює лише тоді, коли вже є експертиза, яку людина отримала шляхом самостійної роботи. Якщо умовний джун буде використовувати тільки ШІшечку, то експертизі просто не буде жодної нагоди зʼявитися. Тому в середньому код буде гірше, ніж в досвіченого розробника, який може побачити недоліки запропонованого ШІшечкою коду та переписати його.

Іншими словами, з допомогою ШІ неможливо заделівирити гірший результат ніж якби ти робив сам.

Угу, планова економіка не може бути гірше ринкової. Але... Щось не дуже вдавалося. А так у мене це досить часто, бо довіряєш...

мінімальна якість задана самим інженером, так як він перевіряє і самбітить результат роботи

Це справедливо лише за припущення, що інженер встигає перевірити все, бачить усі ризики і не піддається automation bias.
Рев’ю згенерованого коду — це інший когнітивний режим, ніж його конструювання: ти працюєш реактивно, оцінюєш, а не вибудовуєш рішення з нуля. Глибина занурення може бути нижчою.
AI часто підвищує планку, але не виключає можливість деградації результату.

а вот максимальна якість необмежена

AI не має повного бізнес-контексту і довгострокової стратегії системи. Його «максимум» обмежений даними навчання, промптом і заданими архітектурними рамками.

Тулзи... не впливають...
А у випадку з ШІ, впливають лише з позитивної сторони...

...
Якщо інструменти не впливають на якість результату, то AI як інструмент також не мав би впливати. Якщо ж впливають — то вплив не може бути гарантовано одностороннім.

забавно спостерігати як бекенд і фронтенд обговорють ШІ. Користувачі React ніколи в житті не бачили систем у котрих усе вище сказане присутнє. Помилки на фронтенді виправляються у наступному релізі, помилки на бекенді можуть зайняти місяці, а інколи навіть роки на виправлення

Навіть було опитування де фронтендери позитивно говорили про ШІ, а бекендери ставились більш скептично.

Навіть було опитування...

Не чув про таке. Але навіть якщо так, то здається ми маємо справу здебільшого зі статистикою.

На фронтенді стек відносно стандартизований (кілька домінуючих фреймворків і типові патерни).
На бекенді — значно більша варіативність: мови, фреймворки, архітектури, інтеграції, доменні моделі, legacy, тощо.

Тобто у BE середовищі, для LLM банально більший простір зробити помилку, і більше довгострокових наслідків.

Не знаю яке це має відношення до продуктивності. Хай візьмуть сінйора, з клод кодом якимось, з налаштованим воркфлоу (промти, скіли, сабагенти) з досвідом активного використання ШІ хоча б пів року і порівняють зі звичайним сінйором без ШІ. І порівняти на різному класі задач — скільки фіч заделівирив, скільки багів закрив, скільки код ревью зробив, скільки сивих волосин з’явилося.

если бы все делали эксперименты как ты описываешь, то человечество все еще бы без колеса сидело у костра

Виталий, как обычно, занимается манипуляцией фактами)

объясняю на пальцах: Антропики взяли 52 джуна, разложили на 2 группы, дали им ИИ ассистента и сказали им вначале написать код с неизвестной либой, а затем объяснить, как все работает.

те, кто полностью положился на ассистента, не справились потом с отладкой и пояснением — они не понимали код, так как ассистент сгенерировал его за них. что как бы, логично.

лучше всех справились те индивидуумы, которые пользовались ИИ для объяснения кода и формирования своего понимания. что тоже, как бы логично.

эти паттерны взаимодействия с ИИ неоднократно в этом и соседних топиках, разъяснялись опытными людьми: что бездумное «accept changes» не дает хорошего результата, что нужно диффы просматривать, что нужно с Claude Code изучать кодовую базу и ассистент в этом очень помогает. ну тоже вполне логичные и понятные вещи.

непонятны и нелогичны только выводы Виталия! но, если принять за рабочую гипотезу о том, что у Виталия в Девелопекс работает много джунов, которых продают за ставку сеньора глупым иностранцам (обычная бизнес-модель украинской галеры), то все становится на свои места.

Виталий справедливо понимает, что попадает в ножницы: с одной стороны, его джуны по времени/стоимости не смогут конкурировать с сеньорами, вооруженными современными ИИ ассистентами. с другой стороны, раздача своим джунам Claude Code мало чем поможет. остается только волать на форумах о надвигающемся Model Collapse и о заговоре технократических элит.

вот так мы видим, как под неумолимым натиском прогресса начинается схлопываться пузырь украинских арбитражников в сфере программирования.

хорошо это или плохо? не имеет значения, потому что это неизбежно. ты либо адаптируешься, либо умираешь. адаптироваться — значит учиться. новым навыкам, новым приемам. AI ассистент тут в помощь.

эти паттерны взаимодействия с ИИ неоднократно в этом и соседних топиках, разъяснялись опытными людьми: что бездумное «accept changes» не дает хорошего результата, что нужно диффы просматривать, что нужно с Claude Code изучать кодовую базу и ассистент в этом очень помогает. ну тоже вполне логичные и понятные вещи.

Вибач, але це така ж х*ня з іделіазованого світу, як типу пишіть SOLID, GRASP, DRY, читайте доку, пишіть тести ...
На практиці це буде гівнокод від джунів, які навайбкодили і заделіверили. Гігантський технічний борг. Гігантський когнітивний борг. Бо хз як воно працює та як його пачініть. Під навалою всього цього рештки сеніорів, які ще вміли писати руками, втратять свій скіл.
Як результат — купа ще більше глюкавого ПЗ, яке «майже працює».

На практиці це буде гівнокод від джунів, які навайбкодили і заделіверили

...рев’юваю код після ШІ.
непогано, просто — отут 5 важких рядків видалив.
чого? ну. він же ШІ, документацію читає сракою(все йому написано, і який фреймкорк, і MCP і там все є).
І флоу не розуміє, що от виклик валідатора наступним рядком, призведе до того що те поле яке він так старанно чистить з боді реквесту — буде викинуто валідатором.

Ну як джун короче. Ти йому скільки документації не дай почитати, все одно — джун поки. з роками тільки навчиться...

Як на мене Віталій каже те ж саме, що і ти тільки іншими словами. А от твоя нездорова захопленість ним тільки смішить. Звісно це просто моє оціночне судження.

Питання не в тому що пише і цитує Віталій, а в тому, як він інтерпретує і подає.

Ось у простої людини, яка прочитає його коментар, з словами які він використав, і цитатами які він взяв із статі, складеться враження, що: «навіть сам антропік признав, що ШІ не підвищує продуктивність їх працівників і навпаки робить їх тупими». А якщо самому почитати саме дослідження, то там зовсім не так.

Але хто піде по лінку читати дослідження? Натомість через місяць, будуть переказувати друг друга через зіпсований телефон і писати: «Так було ж дослідження самого антропіка що ШІ не особо то їм і допомагає і навіть заважає». А коли попросиш привести посилання саме на таке дослідження з саме такими висновками, буде тишина, бо важко привести послання на «десь бабка сказала» (неодноразово таке було).

Переказують вже більш як півроку про “x10 інженерів”, про — “я за день роблю роботу яку раніше робив за тиждень”, про “я написав програму за тиждень, яку б програмісти писали півроку!”
Отакє робиться вірусним. Бо це ж про успішний успіх!

А отакє, про факапи, не дуже популярне :)

“An AI CEO finally said something honest”
www.reddit.com/...​ly_said_something_honest

Dax Raad from anoma.ly might be the only CEO speaking honestly about AI right now. His most recent take:

“everyone’s talking about their teams like they were at the peak of efficiency and bottlenecked by ability to produce code

here’s what things actually look like

— your org rarely has good ideas. ideas being expensive to implement was actually helping

— majority of workers have no reason to be super motivated, they want to do their 9-5 and get back to their life

— they’re not using AI to be 10x more effective they’re using it to churn out their tasks with less energy spend

— the 2 people on your team that actually tried are now flattened by the slop code everyone is producing, they will quit soon

— even when you produce work faster you’re still bottlenecked by bureaucracy and the dozen other realities of shipping something real

— your CFO is like what do you mean each engineer now costs $2000 extra per month in LLM bills”

Працювати 10х ефективніше не означає робити в 10 раз більше роботи. Якраз по причинам, описаним в цьому реддіт пості.

І чим більше буде ШІ дисидентів, тим довше це буде тривати так як немає бенефіту для працівника робити сильно більше середнього, достатньо робити чуть більше середнього тратячи на це сильно менше зусиль ніж раніше.

А вот свої проекти, де ти сам собі хазяїн, не від кого не залежиш, он там да, робиш в рази більше.

Ну ніхто із компаній не заявляв про 10х, це ви вже традиційно самі додумали. Максимум говорять що інженери не пишуть код руками.

Оцьому бла-бла-бла що ви пишите — вже не один рік.

А те що ви не в курсі скільки ще в минулому році було написано про x10 критичного, бо оце «програмісти скоро стануть не потрібні», бо x10 було кругом — я не вірю.

А руками так, я з 90их код не пишу. Клава пише.

Ну так вперед, якщо так багато було написано то має бути багато посилань. Давай, приведи парочку.

та навіть тільки в лінкеді за ці роки вся стрічка — суцільні посилання.
від CEO, CTO, та різних фаундерів.

Про альтманів — то що не інтерв’ю. Даріо зараз головний рупор, що не виступ, що не есе. то — в понеділок сінгулярність вже буде.
Маскі і подібни про технокомунізм, а алармісти про тотальне безробіття, бо ж — з 10 робітників 9 стануть не потрібні — всюди, у всіх офісах.

ви як вирішили дурня клеїти, то все ж не так тупо, га?

Вони розказуть про абстрактне майбутнє без конкретних таймфреймів, а ти подав ніби вони розказуть що вже досягли, ефективність 10х. Тому попрошу конкретні цитати, а не бабка на лінкедін сказала, що вже завтра, через рік 9 робітників з 10 звільнять, бо їх роботу буде робити ШІ.

Сам клеїш дурня, запихуєш свої слова в рот, а потім починаєш відповідати, ніби з голосами в своїй голові спілкуєшся

Тобто ти виріш що я кретин?
ну ок, і тебе в бан, бо сміття забагато генеруєш.

пикантность ситуации в том, что автор твита — Dax Raad, он создает AI coding agent OpenCode. ему в комментах пишут, мол, чувак, ты вообще понимаешь, что создаешь тул для AI кодинга? странное проявление мышления лидера. и автор отвечает: «it’s like negging», то бишь, специально делает провокационный вброс, потому что это лучший маркетинг.

ну т.е. пост полностью выдуманный, чтобы взбодрить аудиторию, а не ’CEO пишет про реальный факап’. это ж надо было такую цитату притащить) вот как такие скептики читают, так они и код пишут, наверное))

fxtwitter.com/...​/2022574719694758147?s=20

ты в курсе, что это полностью выдуманный пост? понятно, что где-то в компаниях с низкой культурой производства такая ситуация вполне возможна.

но вот ты, притащил сюда конкретный фейк.

dou.ua/...​rums/topic/57846/#3057352

трошки з іншого боку зайду, хоча про АІ продуктивність міг би вставити 5 копійок теж

ось я працюю на фірму яка розробляє тулзу для Enterprise Architecture — це типу там де архітектурні принципи, TOGAF, безкінечні ревю, Reference Models і решта речей від яких більшості людей тупо хочеться ригати.

я недавно робив ревю 250 коментарів\інтервю і абсолютна більшість наших існуючих або потенційних клієнтів описує сценраій коли знають, що не зможуть отримати бенефіти від продукту бо це потребує системних змін в організації. Те сама стається з багатьма фірмами які купляють\імплементовують тулзи по типу SAP (і мають ху*вий операційний менеджемент), ServiceNow (і мають ху*вий ассет менеджемент), або SalesForce (і мають ху*вий кастомер\сейлз\акк менеджемент). Вони думають, що купляють тулу яка зробить їх кращими але тула вимагає від них зрілості на рівні 3-4 з 5 шкали щоб хоч щось отримати в замін.

по АІ якась така сама шляпа буде, ну буду генеруватись цей код — але кому він *****й треба?

більшість бізнесу не зможе перевати швидку генерацію коду бо сам по собі бізнес не має роудмапу який готовий на 3-6-9 місяців з підвязаними метриками, готовим дизайном, перевіреними гіпотезами, аналізом ринку\конкурентів, чіткою стратегією чому\шо\куди, документацією і комунікацією з усім іншими командами. В результаті, буде генеруватись код, будуть робитись прототипи, але прогресу по суті буде або 0% або -Х% або (рідко) +Х%.

мене взагалі рідко цікавить саме швидкість. А ось девелопер який питає питання і обговоює фічу з розумінням нашого бізнесу і користувачів — це круто. Бо він потім так само говорить з дизайнером, з тестувальником і вони всі разом пропонують круті рішення які корисні для нас і для користувача.

тепер я бачу багато постів і коментів про це як швидко можна згенерувати код, як швидко все можна автоматизувати, як швидко можна налупашити якоїсь шляпи. Але ніхто в цих постах не описує в чому реальна цінність цього всього... для c-level зрозуміло, бо для багатьох з них швидко = успішно. Але коли швидко інтегрована система за 5-10 мільйонів баксів приносить 0 бенефітів, то чомусь всі починають задавати собі питання «а чому так сталось?» або «а чому все стало так дорого, бо раніше цей процес коштував 1 цент за запит, а тепер 3 цента». В нас там був недавно кейс коли викотили фічу, все працювало (ну через сраку але працювало) і потім зрозуміли, що її не можна давати клієнтам бо там по регуляціям в різних регіонах світу є проблеми. Зараз вже десь 12 місяців наш лігал-тім вирішує ці штуки і ми почнемо по трошки шось там викочувати далі. Ну це ж буде кейс для будь якого B2B проекту і для будь якого великого або середнього B2C.

Це проблема не ШІ а бізнесу, продуктів.

ШІ це лише інструмент який прискорює цикл ідея -> делівері. ШІ може прискорити як корисну ідею, так і шлакову, не знаю що тут можна зробити.

Але ніхто в цих постах не описує в чому реальна цінність цього всього... для c-level зрозуміло, бо для багатьох з них швидко = успішно.

я колись давно, замислився про причини відомих серед активних суспільств скептиків описів того, як армійським чинам пройдисвіти ухитрялися впарювати ненаукові штукенції, чому серед владних еліт невикорінні шаманізми+ і тд і тп

ну навряд чи ці люди просто слабкі інтелектом, і вже коли криза середнього віку почала стукати в мої двері я раптом все зрозумів

саме ліміт часу, який ми можемо заінвестувати в розвіток знань-умінь-карєру робить це
той, хто хоче бути військовим, та ще й вийти на високий рівень просто немає жодних шансів побудувати в голові когерентну картину фізічного світу, тому йому завжди продадуть «коробку з нєонками» старанно легендовану
той, хто йде у владу вже нічого окрім цього робити не буде, який би продуктивний не був, якщо не зрозумів _до_ цього чому наше тіло не перестрибне 120 років — ну значить будуть рітуальщики навколо нього і тп

потім пару десятиліть спостережинь і читання цікавих історій про рішення топів корпо, як існуючих так і вже демонтованих ці роздуми підтвердили — окрім 1-10 відсотків тих, хто ухитрився справді зрозуміти як саме йому можна щось витиснути з потенційно трансформуючої технології, інші або біжуть на всяк випадок, може пізніше проясниться, або просто не можут не робити імітації — їх не зрозуміють і персонально краще робити це ніж ні

от таке от імхо щодо реальної цінності, якої вочевидь нема для 90% і це було передбачувано всі ці роки

Ну тут не обовʼязково справа в старінні. Просто ринок, та навіть 1 компанія — це вкрай складна система. Те саме держава або армія. Завжди є розрив між «верхом» і «низом». По різним причинам. А ринкові кризові сценарії — як раз часто через поєднання факторів наступних.

1. На ринок входить «важкий» революційний тек.
ШІ — на мій погляд такий

2. Розуміння реальної користі і обмежень теку між «верхами» та низами(реальністю) — драматичне.
Точніше з ШІ так — низи, інженери, швидше доходять до розуміння обмежень ніж верхи. Бо низи це руками мацають і наслідки використання «відчувають» швидше, тобто що вендор в своїй маркетинговій компанії «прикрашає» бачать швидко. Верхи — з великим лагом, коли за роки ТСО злітає і збитки бізнесу зростають. Щоб цього не сталося треба не вестись на хайп і слухати інженерів — а це в великих компаніях, розрив зворотнього звʼязку від інженерів — часта картина. Бо інженери ж теж, будемо реалістичні — ниють часто і по різним приводам — це формує толерантність у верхів до негативного фідбеку.

3. Вендори теку наполегливо продають та рекламують тільки переваги і мовчать про недоліки. А іноді — і самі не знають.
З ЩІ — все це відбувається. І мені здається вендори на 3 рік вже мають бачити і проблеми. Є купа досліджень.

Ось ці 3 фактори в поєднанні — здатні перетворити «ШІ революцію» на «ШІ кризу».

І як я пишу далі в репо в главі хто винен — ніхто не винен. Вендор не злий, він мотивований бізнес цілями, с-левел не злий, вмотивований своїми бізнес цілями і всякі там штуки як «здоровʼя кодової бази» або «розрахунок когнитивного навантаження» — не є сталими та обовʼязковими практиками, інженери теж не злі і не ліниві.
Реальність складніша за голлівудське кіно і такі трагедії і кризи часто реалізуються не тому що є якийсь злий геній, архітектор кризи — а тому що система діє ірраціонально при тому що всі окремі складові системи діють раціонально, в межах своєї логіки. І навіть «в межах моралі» свого положення

це все слушно, але я трохи не цьому хотів увагу сфокусувати, мабуть я невдало підібрав словництво)

сео приймає 3-5 рішень на рік, кожне може бути поганим і навіть фатальним, причому вони це роблять в умовах, ну хм, деякої зрозумілості, визначеності, принаймні так здається в психіці, що підтримує рішення

якщо зявляється потенційно трансформуюча технологія, яку ти вже знаєш, що конкуренти намагаються адаптувати — це рішення в умовах невизначеності, одне на кілька десятиліть, чи одне на карєру, чи одне на час існування компаніі

в таких умовах страх чи ризик-менеджмент просто не дозволить тобі не «визначитися позитивно» в питанні нового, або твоє «децизійне коло» тебе змусить
тут не про раціо, тут про психіку індивідуальну і колективну

Так. В таких випадках я описав який механізм діє. І він вкрай виснажливий для с-левел. Інвестори тиснуть — по принципу «всі впроваджують ШІ і ти роби, або йдеш з посади». І С-левел часто обирає стратегію безпечну, яку я теж описав. Бо треба як би і інвестора задовольнити, який не чує що нема РОІ у цього доказового під пресом хайпу. І сильно не ризикувати. І тут саме ця небезпечна стратегія і створює найбільше проблем. Бо це може навіть гірше для бізнесу ніж — не робити нічого і почекати. Опустимо очевидне — що не робити нічого може призвести до технологічного відставання від конкурентів. Тобто фаза «почекати» не має сильно затягуватись в такому сценарії а компанія має бути сфокусована на постійному збору аналітики і аналізі зрілості теку. Щоб в потрібний момент — інвестувати і швидко наздогнати конкурентів точним стрибком.

AI может использоваться как кодогенератор только после того, как:
1 Архитектура формализована и проверяется автоматически (executable architecture и иже с ней).
2 Контракты являются единственным источником реализации.
3 Полная система тестирования построенная независимо от и до тестируемого кода; quality gates блокирует регрессии.
4 Система допускает изолированную замену модулей, чтобы потом переписать руками критически важные куски

Проблема в тому, що всі абстракції протікають, і те, що ти зможеш переписати модуль не обов’язково зробить систему стабільніше.

Не совсем понял как это, переписывать есть смысл то, что приносит нестабильность по метрикам

Умовно, метрики показують, що sql запити працюють повільно, ти переписуєш, отримуєш +15% до швидкості (але під навантаженням все одно катастрофа), але, можливо, потрібно було перейти на nosql рішення, і отримати +300% (чи навпаки, викинути nosql, не суть), або опенсорсну версію замінити на пропрієтарну. Тобто модульність — це штука потрібна, але може обмежувати доступні альтернативи (бо зовнішні контракти порушити важко).

Это похоже на проблему монолита. Обычно при росте нагрузки в цепочке вычислений всегда видно узкие места и есть традиционные или творческие тактики как их изменять пока не упрёмся в следующее ограничение. Модульность в данном случае просто задаёт принципиальную возможность менять звено в цепочке вычислений за приемлемое время.

Стаття «управлінська», не дивно, що в половини розробників вона визиває необхідність посперичатись )

x.com/...​tatus/2023150230905159801

Peter Steinberger is joining OpenAI to drive the next generation of personal agents. He is a genius with a lot of amazing ideas about the future of very smart agents interacting with each other to do very useful things for people. We expect this will quickly become core to our product offerings.

OpenClaw will live in a foundation as an open source project that OpenAI will continue to support. The future is going to be extremely multi-agent and it’s important to us to support open source as part of that.

Зря Альтман ДОУ не читав, він то не знає що OpenClaw це диряве решито говнокода а Peter Steinberger це говно-вайбкодер, який не розуміє згенерований код. І взагалі, OpenClaw це нікому непотрібна шняга якою ніхто не користується.

Ого, якийсь дорослий дядя в твіттері щось вумне сказав, всім уважно слухать, дурні, бо у вас своїх мізків і очей немає!
Можна скільки завгодно усиратися аргументами в стилі «в твітері якийсь СЕО\мільярдер\інфлюенсер сказав що ШІ це емейзінг», але якщо кінцевий споживач каже що «ШІ — лайно» то ШІ — лайно. А більшість звичайних людей вже ШІ дратує, ефект новизни коли всі лізли генерувати себе в фільтрах гіблі чи пластикової ляльки і спамити цим гівном в соцмережах пройшов. Навіть фейсбучні бабки вже лаються в коментарях під слопом. Навіть діти євангелістів вважають що ШІ це крінж x.com/...​tatus/2022464421348729240 .
Тому силіконова долина може далі продовжувати бути відірваною від простих людей і займатися circlejerk, переконуючи один одного що вони творять революцію, але якщо звичайні кодомакаки бачать що це гівняний інструмент і не хочуть їм користуватися — то він нікому окрім силіконових інвесторів не потрібен (а силіконовим інвесторам потрібен не ШІ, а гроші). І в якийсь момент ця бульбашка лусне, якщо не відбудеться якогось принципово якісного переходу, а не просто «побудувати більше датацентрів щоб генерувати гівно на 0.2 сек швидше».

Я про це теж пишу:
Не треба вмовляти програмістів використовувати ШІ. Вони самі, все життя шукають і придумують засоби як менше працювати, щоб ото комп робив. Більшість інструментів для програмістів придумані не маркетологами та євангелістами, а самими програмістами, часто на колінці, кривеньке, але підхоплюються спільнотою бо — вау, як простіше стало працювати!

Звісно, є поріг входу, але досвідчені програмісти вже його минули.

А з ШІ дивина якась. Вау у нубів, вайбкодерів, а у досвідчених прагматизм а то й і скепсис(бува занадто як на мене) .

Я з одним колишнім CTO пару місяців як дискутую, так у нього пояснення — програмісти отупіли і зажралися, а тому йде Радикальна Зміна — технарів звільнять і замінять на гуманітаріїв з ШІ!
«Не програмісти стануть не потрібні, а взагалі технарі! І лікарі теж зажралися, і їх замінить ШІ. І тим більш психологів замінить!»...

3 роки цій темі, місцеві ШІ євангелісти чомусь думають що «ніхто ще не осилив» цієї технології на тому ж рівні як вони.
Реальність — більшість інженерів цей етап вже пройшли і різниця тільки в тому, що в своїх реальних компаніях, командах, та умовах, тверезо оцінюючи ризики — зробили висновки і про обмеження цієї технології.
І говорити хочеться тепер я думаю цьому прошарку — про те як це використовувати безпечно і як стандартизувати підхід і вирішити чисельні проблеми які цей тех приніс — як от злам балансу когнітивного навантаження в більше менш великих командах. Бо це не тривіальні питання які вирішувати можна по різному.

Але ШІ євангелісти продовжують вестися на хайп, молитися на ідолів і будувати свій карго-культ, доказувати всім кругом що ті «чогось не розуміють» і роздають поради рівня «робити треба харашо, а погано робити не треба». При чому без единоі хард дата цифри, аргументу по суті, чи реально глибокої поради і демонструючи дрімуче нерозуміння технології, як от порада що ЛЛМ можна навчити писати класний код на DSL на датасетах якого вона не навчалась — просто давши почитати мануал. Роблять це все буквально 3-4 людини, всі з анонімних акаунтів — тобто кредібіліті цієї точки зору нульове.

В таборі ж ШІ прагматиків переважно реальні люди з реальних інженерних команд яких тут десятка 4 в коментарях так чи інакше свою точку зору висловили — але сперечатись з анонімними генераторами «чепухи» вони переважно просто не хочуть.

Але звісно є і користь — ШІ культісти крутять цю статтю коментарями і тримають в топ — за це велика дяка.

А хайпогенератор залишається вимкненим:)

3 роки цій темі, місцеві ШІ євангелісти чомусь думають що «ніхто ще не осилив» цієї технології на тому ж рівні як вони.

та я часто у дискусіях вказую, що користуюсь з весни 23.
Для прода отим вебчатиком лямбди генерив, бо треба було вже на 3ьому SDK, який для мене був новий,
а коли пересів на Windsurf... якось шарив екран колезі по команді, а він такий як побачив і автокомпліт, і як я питаю у чаті — Вау! а що це в тебе такє?? Хочу собі такє!!

Ніхто ж його не вмовляв, ми просто обговорювали одну проблему в модулі, і шукали разом варіанти як її обійти.

А з ШІ дивина якась. Вау у нубів, вайбкодерів, а у досвідчених прагматизм а то й і скепсис(бува занадто як на мене) .

Ну це ви так думаєте що ви досвідчений а опоненти нуби)
у мене 15 років досвіду, прямі контракти, останні 8 років ЗП на рівні топ наймів Джині)

ІМХО, думати що ти розумніший ніж інженери чи менеджери ФААНГів, і при тому заробляти в рази менше, це просто смішно)

Я з одним колишнім CTO пару місяців як дискутую, так у нього пояснення — програмісти отупіли і зажралися, а тому йде Радикальна Зміна — технарів звільнять і замінять на гуманітаріїв з ШІ!

То занадто, певно явне перебільшення як завжди у суперечках. А відносно айті та зокрема програмування: найперша аналогія що спадає на думку — сисадмінство — у свій час також рахували як то круто цікавого та надовго, потім потрохи хайп спадав і вже почали навіть казати (перебільшуючи щоб передати зміни) — сисадміни як сантехніки, нема нічого особливого. Щось мені здається (офкос цілком можливо помиляюся) що з програмуванням приблизно щось такого типу відбувається з умовно здуванням айті «аури», і затуханням привабливості для тих хто зовні того.

Я з одним колишнім CTO пару місяців як дискутую, так у нього пояснення — програмісти отупіли і зажралися, а тому йде Радикальна Зміна — технарів звільнять і замінять на гуманітаріїв з ШІ!

да, я видел тебя в тех комментах у Добрякова. в целом, нормально тебе там в панамку насыпают))

Sergiy Lysak, нормально. Самоутверждайтесь дальше, а я вас забаню нахрен. Но само наличие такой потребности у вас говорит о нужде в психологической помощи.

но меня другое удивило, чуть ниже ты пишешь:

Sergiy Lysak
Alex Drugobizki ну да,
у хорошего разработчика — быстрее и больше хороших решений с ИИ. исследования постоянно это показывают, что ИИ сильнее бустит синьоров, чем джунов

ты вообще читал статью Виталия??! 😂

якщо кінцевий споживач каже що «ШІ — лайно» то ШІ — лайно.

от же ж ты довбень)) Штайнбергера OpenAI взял под крыло, потому что его продукт обрел вирусную популярность, он за пару недель набрал 100 тысяч звезд на Гитхабе, а сейчас уже 200К звезд. в США образовался дефицит Мак Мини, потому что их все размели, чтобы ставить краба. вот это и есть — голос конечного пользователя! и при том, что продукт натурально составлен из гавна и палок, но попал удачно в запрос потребителя.

І це при тому що він доволі гіковський, там не так просто його підняти, тобто звичайний avarage Joe з домогосподарками до нього ще не добралися.

Ох як полихнуло, не зручно постійно оказуватися неправим )

але якщо кінцевий споживач каже що “ШІ — лайно” то ШІ — лайн

Всі метрики говорять про протилежне

Claude Code was made available to the general public in May 2025. Today, Claude Code’s run-rate revenue has grown to over $2.5 billion; this figure has more than doubled since the beginning of 2026. The number of weekly active Claude Code users has also doubled since January.

Codex weekly users have more than tripled since the beginning of the year!

www.reddit.com/...​ls_on_openrouter_are_all

www.reddit.com/...​leaderboard_20260209_top

До речі дивіться які моделі використовують, а потім такі як ти розказують що OpenClaw це диряве решито.

Тепер чекаю з твоєї сторони, якісь докази що десь показники пішли на спад.

якісь докази що десь показники пішли на спад

Просто лишу це тут: www.youtube.com/watch?v=z3kaLM8Oj4o

Ти би сам перевіряв який шлак ти кидаєш

Ось дослідження на яке він посилаються
www.remotelabor.ai/paper.pdf

1. Тестують не корисність АІ, а можливість АІ виконувати end-to-end real world задачі без man in the middle (сила АІ робити тебе продуктивнішим а не заміняти тебе)

2. Тестують не агентів а ЛЛМки, взагалі складається таке враження що вони дупля не відстрілюють яка між ними різниця, постійно називають ЛЛМки агентами (сила АІ в агентах)

3. ЛЛМки в тестах річної давності — gemini 2.5 pro, sonnet 4.5, grok 4, Manus (китайський open claw тільки закритий і дворічної давнини)

4. В тестах найкраще себе показав саме Manus, що не дивно так як єдиний а
агент в тестах. Но серед агентів в 2026, та навіть в 2025, він ніде, ніхто його не використовує

Но ти не можеш сам почитати перевірити, так як сам дупля не відстрілюєш і для тебе такі папери це білий шум.

(1) Ріст виручки Claude Code не має прямого зв’язку з реальним зростанням продуктивності в розробці софта; (2) За тією ж логікою, стрімке зростання мережі McDonald’s не свідчить про корисність їхньої їжі.

Люди ліниві, вони схильні халтурити, принаймні спробувати на початку.

то что ты только что написал называется ложное тождество. при этом ты можешь быть прав, но то как ты это доказываешь точно неправильно

Я не довожу, я спростовую логіку опонента за допомогою ілюстрацій. Пункт (1) це просто головна претензія

Ріст виручки Claude Code не має прямого зв’язку з реальним зростанням продуктивності в розробці софта

Це дуже сильне твердження. Можливо звʼязок є, але його треба доводити. Це головна критика. Усе інше просто ілюстрація, чому це може бути не так.

Ну тобто весь ваш аргумент, що люди продовжують жувати кактус, бо мазохісти

Порівняння з маком не зовсім доречне. З ШІ можна і треба писати якісний код, і в цілому ШІ пише більш якісний код ніж avarage Joe, і навіть для топових інженерів він може допомогти знайти баги, дири, які він упустив. Не говорячи вже що написання коду це лише 10% сценаріїв реального використання для інженерів. А вот з маком, як не старайся, які кулінарні здібності ти б не мав, ти не зможеш зробити його здоровішим.

Виглядає як шаблон для рекламної паузи кактус-аналогій :)

З ШІ можна і треба
І в цілому ШІ пише
І навіть для топових інженерів він може допомогти знайти

🌵

А вот з маком, як не старайся

🌵 не знайти!

Довгочит, мовою оригінала (він білорус, у Польщі, виїхав коли там народу не вдалося відстояти свій вибір).
Віртуально я пару років знаю. На Медіум можна погуглити його статті про RAG.
А так — він один з авторів «Copilot для юристів».
Супер оптимістом ШІ був. Особливо як у Каліфорнію з’їздив: Тотальна революція! Ура! ... і тд

Сергей Авдейчик:

Скорость выросла.
А вот вывозить стало сложнее: как агентный ИИ переводит нас с техдолга на когнитивный долг

Мы все сейчас немного на хайпе: Cloud Code, Codex, Google Antigravity, Cursor, агентские пайплайны, автогенерация фич «под ключ». Никто уже не спорит — скорость разработки растёт кратно, а скорость генерации кода — вообще на порядки.

И вот парадокс, в который многие из нас влетели на полной скорости.

Чем быстрее вокруг тебя «пишут код» агенты, тем тяжелее становится тебе самому. Не по линии «сложно в коде», а по линии сложно в голове.

Я это очень чётко ощутил на себе: чтобы эффективно работать с AI-агентами, нужна более высокая концентрация, больше «оперативной памяти», способность держать в голове одновременно:
— контекст задачи,
— архитектурные ограничения,
— цепочку действий агента,
— риски побочных эффектов,
— и ещё — параллельно — план следующего шага.

Раньше цикл разработки был «тикет → митинг → техзадание → реализация». Интервалы были человеческие: часы, дни. У тебя было время отойти, переварить, структурировать, вспомнить почему ты так сделал, а не иначе.

Теперь же ты можешь за один вечер «закрыть» объём недели — и это звучит как победа... пока не наступает середина проекта.

Последняя миля стала адом (и это новая норма)

Есть старая, почти классическая динамика: старт проекта бодрый, потом «последняя миля» тяжёлая, но у тебя уже есть понимание архитектуры и накопленный опыт решений. В традиционной разработке к финалу у тебя обычно в голове складывается теория системы: что она делает, почему устроена так, где слабые места, как безопасно менять.

С агентами всё перевернулось.
Первая фаза теперь супербыстрая, потому что агенты легко набрасывают каркас, API, интеграции, UI, тесты, миграции — всё, что раньше съедало недели.

А дальше начинается странное: скорость падает, правки становятся рискованными, любое «просто поменять вот тут» неожиданно ломает пять мест. И самое неприятное — у тебя появляется ощущение, что проект больше не у тебя в голове.

Это и есть то, что всё чаще называют когнитивным долгом.
Техдолг живёт в коде. Когнитивный долг — в мозгах

Технический долг мы умеем распознавать: плохая архитектура, костыли, отсутствие тестов, спагетти, дедлайны, «потом отрефакторим».
А когнитивный долг — штука коварнее. Код может быть даже аккуратным (агенты умеют «красиво»), но при этом:
— никто не может внятно объяснить, почему выбрали именно этот подход,
— «как оно работает» — это набор разрозненных догадок,
— изменения превращаются в русскую рулетку,
— система становится чёрным ящиком даже для авторов.

Программа — это не только исходники; программа — это теория в головах разработчиков. Код — лишь одна из проекций этой теории.

Агентный ИИ умеет производить код быстрее, чем мы успеваем строить и поддерживать теорию.

И вот почему когнитивный долг, как по мне, становится опаснее техдолга: техдолг чинится инженерными практиками на уровне репозитория, а когнитивный — требует восстановления коллективного понимания, а это всегда дороже, дольше и эмоционально тяжелее.

«Больше агентов» ≠ «быстрее проект»

Здесь очень уместно вспомнить «Мифический человеко-месяц»: добавление людей в проект повышает стоимость координации. С агентами происходит похожее, только координация становится тоньше и менее заметной.

Каждый агент:
— принимает микрорешения,
— выбирает между альтернативами,
— вводит новые сущности,
— меняет поведение системы.

И если эти решения не становятся частью общей теории команды (то есть не попадают в головы людей), то у тебя появляется невидимая сложность. Ты как будто живёшь в проекте, где половина решений принята «кем-то», «где-то», «почему-то».

Отсюда и эта новая когнитивно-эмоциональная нагрузка: ты не просто пишешь код — ты следишь за роялем, который сам играет, но иногда внезапно меняет тональность.

Плохая новость: это не «детская болезнь инструментов». Это фундаментальная штука: человеческая рабочая память ограничена, а агентные системы умеют перегонять изменения быстрее, чем мы их осмысляем.

Я думаю, в ближайшие годы мы будем говорить не столько про «технический долг» (он никуда не денется), сколько про управление когнитивным долгом: как измерять его, как предотвращать, как снижать, как он масштабируется в распределённых командах и open source, как адаптируется онбординг.

И, честно, это может стать одной из главных дисциплин инженерии в эпоху LLM.
Потому что скорость генерации кода — это уже решённая задача.
А вот сохранение общей теории системы в головах людей — похоже, становится задачей номер один.

Если вы сейчас на агентских инструментах и чувствуете, что «ускорились, но устали», — это не слабость. Это сигнал: вы не просто пишете софт. Вы управляете когнитивной нагрузкой, которую софт теперь создаёт быстрее, чем когда-либо.

И да — похоже, нам придётся снова полюбить старую школу: ясные решения, тесты, ревью, парное мышление и регулярное «а мы вообще понимаем, что делаем?».

сохранение общей теории системы в головах людей

вот этого не нужно делать

Мені не дуже зрозуміло, що ви маєте на увазі. Бо я бачу мінімум два можливих трактування вашої позиції:
— теорія системи не повинна жити тільки в головах
— AI все пам’ятає, нам не потрібно тримати модель системи в голові
Якщо йдеться про перше — я з цим частково погоджуюсь. Але якщо про друге — тут я обережніший.
А можливо це просто провокація (не звинувачую, просто кажу, що не виключаю цей варіант).

І на мою думку найцікавіше тут, це конфлікт двох філософій:
— система живе в ментальній моделі команди.
— система повинна бути повністю самодостатньою без ментальної залежності.
Особисто я думаю, що правда десь посередені.

Моя думка, якщо по-простому: 100% у головах — bus factor та небезпечно; 0% у головах — ще небезпечніше.

теорія системи не повинна жити тільки в головах

именно это я и имею в виду. мой личный опыт за все годы говорит о том, что хорошая актуальная документация — залог здоровья проекта.
в моем случае качество работы AI coding сильно улучшилось после того, как я наладил на своих проектах планирование и feedback loop: любая фича проходит стадию планирования и план в обязательном порядке включает в себя проверку документации на консистентность и обновление ее в соответствии с новыми изменениям. я вчера постил ссылку от OpenAI, где они описывают свой опыт построения глоссария проекта, ну вот я делаю похожим образом и рад, что мои практики совпадают с рекомендациями экспертов.

100% у головах — bus factor та небезпечно

согласен

0% у головах — ще небезпечніше

ну полностью это недостижимо, это как температура абсолютного нуля. overall картину ты все равно держишь в голове и сверяешься с ней, когда делаешь ревью результатов работы агента. повторюсь, у меня документация подробная и обновляемая, но я все равно просматриваю каждую итоговую строчку, будь-то код или документ, прежде чем сделать commit.

ну полностью это недостижимо, это как температура абсолютного нуля.

Коли я писав про 0–100%, я просто окреслював межі. Зрозуміло, що в реальності ми ніколи не знаходимося в крайніх точках. Це була лише модель для спрощення.
З тим, що ви описуєте (планування, обов’язкове оновлення документації, feedback loop), я якраз і бачу здоровий баланс, але мені... скажімо... не повністю зрозуміло, яким чином його дотримуватись на довгій дистанції. Ну, поживемо-побачимо. У будь-якому випадку особисто мені навряд доведеться попрацювати з AI platform engineering, але подивитись зі сторони — цікаво.

не повністю зрозуміло, яким чином його дотримуватись на довгій дистанції

моя версия — автоматизированностью подхода. почему в проекте на дистанции нарастает гэп между документацией и реальной имплементацией? разработчики забывают/забивают на регулярное обновление, особенно если они частые.

в моем случае апдейт документации запрограммирован и я всего лишь контролирую выполнение. полностью в автономное плавание я не отпускаю агентов, как я уже говорил, все результаты я просматриваю. но именно выстроенная организованная система md файлов с оглавлением и описанием доменной области и различных аспектов реализации системы позволила мне перейти от AI assisted coding — когда я в Cursor забивал промпты и потом допиливал полученный код, к agentic coding — когда я уже полностью работаю в Claude Code терминале и просматриваю только диффы. код редактирую уже гораздо реже, либо когда это банально быстрее, чем через CC, либо же когда это задачи, с которыми Claude Code хуже справляется, типа UI. и если в Cursor у меня код генерировался наверное, быстрее, но потом дольше допиливался, то с подходом agentic выигрыш получается более системный на дистанции — за счет планирования и различных post-coding actions типа code simplifier.
как-то так :)

Дякую за knowledge-share.
Я мав на увазі трохи інше... Проблем з документацією у мене ніколи не було — так історично склалось. Моя проблема: як тримати власне «занурення у проєкт» таким чином, щоб балансувати десь посередині між «розповідаю агенту за кожен рядок — accept all changes».

Під катлайном — мій варіант, можна скіпнути, якщо не цікаво.

----

Зараз спробую пояснити проблему на прикладі власного пета.
Проєкт: типовий грінфілд; розподілена платформа з класичною обв’язкою: брокери, cache-layers, моніторінг, все таке.
Інфраструктура: хмарні серсіси (git, minio, SonarQube etc.), агентів спавнить «спеціально навчений» LXC, таск-трекер — LXC, сам проєкт крутиться у k8s. Уся інфраструктура на власному залізі.

Передісторія
Фактично для реалізації своєї ідеї я мав вибір з двох зол:
— робити все самостійно (читайте не робити нічого)
— делегувати максимум завдань агентам, а собі залишити роль підтримки feedback loop
AI assisted будемо рахувати також як «робити самостійно», бо де-факто я все ще ботлнек який має «скопіювати->[відредагувати]->вставити».

Замість

система md файлов

я використовував один файл .ai/main.yaml — гарно серіалізується, все ще human-friendly і легко грепається (зараз би я мабуть обрав TOML, але це не суть). Мастер-файл виступає як source of truth для усіх нейронок і декларує «що де знаходиться, та кому і як з цим працювати» — виставляє пермішени, розділяє скоупи, виносить інваріанти, тощо. Додатково колекція docs/adr-*.txt для фіксації дизайн рішень, та власне сама документація проєкту у docs/.

Перша проблема — невідповідність документації. Фактично, я кажу ШІ «обов’язково дотримуйся ADR документів», і от задачка про курку та яйце:
— коли ARD ще не створено — немає до чого посилатись
— коли ADR вже створено — його вимоги ще імплементовано
— коли ADR видалено — є реалізація без різонінг
— коли два ADR протиречать один одному — який з них важливіше
Я вирішив це шляхом додавання status-tag до кожного дизайн документу.

А далі, все було як описано в оригінальному коментарі цієї гілки. В якийсь час я зрозумів, що не виконую «задачі безпосередньо для проєкту», але займаюсь виключно «підтримуючими завданнями» (зробити кастомний MCP/GPT, натренувати кастомну нейронку, щоб вона робила pre-/post-processing etc.). І з рештою я опинився у стані, коли я досконально знаю, як працює ШІ-сетап, але майже нічого не можу зробити з оригінальним проєктом. Тобто, як раз витримати оцей баланс — мені не вдалось.

Топ комент, тут відразу видно що людина знає про що говорить.

Никто уже не спорит — скорость разработки растёт кратно, а скорость генерации кода — вообще на порядки.

Якби всі АІ скептики в цьому топіку це заперечують.
Та й сама стаття про це)

Про когнітивний борг — це прямо в точку.

Людина чітко описує те саме що я пишу в статті. Бо коли ви вливаєте в репо о такий код який більший за обсягом і за складністю ніж код людини і робити це починаєте на швидкостях більших ніж команда збалансована робити — то це і є накачування репо техборгом. Людина описала це з точки зору ментального боргу, я ж апелюю до загальної механіки починаючи з поведінки гравців ринку, ідентифікую розрив в розумінні між ними і пропоную аргументи інженерній спільноті — як про це говорити з менеджментом на мові менеджменту. Інша людина в коментарях це питання вже підіймала і я відповідав — якщо піти до менеджменту з питанням «генерації ментального боргу» далеко не всі вас зрозуміють, бо що це таке в грошах і цифрах? А от постановка питання через логіку — без перебудови процесів ми надуваємо кодову базу техборгом а це збільшує ТСО і веде до збитків — більш зрозуміла на мій погляд як раз менедженту. Бо є цифри і є гроші, а не абстракція «ментальний борг». По суті ж написаного — згоден повністю. І навіть теза про прискорення — підтверджується на грінфілду, а ломається це саме коли відбувається в реальних умовах де по теорії обмежень у нас ломається саме реальна команда. І тоді:
1. Локальне прискорення не конвертується в прискорення велью делівері системи
2. Виникає той самий інвентар(теор. обмежень) який це локальне прискорення швидко зʼїдає

Для себе роблю висновок — необхідно проробити це в репо і розділити аргументи, для інженерної спільноти треба додати про ментальний борг, бо це те що люди відчувають найболючіше і відповідно умовна секція «чому це має тебе турбувати» спрацює ефективніше. Для менеджменту — свої розділи і пояснення через гроші, ризики.

так.
я йому на цей пост і написав, потролив:
а я тобі казав, що впрешся на останніх етапах. і тд.

бо то ж не тільки я такє казав.
на ютьбі уже з минулої осені пішли відео — ото я вже півроку як фігачу проект за допомогою ШІ... і от, що я хочу сказати: кидайте той ШІ!!! я втратив все: і контроль за своїм проектом, і вміння длубатись у складних проблемах, ...
потім звісно прагматичніше поради :)

або, було якось відео, команда з пари десятків програмістів поставила над собою експеримент і чітко вимірювала і години праці. і рядки коду.
Розділились на дві групи: AI agentic coding та AI assisted coding

і виявила що:
ті що фігачили за допомогою ШІ... показали ту ж продуктивність за день. Причому тому що вже до обіда повністю виснажувались, і до кінця дня навіть мітингувати вже були не спроможні.
Ті що просто автокомплітили, «гуглили у чатику», радились з ШІ, AI assisted — ну день собі і робили.
Якість коду — звісно теж, у перших була гірша.

Про наслідки інтенсифікації праці — теж і мало пишуть, і майже нема досліджень.
Поки нема.

З боргом завжди проблема: він вдарить завтра. То завтра проект колом стане. То завтра ти вигориш. А сьогодні — навіщо про це думати?

Я би був вдячний якби ви могли якось мене з людиною познайомити(можно через лінкедін). Хотів би йому як і вам запропонувати доєднатися до репо. Деталі обговоримо вже думаю приватно

как четко ты заметил — «ускорились но устали». Особенно если параллельно есть несколько проектов на разных языках.

Цікава реалізація до мене дійшла після паузи. Я працював активно з агентами над своєю аппою декілька тижнів. Нагенерило воно купу доків, діаграм коду тестів ітд. Потім відбулась пауза в місяць — позакривати інші пріорітети + відпустка. Коли я повернувся до цієї аппи, то я дивився на неї як баран, геть не розумів що тут відбувається і чого і навіщо. Так, наче працював над нею роки тому.

угу, подібна річ була обмежуючим фактором функційного програмування, попри математичну елегантність цього підходу подальша підтримка і якісь дописування не тільки вимагали підготовлених людей (яких на ринку дуже мало), так ще і для тих, хто це колись кодував висувало зависокий «поріг повернення в розуміння»

я б це назвав «ефект подавлення формувань еврістик в голові», речі складні і мозок змушений дофіга разів перекалькульовувати доступний контекст кожного разу, намагаючись і не робити цього і позбавитися за першої нагоди

власне те саме відбувається з ультраскладними скілами типу пілотування літака, складної хірургії і тп, без практики воно деградує і хоч повторне надбання йде швидче ніж первинне, воно таки вимагає часу і чимало когнітівної енергії

якщо це справді відбувається з практиками описаними в цьому топіку, то схоже маємо природній ліміт розповсюдження цих практик

була обмежуючим фактором функційного програмування

Фп як на мене трохи починає засвоюєтись, якщо писати деякий суттевий проміжок часу(роки, лол). Шо таке моноїд а що таке клайслі і як їм користуватися поступово засвоюється що ти їх сходу бачиш і розумієш на рівні фор-лупа і все це дещо легше стає.
Але якщо «написав через силу щось розумне» і повернувся до звичної лапші/ооп. То через пару місяців згадати дуже проблематично.

ну так питай агента, що да як)

як мені колись один підліток сказав:

а навіщо ото вчитися?
якщо і коли треба буде — я у Вікіпедії прочитаю!

Саме так, у цьому й загроза.

Я особисто тому використовую тільки AI assited coding, і читаю все.
Код — ну хоча б по діагоналі.

Рев’ю — разом з ШІ, і читаю його резюме. І перепитую. якщо щось здається незрозумілим, і лізу сам перечитувати, від спеки до імплементації.

бо, на обох зараз проектах я головний технарь.
і якщо через пару тижнів виявиться проблема яку ШІ швиденько не розрулить, то все, 314ць буде. і мені і проектам.
Я тому й кажу — ШІ не змінив моєї роботи, вона залишилась такою ж. А, ну да, кода не треба писати, крім правок та прикладів у скіли. і ШІ — у кожній моєї активності — помічник.
Зміни тобто є. Але не принципові. Робота та сама.

Так, наче працював над нею роки тому.

в мене є ідеї, як уникати цієї загрози.
але то дорого вийде, і ще не опробував. і — писати статті треба, в комент не влізе :)

Я особисто тому використовую тільки AI assited coding, і читаю все.
Код — ну хоча б по діагоналі.

Рев’ю — разом з ШІ, і читаю його резюме. І перепитую. якщо щось здається незрозумілим, і лізу сам перечитувати, від спеки до імплементації.

Я і робив повний рев’ю, ручна розбивка на задачі/підзадачі. Типу овнершип всіх технічних рішень ітд.
Але коли цього всього дуже багато в короткий проміжок часу, то воно в голові не затримується.

Та то звісно що все одно не буде триматися так, якби все сам писав.
Такє ж бувало і з власним кодом.

Стисло, коріння проблеми що з ШІ, що без:
1. Ми знаємо тільки те що робили самі. Починаючи з навчання — дивитись, слухати лекції можна скільки завгодно. Скільки вправ, лаб, курсачів ти написав — ото ти настільки і знаєш.
Скільки часу витратив на обдумування, сфокусовано «писав» той код. Зараз наприклад бачу у новинах — в західних школах думають повернути олівці в руку дітей — нехай пишуть — рукою, а не на клаві. Бо моторика — прошиває мізки краще.

2. Знання і розуміння — різні речі. Можна пригадати стару книжку Програміський камінь, про пакектчиків і мапмейкерів. Знання забувається швидко. Розуміння, мапа — пам’ятається довше.
Пам’ятати до рядочку код — мало сенсу. Можна і не пам’ятати його, але якщо є його «мапа» — швидко знайдеш, пригадаєш.
І от тут якраз ризик с ШІ. Спеки, архитектура, робляться з ним теж. А то й, модерновий спосіб — запускається консиліум моделей: Зроби 4 варіанти, і дискусія між ними по цим варіантам, і вибір кращої. А людині — тільки прочитати, та погодитись. Що у результаті дає — пункт 1. Тобто ані знання, ані мапи в голові не буде.

Тому хоча я з літа сиджу на вайдкодерських каналах, слухаю, дивлюсь про бест практис AI agentic coding, і в цілому зрозуміло як те робити — собі заборонив.
Поки звісно немає тиску керівництва. А у кого є — ну все — засвоюй і — тупій.
Думаю, не буде ніяких «супер архитекторів» і «лідів команд ШІ програмістів». Будуть просто тупі менеджери, які колись були програмістами, інженерами.

Цікава стаття. Але її оцінять десь через рік-два. Взагалі нічого не змінюється, все як завжди: хайп «чому ви всюди повинні використовувати інструмент N, бо це нова срібна куля»
-> хайп «чому ви не повинні використовувати інструмент N за жодних умов, бо від нього суцільні проблеми» -> нарешті «де і як варто використовувати цей інструмент, бо від нього є користь, і де не варто, бо проблем більше, ніж користі». Ось на цьому етапі інструмент стає зрілим, а євангелісти та хейтери вже хайпують на інструменті N+1. Звісно, масштаб цього разу в рази більший, бо бабок вгупали на порядки більше.

Не зрозуміло, чому євангелісти взагалі сприйняли статтю як хейт. Не бачу тут жодного хейту, а питання про методики використання і оновлення процесу досить доречне.

Цікава стаття. Але її оцінять десь через рік-два

через год-два эта статья будет восприниматься как анекдот.

сприйняли статтю як хейт

да никто ее не воспринимал как хейт, наоборот, это Виталий в конечном итоге обвинил в комментаторов в хейтерстве и покинул свой топик.
Виталию долго пытались донести, что он составил свою статью из претенциозных источников и делает выводы, которые прямо противоречат многочисленным наблюдениям. что не стоит так слепо верить каждой бумаге, опубликованной на arxiv, потому что многие статьи основаны на устаревших данных, что их методика зачастую искажена и что зачастую, статьи вовсе не несут какого-то практического смысла. что мы на форуме практиков и свои тезисы стоило бы проверять практикой вначале, а не настаивать на том, что «вы все заблуждаетесь, вот я привел статью каких-то чуваков со сложными китайскими фамилиями». когда ты делаешь громкие утверждения, будь добр подкрепить их чем-то большим, чем ссылкой на сомнительный авторитет.

вот например, свежая статья от OpenAI, рекомендую почитать: openai.com/...​ndex/harness-engineering
кто-то выразит сомнение в компетентности инженеров OpenAI или после прочтения статьи скажет, что это чистый маркетинговый текст, направленный на оправдание капексов в дата-центры и видеокарты (как это делал Виталий)?

или вот например, свежая вакансия от конкурентов Виталия: jobs.dou.ua/...​es/n-ix/vacancies/293633
они знают что-то, чего не знает он? или он знает что-то, в чем заблуждаются они? так пусть поделится.

в общем, Виталий, если что-то задело тебя — сорри, цели такой не было, реально. мы все в одной лодке, хотя и спорим горячо порой.

чому євангелісти взагалі сприйняли статтю як хейт.

Через його коменти як тут

Це дурна робота — просто за визначенням.
....

Прості задачі, код який не приведе до ризиків, мвп зробити, одноразовий скрипт написати і т.п. Ну для фану можно погратися з більш складними рішеннями де це вже «агент на агенті» — але чисто для себе. Бо в реальний роботі це зʼїдає час, а не економить, дорожче ніж без цього і ризиків більше

dou.ua/...​rums/topic/57846/#3056003

Ну і він генерить відповіді через гпт, де 3/4 просто шлак без логіки.
Це не ок)
Я розумію прогнати для форматування чи фіксу граматики, чи надиктувати. Але не генерити ж текст з промту «налий води щоб виглядало що я правий»

Цікава стаття. Але її оцінять десь через рік-два.

Рік два назад розказували що ШІ нікуди не годиться тай як галюцинує і постійно треба все перепровіряти, що хайп через рік пройде і всі забудуть про ШІ і чатгпт. А на тих, хто розказували що можна буде код промтами писати, взагалі дивилися як на божевільних:
dou.ua/forums/topic/43716

Зараз багато спеціалістів перестали писати код руками взагалі, цілі компанії типу антропіка перестали писати код руками. Чому ніхто не згадує тих статей? Но ні, замість того, щоб визнати свої помилки, вони придумали новий термін «слоп» і весь ШІ згенерований код, софт автоматом називають «слопом», який через рік їх покличуть виправляти за подвійну зарплатню (власне про це також більше року назад писали, но щось не кличуть, навпаки замість подвійної зарплатні їм видають коробку з речами і вказують на вихід).

Во, згадайте з яким пафосом і як зверхньо стековерфлоу банив ботів:
dou.ua/forums/topic/41149

І де зараз боти і де стекофервлоу? )

Зараз з таким самим пафосом банять пул реквести на гітхабі. А через рік-другий, половина пул реквестів будуть створені ботами.

Ітогі падвєдьом. Частина місцевих ші-євангелістів обрали тактику булінгу та ad hominem аргументів, яка виявилась дієвою. Звісно робити узагальнення не треба і маю надію, що ми почуємо аргументовану позицію по цьому питанню в схожому дописі.

місцеви ШІ євангелісти просто не розуміють взагалі про що мова.

Це той випадок на який в мене давно:
Якщо у дискусії хтось когось вважає кретином, то один з них точно кретин.

Місцеві ШІ-євангелісти вважають кретинами всіх інших.
Ну ок.

Взагалі, якщо припустити що робітник нічого не вміє без LLM, але зможе вирішити закити хоча в одну таску з LLM, то ми отримаємо нескінчений буст при нульовій цінності самого робітника.

Чого не було ніколи у дійсності, і тому не буде і з ШІ.

Тобто якщо у такого робітника нульова цінність, то він перестає бути робітником, а стає той, який має якийсь менш поширений скіл.

От яка цінність скіла — вмію дихати повітрям?

Дихати вміють всі, а хто не вміє — ну вони з нами тимчасово.
От я, наприклад, не облизую стіни і «в міру токсичний, але толерантний» =D

Ну, цінність трактористів на фоні конюхів не впала а й виросла. Правда трактористів на одиницю виробленої продукції на порядок менше ніж конюхів. Вот конюхи, ШІ дисиденти, їх цінність буде падати.

Зізнаюся, колеги: останні кілька днів ця гілка дискусії була виділена під польове тестування нашої експериментальної системи автономних агентів. Внутрішня назва — «Хайпогенератор 1.0».

Проте змушений зупинити роботу системи раніше терміну. Алгоритми контролю зафіксували в опонентів критичний рівень «токсичного шуму». На жаль, семантичне поле дискусії деградувало швидше, ніж ми очікували.

Наразі робота системи зупинена для внесення виправлень в агенти перевірки семантичного-синтаксичного дрифту. Виявилося, що поточні моделі ще не готові до обробки настільки високої концентрації втрати конструктиву.

Дякую «ШІ-євангелістам» за участь у тестуванні. Ви самі стали найкращим датасетом для підтвердження головної тези статті: безвідповідальне використання технології та «вайб-кодинг» без кордонів неминуче ведуть до помилок, втрати контексту та ризиків, які ми поки що не здатні повністю контролювати.

Йдемо допрацьовувати протоколи безпеки. Кому цікаві реальні дані, а не результати роботи нашого «хайпогенератора» — чекаю вас у репозиторії. Не перемикайтесь, далі буде ще цікавіше. 😉

Я просто спитати...

Чи значить це, що ми більше не зможемо бачити коментарі людей, яким не дозволено отримати «галочку» на DOU? За надуманими причинами власника, чи сором перед належністю до того власника — не важливо...

Просто цікаво. Чесно-чесно.

Напиши правду, подзвонив СЕО і сказав не позорити Developex компанію😅

Дослідження: розробники, що використовували ші сповільнилися на 19%, хоча суб’єктивно відчували пришвидшення на 24%.
Ші оптимісти в цьому топіку: ці дослідження фігня, там рівняють мух з котлетами, я бачу пришвидшення своєї роботи мінімум на 43%.

Виталия довели до того, что он стал писать комменты сам, а не прогонять через ChatGPT — стиль написания резко меняется) вот интересно: в мире все больше код пишут агентным способом, а вот в соцсетях за использование ИИ в постах могут и забанить. А у Виталия все наоборот))

в мире все больше код пишут агентным способом

Це логічно. Всі хочуть на власному досвіді дізнатися, як ефективно це робити. Але, бездумне використання буде мати жахливі наслідки для компаній.

А зачем бездумно? С умом. Я Виталию предлагал: не проецируй бездумно непонятно чьи отчеты на свою компанию. Найди внутри мотивированного евангелиста, сколоти вокруг него небольшую группу 3-5 человек и попробуйте адаптировать agent coding под своих людей, свои процессы, свои проекты, постепенно масштабируя личный опыт в случае успеха Потом полезная статья на ДОУ будет. Но нет же, его тянет ИИ слопом гитхаб репо забивать 🤷🏻‍♂️

Це ваша бульбашка зараз. Поради про фази пілотів та групи ентузіастів — це база, яку і так використовують усі, і ми в тому числі. Це не ноу-хау, а звичний робочий процес.
Але це знову вирішення проблем на мікрорівні. Глобальна проблема нікуди не зникає: як використовувати стохастичну за своєю природою технологію безпечно в масштабах індустрії?
Локальні виграші та експерименти мають усі, ми теж. Але одне не скасовує іншого. Проекти треба починати не з вибору останнього Опусу, а з моделювання ризиків для бізнесу клієнта. І деякі речі не варто починати взагалі, якою б крутою не була нова модель.
Бо коли заделіверене рішення спричинить реальні збитки — постане питання відповідальності. Хто за це платитиме?
• Розробник, якому подобалося «вайбкодити» на свіжій моделі? Ні, він не захоче.
• Клієнт? Теж ні, він платив за результат, а не за лотерею.
• Вендор? Він захищений дисклеймерами на роки вперед.
Збитки нестиме не вендор чи інженер, а компанія, яка створила цей продукт. Саме тому на рівні компанії важливий індустріальний, працюючий механізм безпеки. Пілоти та групи «евангелістів» допомагають лише до певної межі. Так можна накопичити локальний досвід, але неможливо створити універсальний рецепт надійності. А без нього це не інженерія, а гра в рулетку за гроші клієнта.

звичний робочий процес

так чего ж вы его давно не реализовали? из пустого в порожнее только переливаете свой алармистский AI slop

вирішення проблем на мікрорівні. Глобальна проблема нікуди не зникає: як використовувати стохастичну за своєю природою технологію безпечно в масштабах індустрії?

в рамках индустрии Developex — это именно микроуровень и есть. не занимайтесь спасением мира — займитесь более приземленными вещами. еще раз посмотрите на свой тайтл — Delivery Head. ваше дело — максимально эффективным способом деливерить веб-аппки в рамках небольшой компании, а не переживать за глобальную индустрию.

неможливо створити універсальний рецепт надійності

ну отчего же, у вас получилось. если ничего не делать — то ничего и не поломается, вот он — универсальный рецепт. повод для научной статьи на arxiv и серии постов на ДОУ :)

Найди внутри мотивированного евангелиста, сколоти вокруг него небольшую группу 3-5 человек и попробуйте адаптировать agent coding под своих людей, свои процессы

Та так всі клмпанії (крім Developex?) і робили, але ± рік-два тому.
Тепер вже пішло масове впровадження, вже є описані гайди, приклади, документація.

Я тому і дивуюсь автору, бо хто не як делівері менеджер мав б знати що клієнти погоджуються на +50% рейти інженерем де буде agentic flow.

Та так всі клмпанії і робили, але ± рік-два тому.
Тепер вже пішло масове впровадження, вже є описані гайди, приклади, документація.

ну еще не поздно, шишки уже набиты, гайды написаны, модели повзрослели. бери и делай. но Виталию некогда — он глобальную индустрию от Model Collapse спасает :)

Так а чим ви не задоволені?

я всем доволен, наоборот, приветствую, когда люди в общении между собой пишут живой текст, без обработки ChatGPT

так это же вайбщение, можно общаться эффективнее на 300%

LLM чудовий трансформер, він може писати будь яким стилем. Ви точно з LLM багато працювали???

у меня глаз наметанный, участие ChatGPT в тексте я вижу сразу. более того, я делал даже сервис по extract/apply tone of voice, он работает в продакшене у клиента. и заверяю, что качественно имитировать живой человеческий текст очень сложно.

и вот такие утверждения

він може писати будь яким стилем

как раз и выдают дилетанта

Мої статті яка LLM редагувала? Питання не про voice, питання про text.

Оч крутая статья.
Могу сказать на личном опыте.
Что работает:
Создание небольших проектов с хорошо описанной функциональностью (MVP либо как у меня, например, проекты с тестами);
Изолированные таски, для выполнения которых не нужно глубоко лезть в архитектуру проекта;
Задачи, аналоги которых уже решены на проекте

Что не работает:
1. Сложная логика, особенно если нет аналогичных решённых задач;
2. Впиливание огромных record классов на 2000+ полей;
3. Фича, взиамодействующая с половиной огромного проекта

Почему не работает: патамуша контекстное окно ограничено, а окно фокуса — ещё меньше. С учётом того, что контекстное окно у каждой новой модели увеличивается к 10 раз в среднем — есть шанс, что через какое-то время проблемы 2 и 3 решатся. С 1 — всё намного печальнее.

Немножко хуже — размер контекстного окна не помогает, не имея возможностей к абстрактно мышлению, LLM забывают и путаются в информации. Они не могут упорядрчивать в иерархии абстракций, строить онтологии. И, похоже это их фундаментальна проблема. Фантастика из хайпа ИИ отменяется.

Но и хорошая новость — инструментарием и инструкциями им можно помочь это делать.

Компьютер тоже ничего кроме как байты гонять не умеет.

Немножко хуже — размер контекстного окна не помогает, не имея возможностей к абстрактно мышлению, LLM забывают и путаются в информации. Они не могут упорядрчивать в иерархии абстракций, строить онтологии. И, похоже это их фундаментальна проблема. Фантастика из хайпа ИИ отменяется.

Так, але все-одно сильно покращується — че reasoning скіли так і контекстне вікно. Там, де раніше з якимось sonnet 4 чи gpt 4.1 треба було з промтами танцювати з бубном, opus 4.6 і gpt 5.2 ті задачі зараз з пів слова вирішують. З промтами все-одно треба танцювати, але вже для вирішення значно об’ємних і складніших задач. Ну і плюс агенти беруть частину танців з промтами і контекстом на себе. .

Но и хорошая новость — инструментарием и инструкциями им можно помочь это делать.

Во, саме тому тулл інжінірінг і контекст інжиніринг це не надумані, маркетингові скіли а таки реальні скіли, які вимагають десь пів року практики. А то деякі пишуть що це фігня, за 2 дні учиться (що там ті промпти писати?), а потім дивуються що не працює.

Создание небольших проектов с хорошо описанной функциональностью (MVP либо как у меня, например, проекты с тестами);
Изолированные таски, для выполнения которых не нужно глубоко лезть в архитектуру проекта;
Задачи, аналоги которых уже решены на проекте

Ну тобто 90% задач )

2. Впиливание огромных record классов на 2000+ полей;
3. Фича, взиамодействующая с половиной огромного проекта

так як це не так часто треба робити

1. Сложная логика, особенно если нет аналогичных решённых задач;

зробить якщо нормально описати, інше діло що чим складніше логіка, тим більше і складніше промтами описувати.

Ну тобто 90% задач )

Зависит от типа проекта. Если это энтерпрайз, ещё и монолит к примеру — то там отнюдь не 90%, ибо высокая связность проекта.

та як і не моноліт.
казка про мікросервіси вже теж відома.
як там та стаття називалась: «Кінець мікросервісного безумства у 2018 році».

коли у вас купа тих мікро- різного типу — нічим система у загальному не простіша, а навпаки — складніша, бо тепер у вас купа асінхронної комунікації там, де у моноліті була проста сінхронна.

а навпаки — складніша, бо тепер у вас купа асінхронної комунікації там, де у моноліті була проста сінхронна.

Система в цілому не складніша. Ось шукати баги в ній пересічному «синхронному» розробнику дійсно буде складно. Тому що традиційний імперативний підхід там не можна використовувати, ані до розробки коду, ані до його дебага.

Хоча з архітектурної точки зору там все буде доволі примітивним: черги, шини, обробники (мікросервіси та роутери). Що саме цікаве, є вже купа систем, які це зможуть зробити з високою ефективністю, бути тим клеєм, що поєднає всі ці сервіси до купи.

Зависит от типа проекта. Если это энтерпрайз, ещё и монолит

моноліт для АІ це найпростіший проект (та і для девів також).

Набагато гірше коли в тебе 20 сервісів, кожен спілкується через якесь АПІ/меседжінг де куча філдів а юзається реально менше половини

Для AI в цілому все одно, якщо є гарні контракти та чіткі межі контексту. Та і для девів також (я з власного прикладу, не буду казати про усіх).

То правда, любий може стати міліонером, краще бути богатим та здоровим, ніж бідним та хворим,
та й взагалі,

Треба робити правільно, а неправільно — не треба робити.

Насправді розпрділені системи набагато важче, бо дуже багато нюансів забувають, а особливо коли іде розмова про ретрай чи обробку помилок і розподілені транзакції. Навіть досвідчені часто плутаються. Із монолітом все простіше як мінімум через транзакційність та обробку помилок в одному раниаймі та навіть процесі чи веб ріквесті. У розподіленій системі складність переноситься на рівень інфраструктури і просто якимось визовом методу вже не залікуєш проблему. В монолітах майже всі флоу це юзер флоу, із чітким початком — веб ріквест користвучем і з чітким кінцем та відповідю користувачеві 200/404/500, коли мікросервіси то починається асинхронні флоу котрі вже не пофіксишь якимось ерормеседжем із 500-кою і з проханням натиснути кнопку сабміт чи перезавантажити сторінку знову.

Ви стверджуєте, що мені буде складніше утримати 15-ть рядків коду мікросервісу (реальний приклад з моєї практики) та SAGA-паттерн (наприклад) ніж моноліт на 1K LoC з усіма фічами.
Я все правильно зрозумів?

Слабкий в тебе досвід значить. Мікросевріси дуже швидко обрастають тим самим що і моноліти, тільки тепер у тебе іще і сага, месдж брокери, ретраї чи роллбек флоу...Удачі ;-)

А, ми от так будемо розмовляти... Добре.
Я вмію тримати робастною систему так, щоб її мікросервіс вкладався в 15-ть рядків коду. А ти наговнокодив херню навколо свого, що він тепер перетворився на «мікро-моноліт». Дійсно, такого досвіду я не маю. Але скажу по правді — я б на твоєму місці таким не вихвалявся.

Навіщо в мікросервіс ретраї засовувати? Це не їх задача, це задача транспортного шару.

Але, якщо бажаєте залишатись в полі інженерної дискусії...
Цікаво, що ви описуєте еволюцію мікросервіса до надскладного вузла з обв’язкою як неминучість. Для мене це схоже швидше на неконтрольоване зростання.
Можливо, у нас просто різний досвід підтримки систем у стабільному стані.

Блін чувак ти як перший день родився. Наче то всюди клін код та полірують 100500 раз днів увесь той код...Усе це лишається на співбесіді та на понтах на форумі які вони тут усі супер мегаахітекти і як вони круто пишуть не те що АІ слоп і вообще всі гамнакодері а вони дартаньяни і зараз мені тут почнуть доводити що я не правий. Удачі :-)

Дякую за побажання. Але ліпше прибережіть «удачу» собі — мені здається, вам потрібніше буде.

ты сча хвастаешь местом работы, где стараются делать вопреки здравому смыслу?

Вам як кодеру звісно простіше.
Вас кодерів ШІ і замінить, і я не дочекаюсь коли накінець.

Розмова ж йде про рівень програміста. То не ваше

Цікаво, що «кодер» звучить як образа.
Я завжди вважав, що здатність писати робочий код — базова властивість програміста, а не щось вторинне.

То все пішло певно від механізації процесу розробки та галерних оверградацій — кодери-тімлідери-архітекти-девопси-etc, коли вихід за рамки своєї мікрочастинки процесу розглядається як його порушення. Напевно навіть і не дивина що кодери іноді не знають чи їх свіженаписаний софт хоч робить якось (бо вони тільки пишуть), а тімліди-етс самі і не напишуть нічого (забули, якщо навіть і вміли колись) зато можуть поговорити як то треба робити:).

У списку кодери-тімлідери ви пропустили — програмісти.

А про те що тімліди самі не і не напишуть нічого, це те що писав раніше — молоді пацанчик мають кумедне уявлення про світ розробки і людей в ньому.

Кодер звучить як образа з часів коли я починав — з 90их.
Думка кодерів не має значення, це найнижчий рівень виконавця.
Нижче в останні років 10 тільки «вайтвшник» :)

з 90их

як явно у зневажливому тоні — у нас певно пізніше з рольовими розподілами у мас-продакшен, тобто десь з розквітом айті бульбашки, галерами та оверградаціями

Якщо почитати лінкед дискусії, англомовні, про «то кого ж замінить ШІ» — то там так само, просто ну дуже політкоректно :)
Особливо прикольно читати там дискусії між сі левел з їх x10 прискоренням і принципал інженерами. Такі ввічливі... Якщо ж перекласти на нашу, то ті принципал інженери пишуть — та ти довбо-б, хоч і CEO.

Так що це не в нас, це загально галузеве, і давно.

Як там, ще у Кента Бека :
«Любий дурень може написати працюючу програму».

дискусії між сі левел з їх x10 прискоренням і принципал інженерами. Такі ввічливі ...

the understatement is a thing)

це загально галузеве, і давно

так, давно, і було зазначено тільки відносно наших 90х що я такого не пам’ятаю

Як там, ще у Кента Бека :
«Любий дурень може написати працюючу програму»

Малася на увазі цитата
«Any fool can write code that a computer can understand. Good programmers write code that humans can understand.» від Martin Fowler?

Взагалі кажучи яркі цитати то як меми, прикольно але без контексту щодо чого то було не набагато більше ніж «ярко».

Малася на увазі

книжка Кента Бека «Implementation Patterns», у перекладі: «Шаблоны реализации корпоративных приложений».

Де він пояснює цей вираз, як передмову до змісту і сенсу своєї книжкі.
Так, інет видає що цитата належить Фаулеру :)

Що від того змінилось в мому досвіді і світогляді на розробку?
Нічого :)

Взагалі кажучи яркі цитати то як меми, прикольно але без контексту щодо чого то було не набагато більше ніж «ярко».

ну так.
меми як пароль, детектор свій-чужий.
якщо мем тра пояснювати — то маєш справу з чужим :)

і з життєвого досвіду — «як тра пояснювати — то не треба нічого пояснювати»

Нижче був оператор. Ієрархія була така: постановник завдань, який описував задачу природньої мовою, алгоритміст, який малював блок-схеми, кодер, який перекладав блок-схему в код, оператор, який вводив код, запускав його та видавав результат.

Є певна агалогія зі сучасними LLM. Але... дуже багато багів виникало через непорозуміння на рівнях.

Ви описали сферічного коня у вакуумі. Який навіть теж якийсь правдавній, до революції персоналок 80их років. Які змінили розробку, ролі і процеси в ній.

У вас описання стану мабуть десь 60их років.

Так, це з мейнфреймів (60-ті чи 70-ті) Кодувальник звідтий пішов, що мова для програмування була англійська, а перекдасти її на формальну мову вважалося технічною справою, кодуванням.

Модель, у якій «думка кодера не має значення», для мене ніколи не працювала. Саме вони першими бачать архітектурні наслідки рішень.

Тому я не бачу сенсу ділити інженерів на «нижчих» та «вищих».
Для мене рівень програміста визначається насамперед рівнем відповідальності, а не дистанцією до коду.

Просто зафіксуймо, що у нас різні погляди на це.

Саме вони першими бачать архітектурні наслідки рішень

вони не бачать. а тупо кодять.
бачать — програмісти.

Тому я не бачу сенсу ділити інженерів на «нижчих» та «вищих».

а я не тільки інженерів.
а всіх так ділю.
бо нерозуміння хто перед тобою, з ким маєш справу — дорого тобі обійдеться.
знати — кому яку таску можна дати, без ділення «висших» та «нижчих» просто неможливо.

Просто зафіксуймо, що у нас різні погляди на це.

так.
і перша причина зазвичай:
є люди які невідповідальні за роботу інших — у них успіх/факап тільки особистий
а є що — повністю залежать від роботи інших: і успіх і факап будуть командними, але відповідати за факапи інших — будеш ти.

а у рівність людей я давно не вірю, і ніде її не бачу.
це все розмова для гуманітаріїв про мораль і ті.

15 рядків коду то вже не не мікросервіси, а оркестратор сценаріїв по типу n8n
і обслуговуе таку систему або величезний моноліт а бо ще більший та болючиший «макросервіс» особливо якщо воно ще повинно по часу бути «точним» а фізично розкидано деінде
Я сам писав по роботі обробник сценаріїв шоб потім менш кваліфіковані спеціалісти могли безболісно працювати описуючи на Lua

Взагалі в 15 рядків ви навіть звичайну авторизацію з брокером не запресуєте, тільки якщо в довжину там буде 1000+ символів. Саме просте що я знаю це NATS і там навіть без всяких захистів і криптографії тільки зв’язок на 100+ рядків вийде.

15 рядків коду то вже не не мікросервіси, а оркестратор сценаріїв

Звичайний мікросервіс.
За давністю я вже не пам’ятаю деталей, але це був типовий дата-сервіс — нічого цікавого.

Взагалі в 15 рядків ви навіть звичайну авторизацію з брокером не запресуєте,

Мій тейк якраз у тому, що за правильно спроєктованих скоупів і архітектури це не обов’язково реалізовувати всередині сервісу.
Такі речі можуть вирішуватися на рівні обв’язки, інфраструктури або архітектурних патернів.

Ви, до речі, самі на це натякнули, коли згадали про «моноліт/макросервіс» на сапорті. Але це не означає, що підтримуюча частина системи обов’язково має бути велетенською або болісною.

Ну тобто 90% задач )

фік його знає звідки ця цифра.
в мене точно таких задач — меншість.

але, от і виходить причина дискусій — у кого таких задач 90% — ну так, ШІ налагодив, бац, бац, він і робить все.

зробить якщо нормально описати

і хто ж це опише?

це теж постійно якесь:
«у вас немає хліба? ну то їжте тістечка!»

АІ скептики, потратьте тих 30 годин на місяць, поставте курсор, заплатіть 20$ і навчіться працювати в АІ режимі.
Або ви станете безробітними і без шансу отримати роботу.

На всіх співбесідах це питання #1. В мене на проекті на інтерв’ю дають кодінг таск де треба юзати АІ.

Спробуйте найпростіший флоу, всякі MCP вже потім прикрутите.

1. Скопіювати опис тікета до АІ, скопіпастити заготовлений промпт, надиктувати свою ідею як зробити (бо писати довше), піти по каву (чи переключитись на інший проект якщо грошей мало).
2. Через 5 хв перевірити що все працює, тести проходять і чи асерти в тестах адекватні. Якщо все ок то промт комітнути з автогенерованим коміт меседжем. Код тут ще НЕ рев’юваєм.
Якщо асерти погані(низької якості) то оновлюєте конфіг агента або гайди по проекту і наново.
Перших N тікетів це треба буде робити бо в кожного проекту своя специфіка.
3. Фіча/фікс працює, тоді скопіювати промпт, заранити іншого агента щоб зробив код рев’ю. Подивитись що він знайшов, сказати йому пофіксати, деколи вказавши як.
Тут деколи апдейтуємо гайди для самого агента якщо він вказує false positive (для поточного проекту) проблеми
4. Якщо були правки після рев’ю агента (а вони завжди є), то перевірємо чи працює фіча (можуть бути тести чи вручну).
Якщо все ок то промпт на коміт.
5. Тепер рев’ю вручну, зазвичай все ок. Якщо ні то фіксаємо гайди для агентів що не так (щоб не робив так дев агент, і щоб ловив рев’ю агент). Можна фіксати вручну або через АІ.
6. Створюмо мердж реквест з авто генерованим описом, сквош комітів. Я ще добавляю відео/скріншоти якщо це юайка.

Останні ±2 місяці я роблю 6 крок (зі статусом драфт), а тоді вже 5. Так привичніше рев’ювати, + тоді зараниться авто рев’ю іншим агентом (codex), сонар та інші чеки ще до того як я рев’юваю код.
Якщо прилітає код рев’ю комент від людини чи АІ то тупо копіюєте комент і кажете АІ перевірити чи валідний, і якщо так то пофіксати.

Секрет економії часу це добре описані гайди для агентів, і не лінуватись оновлювати їх коли не згенерено правильно з першого разу. За кілька тижнів активної розробки будуть покриті більшість кейсів «специфіки» проекту.

Промпти прості, типу зроби згідно гайдів таких то, мінімум змін, рефакторінгу не роби.
Кароч, промпти кожен сам під себе налаштовує, комусь заходить детальний опис як буде робити і кілька варіантів вибрати, комусь зроби відразу.

Для генерення гайдів і промтів юзайте АІ, навіть чат гпт підійде.
Є публічні репозиторії з гайдами, шукаєте по своєму стеку і добавляєте.

В мене на проекті на інтерв’ю дають кодінг таск де треба юзати АІ.

Краще орієнтуватися на «треба» результат, а не на — «треба» інструмент.

Краще орієнтуватися на «треба» результат, а не на — «треба» інструмент.

Я про це і пишу.
«Треба результат» — залишись з роботою чи її знайти

О, я схожий флоу спробував першим. Але є проблема...

Секрет економії часу це добре описані гайди для агентів

Я роблю гарні гайди, RFC, ADR etc., виставляю правільні пермішени для кожного агента, конфігурую; і так пару раундів, поки все не запрацює, як мені подобається.
В останній раз я так за п’ять вечорів зробив фічу, яку б руцями написав... ну за пару годин може, якщо б кожні півгодини відходив зробити каву. І наперед скажу: моя мета була саме відпрацювати воркфлоу, а не «зробити фічу якісно і швидко».

А якщо більш приземлено і ближче до реалій. Без допомоги ШІ я умовну годину пишу імплементацію, і пару хвилин, щоб «причесати» перед відправкою на рев’ю; і ще хвилин 10 на рев’ю, апрув та мердж. З ШІ — я за п’ять хвилин генерую код, а потім півгодини його за допомогою ШІ латаю, ну і рев’ю займає хвилин 15 — 30. Цифри умовні...

А якщо ще більш приземлено: от ніколи не було у мене такого, щоб на питання «А чого фіча ще не готова», я казав «розумієш, я не дуже швидко друкую.»

так зато смотри насколько ты продуктивен, так бы 2 часа потратил, а так 5 вечеров ни строчки кода не написал, это около 300%

Cправедливості заради, у згаданих доках були сніпети коду, і суто технічно сама документація іде як +LoC у diff. Але, якщо підключити правильний маркетинг — то все так, не підкопатись.

Тому що всі ці підходи, РФС, АДР — це спроби керування стохастичною чорною скринькою. Воно не гарантує згідно з теорії контролю результату. Це дурна робота — просто за визначенням. Тобто це принципово — неможливо зробити нормально працюючим без корегуючої петлі зворотнього звʼязку яка буде постійно «діяти». В свою чергу використання агентів з ШІ яки теоретично могли б допомогти на практиці проблему не вирішують бо у них в середині теж ЛЛМ. І ми зістикаємось з проблемою каскадування помилок. Як би ви це все на накручували, хай там хоч агент на агенті — це не надійний детермінований стек і воно в якийсь момент перестає працювати. І чим більше накручуєте о цю схему «агент агентом агента погоняє» тим більше росте варіативність потенц. каскадних помилкових комбінацій. Тобто математично — це задача без рішення. Ви ж не посадите під стіл до кожного програміста який купив ШІ копайлот «магічного гнома з свідомістю людини» який буде 24 на 7 працювати корегуючи зворотнім звʼязком. Не поставляє вендор такого гнома з копайлотами нажаль. Ви і є цей гном — а значить неминуче будете завжди витрачати час не на створення цінності свого продукту — а на корегування чорної скриньки. І ця складність і не надійність живе просто всюди поряд з ллм. Наприклад — є вікно контексту і є вікно уваги. Вікно контексту — це технічна характеристика — скільки токенів ллм візьме на вхід. А от як виміряти вікно уваги — воно ж нормально не квантифікується і плаває в залежності від розміру, структури та складності інпуту. І виходить що з цим працювати — це не інженерія. Це колдунство. І правильне рішення — вкрай обережно до цього ставитися. Прості задачі, код який не приведе до ризиків, мвп зробити, одноразовий скрипт написати і т.п. Ну для фану можно погратися з більш складними рішеннями де це вже «агент на агенті» — але чисто для себе. Бо в реальний роботі це зʼїдає час, а не економить, дорожче ніж без цього і ризиків більше

Ще прикол. ШІ євангелісти, не місцеві, а інтернетівські часто вкидають що от от завтра зʼявиться АГІ. Так от це очевидно маячня, ЛЛМ це дуже не великий крок в цьому напрямку та і все. Але — щоб зробити ЛЛМ надійною чорною скринькою стохастики — нам справді може допомогти реальний АГІ який і має виконувати функцію контролера і забезпечувати постійний зворотній звʼязок. Але нафіг нам буде треба ті ЛЛМ якщо ми вже створимо АГІ?

«агент на агенті» — але чисто для себе. Бо в реальний роботі це зʼїдає час, а не економить, дорожче ніж без цього і ризиків більше

Vitalii Oborskyi, а це тільки ваша така думка чи Developex теж притримується такої ідеї?
У вас не використовують AI-agentic практики? У вас це не стандарт для нових проектів/клієнтів?

Ви не думали що ви просто дурніший ніж СТО, інженери чи менеджери FAANG-подібних компаній? І тому не можете зрозуміти чого вони просувають АІ, вкладають гроші, трейнять людей і звільняють АІ-скептиків?

Перехід на оцінку мого IQ та апеляція до авторитетів FAANG — це зрозуміла реакція, коли ламається звичний наратив. Проте в інженерії та управлінні ризиками ми оперуємо не «вайбами», а цифрами та теорією надійності. Давайте розберемо вашу тезу максимально збалансовано:

1. Різниця в інтересах: СТО та інженери BigTech — це надзвичайно розумні люди, які зараз вирішують завдання глобального масштабу: як виправдати сотні мільярдів CapEx на залізо та енергію. Їхня мета — масова адопція. Моя ж мета як Delivery Head — Deliverable. Це конкретний продукт, який має працювати стабільно. Те, що стратегічно вірно для продавця «лопат» (Вендора), може бути технічно згубним для конкретного проекту клієнта через неконтрольовану складність.

2. Математика надійності: Навіть якщо FAANG зараз перебуває у стані «субпрайм-кризи» (надування адопції в очікуванні прибутків), фізику системного контролю це не скасовує. Коли ви будуєте систему за принципом «агент на агенті» (послідовна конфігурація), загальна надійність системи розраховується як добуток надійності кожного елемента:
R_{sys} = R_1 * R_2 * R_3 * R_4 * R_5.
Якщо надійність кожного елементу 0.8 то ймовірність того, що на виході ви отримаєте коректний результат без втручання людини — лише 32%. Для BigTech помилка моделі — це статистика. Для сервісного бізнесу — це завалений дедлайн, юридичні ризики та збитки. Ми не можемо дозволити собі будувати архітектуру на «стохастичному піску».

3. Позиція Developex: Ми не «АІ-скептики». Ми — прагматики. Наш стандарт — це відповідальність за результат (Risk Management). Ми використовуємо ШІ-інструменти там, де вони дають цінність, але ми ніколи не замінимо детермінований контроль «магією». Наше завдання — бути тим самим «контролером», який гарантує якість, а не просто швидкість генерації.

4. Про «дурість»: В історії ІТ помилялися всі — від малих стартапів до гігантів (згадайте Google Glass чи Windows Phone). Визнавати системні ризики на піку хайпу — це не ознака «дурості», а елемент професійної етики.

Бути професіоналом означає бачити різницю між маркетинговим звітом вендора та реальним TCO системи через два роки.

Додам ще один момент, бо ми з вами, схоже, мислимо в різних площинах, і ви знову можете сприйняти це як «наїзд» на ваш персональний досвід, хоча це зовсім не так.
Я цілком припускаю, що у ваших локальних умовах ви побудували робоче рішення методом спроб і помилок, особисто виконуючи роль того самого «корегуючого гнома» для ЛЛМ. Але цей успіх не масштабується автоматично на рівень всієї індустрії. Навіть ваш персональний сетап може в будь-який момент зламатися і потребувати нових сеансів «гномотерапії», щойно в систему «влетить» додаткова складність або зміняться вхідні параметри.
Тобто, по суті, між нашими позиціями немає прямого протиріччя. Є просто погляди різного масштабу: локальний успіх проти системних ризиків розробки

Бла-бла, один АІ шлак (хоча може то у вас таке мислення)

Я вас чітко запитав, можете відповісти Так/Ні без простині тексту без смислу?

....«агент на агенті» — але чисто для себе. Бо в реальний роботі це зʼїдає час, а не економить, дорожче ніж без цього і ризиків більше....

Vitalii Oborskyi, а це тільки ваша така думка чи Developex теж притримується такої ідеї?
У вас не використовують AI-agentic практики? У вас це не стандарт для нових проектів/клієнтів?

Вимога відповісти «Так/Ні» на питання про складні системи — це антиінженерний підхід, але я відповім максимально прямо, щоб зняти ваші сумніви:
1. Позиція Developex: Моя позиція як Delivery Head — це і є відображення нашого підходу до управління ризиками. Developex — це професійний сервіс, а не майданчик для хайп-експериментів за кошти клієнтів.
2. Щодо стандартів: Нашим стандартом є передбачуваність та якість доставки. Ми використовуємо AI-інструменти (в тому числі агентські практики), але лише там, де можемо гарантувати результат. Будувати критичні системи на ланцюжках стохастичних агентів без детермінованого контролю — це не стандарт, це професійна безвідповідальність.
3. Про FAANG: У гігантів та сервісного бізнесу різні моделі відповідальності. Вони можуть дозволити собі помилку на мільярд, ми — ні.
Більше «простирадл» не буде. Математику надійності я навів вище — вона об’єктивна, незалежно від того, вірите ви в неї чи ні. Успіхів у вашому вайб-кодингу

Позиція Developex: Моя позиція як Delivery Head — це і є відображення нашого підходу до управління ризиками. Developex — це професійний сервіс, а не майданчик для хайп-експериментів за кошти клієнтів.

Жаль що Developex піде на дно з таким підходом. В той час як всі великі галери вже переводять існуючі проекти на агент процеси, ви думаєте що це «хайп»

Про FAANG: У гігантів та сервісного бізнесу різні моделі відповідальності. Вони можуть дозволити собі помилку на мільярд, ми — ні.

Лол

Ви зробили низку безпідставних тверджень, вільно трактуєте мою позицію і вириваєте фрази із контексту.
Які саме компанії «зробили ставку»? Ми її теж робимо, але з тверезим прорахунком ризиків. Ви усвідомлюєте, які бюджети у цих компаній пішли на інфраструктуру і яка їхня спроможність це фінансувати? Який у них реальний відсоток успішної адаптації та показники TCO (Total Cost of Ownership)?
Без відповідей на ці питання ви просто даєте поради іншим у декларативній формі — ризикувати їхніми грошима заради хайпу. Не хочете цей «банкет» оплатити з власної кишені? Або взяти ризики за таке неконтрольоване впровадження в регулейтед проекті? Навряд чи. Тож поки що ви продовжуєте маніпуляції та атаки ad hominem, і нічого більше

СТО та інженери BigTech — це надзвичайно розумні люди, які зараз вирішують завдання глобального масштабу: як виправдати сотні мільярдів CapEx на залізо та енергію

Это ложный тезис, ты его просто выдумал себе в угоду. Big tech сфокусирован на том, чтобы удержать лидерство. В современном цифровом мире первый получает 95%, а остальные — крохи со стола.

СТО, інженери чи менеджери FAANG-подібних компаній?

забув менеджерів Lehman Brothers із золотими парашутами

ну інвестбанкірство і безпринципне намахування то синоніми, а от фанімеї і фредімаки в часи тих самих леманів вважалися ж ніби чимось справжнішим (та і регуляціями ж ніби ще покритішими)..

Загалом погоджуюсь. Ви вірно підмітили першопричину — недетермінована природа LLM. Помилки, code smells та їх накопичення — це своєрідна «багофіча» будь-якого сетапу, де нейромережа є фундаментом.

Але недетермінована — не означає неконтрольована.

Посилаючись на свій (вже дещо застарілий) досвід роботи з нейронками, скажу коротко.

Ми справді не можемо напряму керувати «вікном уваги». Але можемо керувати умовами, в яких воно працює.

Як мінімум — через threshold-механізми та відсікання шуму. Технічно ми не керуємо увагою, а зменшуємо ентропію інпуту та простір потенційно нестабільних станів.

Як максимум можемо:
— керувати ентропією та структурою інпуту;
— застосовувати динамічну компресію контексту;
— використовувати multi-pass reasoning (багатокрокову перевірку / повторне узгодження результату);
— вводити формальні валідаційні шари та зовнішні інваріанти.

Ми не можемо зробити систему детермінованою — але це і не потрібно.
Нам буде достатньо зробити її робастною.

На мою думку, проблема не стільки у стохастичності, скільки в тому, що LLM не має внутрішнього механізму відповідальності за інваріанти. Вона не «знає», що порушила систему.

Тому інваріанти мають бути винесені назовні:
— обмеження степенів свободи;
— формалізовані контракти між шарами;
— валідація на кожному критичному кроці;
— control loop (ви про нього згадували як раз ;-))

Складно? Так.
Неможливо? Ні.

Питання у ціні такої системи, складностях інтеграції, вартості помилок та відповідальності за них — це вже поза суто технічною складовою.

О ні, це не «неможливо». Тут ви праві. Просто сьогодні немає нормальної рецептури, зате забагато хайпу.
Згідно з класифікацією систем у «Книзі Чому» Юдеї Перла (та законом необхідної різноманітності Ешбі), ми можемо створити фідбек-луп із елементом контролю лише тоді, коли його внутрішня складність не менша за складність того, що ми контролюємо. Але це — вкрай нетривіальна задача.
Якщо ми будуємо таке рішення для конкретного клієнта, це вже не просто «software development». Це потребує для кожного окремого кейсу реального наукового дослідження. Саме тому я зараз фокусуюся на іншому проекті — систематизації та створенні шару AI Governance, який мав би стати стандартом у таких умовах.
Нам не вистачає саме системного підходу, який перетворив би використання ШІ в «будь-якому проекті» на надійну інженерну практику замість поточного стану, коли це часто стає сеансом «магічного реалізму».
Цей проект наразі має сформовану команду практиків, академічний супорт від представників PMI та математичних кіл, але поки що ми у фазі пошуку ресурсів (capacity):
github.com/...​/uncertainty-architecture

Я от як раз хотів додати, що про «масштабування» я навіть не заікаюсь. Це буде заява на рівні «ну, загалом люди пересуваються». Таке налаштування може потребуватись не те що «під клієнта» — під окремі підсистеми проєкту.

Тобто ви кажете що прокладка посередині на рівні джуна якій треба давати гайди, референси ітд і після якої треба підчищати булшіт це «буст продуктивності» ? Якщо шо я сам юзаю ШІ кожний день і він вирішує добре лише одну проблему — написати щось нове по існуючим референтам, все. Усе інше — це непотрібна складність яка була б простіше якби ШІ не було

ви кажете що прокладка посередині на рівні джуна якій треба давати гайди, референси ітд і після якої треба підчищати булшіт це «буст продуктивності» ?

Так, бо через N ітерацій вже не треба буде чистити, давати гайди і т.п.

В мене х2 закритих сторі пойнтів за 6 місяців, більше годин я на роботу не трачу а приріст суттєвий навіть порівнюючи з іншими девами.

Якщо шо я сам юзаю ШІ кожний день і він вирішує добре лише одну проблему — написати щось нове по існуючим референтам, все

Опишіть детально що саме вам працює а що ні.
Хоча б те що я написав ви пробували?
Бо якщо ви юзаєте безплатний гпт, копіюючи код туди назад, то і результат відповідний)

Юзаю корпоративний копайлот, останній тиждень новий opus 4.6, у репах є mdc файли — тож усюди в молоко.
Що роблю — додаю нові ендпоінти, фікшу баги, стандартна девівська рутина.
Якщо це щось нове де треба писати якийсь інфраструктурний код, або фічу з нуля, то тут ШІ (як я і казав) без референсів починає фігачити отсєбятіну і простіше написати самому. Якщо у вас умовна круда де 90+ відсотків задач це додати нову колонку або підправити текст у ресурсах то так — ШІ вам точно дасть ілюзію того що ви «продуктивний», до того ж основна проблема розробки це не щось написати, а потім це підтримувати
P.S. якщо на кожний коментар де хтось не згоден з тим що ШІ — це панацея і треба просто більше бабла викидати на більше тулів, або моделей, подумайте про абсурдність цього наративу

Що роблю — додаю нові ендпоінти, фікшу баги, стандартна девівська
рутина.
то тут ШІ (як я і казав) без референсів починає фігачити отсєбятіну і простіше написати самому

Потрібно в агент спеці написати «при створенні ендпойнта дивись як зроблено таке то і слідуй патернам в коді».
Мені важко повірити що при стандарній бекенд роботі навіть топ модель не допомагає)
В мене за 3 промпти написало інтеграцію з 3rd party (де треба було замапити ±50 філдів на нашу схему), відсилання і зчитування івенту в sqs, оновило localstack скріпти, створило dto/entity і flyaway db скріпти, написало тести з норм асертами.
Естімейт в таски був 5-7 днів, мені зайняло 3-4 години зробити повністю робочу версію, потім ще 3-4 тестування і фікси специфічних кейсів.
Я згодував надиктовані промпти i graphQL файл 3rdparty.
Більшість мапінг філдів воно змогло само вгадати чисто по назві.

Тому ще раз, мені важко повірити що при норм сетапі АІ не може зробити стандартну роботу добавити API/фікс баг.

Потрібно в агент спеці написати «при створенні ендпойнта дивись як зроблено таке то і слідуй патернам в коді».

Це і мається на увазі про «референси», нічого нового

В мене за 3 промпти написало інтеграцію з 3rd party (де треба було замапити ±50 філдів на нашу схему), відсилання і зчитування івенту в sqs, оновило localstack скріпти, створило dto/entity і flyaway db скріпти, написало тести з норм асертами.

І це я мав на увазі про стандартну круду де агент буде перформити краще ніж у ± нетривіальних кейсах
Коротше кажучі, поради на рівні «run tests until fixed» або «don’t make mistakes»

Що роблю — додаю нові ендпоінти, фікшу баги, стандартна девівська рутина.
І це я мав на увазі про стандартну круду де агент буде перформити краще ніж у ± нетривіальних кейсах

Так у вас вони тривіальні, самі ж написали

Але ок, здаюсь.
Насправді цей топік і коменти підняли мою впевненість що мене не звільнять і що я таки вартую того екстра рейту.
Може справді не всім дано легко переходити на нові технології. Як колись діди сиділи з екліпсом і блокнотом коли джуни юзали IntelliJ

Може справді не всім дано легко переходити на нові технології. Як колись діди сиділи з екліпсом і блокнотом коли джуни юзали IntelliJ

Ні, просто багато розробників вже надивилися тих золотих молотків і чітко знають межі того що ці молотки можуть або не можуть

Тікет — завдання — перевірити — сказати щоб зробили ревью — вручно подивитися — залити у прод. Не бачу тут програміста чи інженера. Бачу оператора конвеєрної збірки машин. Мені таке наприклад не дуже цікаво. Якщо вам це цікаво — то і супер. Не розумію тільки навіщо у кожній статті на Dou у коментах тут це усім доказувати?

Будь тим, хто побудує цей конвеєр. Це не тривіальна задача і куди цікавіша задача, ніж кодити. Там ти таокж кодиш, тільки для конвеєра а не для самої продукта.

только это тривиальная задача, вон сверху описано что делать, квалификация не нужна, самое сложное — успеть сделать кофе за 5 минут

Він написав як використовувати вже зроблений конвеєр. Воно то звучить просто промт туда, промт сюда. Но ти напиши ці промти, напиши, допили інтеграцію з тією ж джирою, гітом, налаштуй саб-агентів. Потім через кілька місяців почнеш упиратися в обмеження TUI і інструментаріїв агентів, і ти почнеш допилювтаи кодом через SDK агентів, описувати свої вокрфлоу кодом які дьоргають агентів через SDK. І це безкінечний процес по тюнингу скриптів, промтів і написання нових скриптів для нових автоматизацій своєї рутини.

І вот коли ти це зробив, до тебе підходить колега який, намагається зробити те саме через один промт в один абзац в умовний клод код і каже не працює, фігню якусь робить. І ти думаєш якби йому відповісти щоб не образити. І таких колег багато, сінйори 40+ років, і ти розумієш як же їм буде важко в новому світі. І потім вони ходять і на ДОУ пишуть коментарі що говно ваш ШІ, а ті, хто пише що не говно — брешуть.

Він написав як використовувати вже зроблений конвеєр. Воно то звучить просто промт туда, промт сюда

любой ии тебе их напишет, надо будет улучшить через тот же конвеер и прогонишь =\

допили інтеграцію з тією ж джирою, гітом, налаштуй саб-агентів

так пишешь типа придется что-то для этого делать а не: «AI! JIRA! INTEGARTION! GO!»

Потім через кілька місяців почнеш упиратися в обмеження TUI і інструментаріїв агентів, і ти почнеш допилювтаи кодом через SDK агентів, описувати свої вокрфлоу кодом які дьоргають агентів через SDK

так же как прошлое

І це безкінечний процес по тюнингу скриптів, промтів і написання нових скриптів для нових автоматизацій своєї рутини

это звучит даже очень скучно

І вот коли ти це зробив, до тебе підходить колега який, намагається зробити те саме через один промт в один абзац в умовний клод код і каже не працює, фігню якусь робить. І ти думаєш якби йому відповісти щоб не образити

ох какие нежности

І таких колег багато, сінйори 40+ років, і ти розумієш як же їм буде важко в новому світі

ты что-то путаешь, они обычно наоборот хотят разговаривать или печатать на английском, а не код писать и разбираться в нем

таких колег багато, сінйори 40+ років

шо за эйджизм? мне 46 😁

Можливо це юнацький максималізм + те що люди забувають що їм теж колись буде 40+. Я у Північній Америці працюю — більшості ПМ 45+, багато інженерів 35+, тому що тут усі технології і почались у 90х роках. Ці люди досі тут працюють, і з ними дуже цікаво співпрацювати та вчитися в них. А молоді люди іноді свою реальність екстраполюють на реальність усіх та щось з піною у рота доказують усім. Це у 35+ проходить, і це обнадіює.

это не в детские шалости, это страх потом встретиться с тем кого обгавкал на доу в реальной жизни

только это тривиальная задача, вон сверху описано что делать, квалификация не нужна,

Береш таску, шукаєш, кодиш, тестуєш. Готово.
Що там складного в тій роботі програміста)

Це не тривіальна задача, це з чого почати)
Як if чи for each)

Береш таску, шукаєш, кодиш, тестуєш. Готово.
Що там складного в тій роботі програміста)

я обратного не говорил, работа программиста тоже тривиальная и шаблонная, но квалификация нужна

Це не тривіальна задача, це з чого почати)
Як if чи for each)

та с чего не начни она останется тривиальной, просто могут быть неадекватные предусловия

«Побудує конвеєр» звучить трохи громко і виглядає більш як менеджмент. А що кодять ші-грамісти не пишучи код, заряджають в̶о̶д̶у̶ промпти?

Це тимчасовий стан.

Що кодери, що вайбкодери, що отакі таскозакривателі — це найнижчий рівень, і якщо хоча б третина з обіцяних можливостей ШІ увійде у мейнстрім — цей рівень зникне.

Це один з поглядів-передбачень — більш розповсюджений. Серед інших які іноді зустрічаються — що ШІ може добре робити каркаси і архітектуру — тобто і цей рівень на вихід до ШІ (див. нп думку AS по цьому пункту в коментах до компілятора написаного за допомогою ШІ).

Якщо суб’єктивно, за рокі після 22 яких тільки і де дискусій і думок не читав про ШІ у розробці.
Але найбільш примітивні, «селюкові» — це на доу. Як від євангелістів, так і від скептиків.
Тому для себе не бачу сенса тут щось сер’йозно обговорювати.
Тільки ескізно, nota bene та потролити :)

І стаття в топіку просто вау за рівнем, автору шана, за працю.
Шкода що у нашому інфпросторі немає де такі публікувати, крім як на ДОУ.

Бо ДОУ, не місце для дискусій.

Бо ДОУ, не місце для дискусій.

або навпаки — тільки для дискусій, а як вони ведуться і стиль їх ведення хто який обирає — то вже додаткова характеристика)

я тому й регулярно поповнюю свій блек ліст у плагінчику :)

а як ведуться, то так, по всякому.
я оцінюю дискусії з точки зору цінності інформації, а не стилю.
і як жартував ще до ШІ — та всі ми в інеті — «боти».
тільки одни генерують те що доводиться скролити, скролити, бо там суцільний шлак.
а є цінні «боти», які генерують те над чим тра думати, навіть коли не згоден.

Це один з поглядів-передбачень — більш розповсюджений

этот уровень может только численно сократиться, но пропасть нет

Серед інших які іноді зустрічаються — що ШІ може добре робити каркаси і архітектуру — тобто і цей рівень на вихід до ШІ

гипотетически может, но фактически это недостижимо

Серед інших які іноді зустрічаються — що ШІ може добре робити каркаси і архітектуру

гипотетически может, но фактически это недостижимо

чому гіпотетично, незважаючи що також більш схиляюся до того що саме процес кодування явно так і проситься під ші-оптимізацію, але і відносно архітектурно-каркасних ші-рішень погляди також доволі reasonable зустрічаються, нп як тут (останній параграф)
dou.ua/...​rums/topic/57614/#3055786
і ще десь, не пам’ятаю де саме, схожі погляди бачив

иметь основанные ни на чем взгляды можно, но это не меняет того факта что для того чтобы ии начал писать архитектуру нужны данные для обучения еще и в большом количестве, этого просто нет. околоархитектурной информации много, но она часто противоречит друг другу и не является тем самым чему надо обучить ии. вот и выходит что гипотетически можно обучить всему, а практически этого не будет

Загальної інформації думаю достатньо при бажанні можна знайти. Чому малоймовірно нп що компілятори такі будуть використувати, тому що то не продукт з мас-продакшен, і певно більша частина того що необхідно для реальних задач — реалізується вже потім у процесі експлуатації. Та ще й купа підрішень, які були обрані на базі врахування різних трейдоф, процеси яких маловідомі комусь окрім авторів (хоча цей пункт — так, можна віднести до — недостатньо training дата). Тобто ймовірність генерації доволі унікальних продуктів, як і необхідність в тому, — невелика.

Але такого типу objections можна розглядати тільки відносно того showcase випадку чи схожих, тобто не загальні. А от каркасно-архітектурні рішення для шаблонних webapps нп, чому б і ні.

А от каркасно-архітектурні рішення для шаблонних webapps нп, чому б і ні

потому что это не про архитектуру хоть ты туда это слово вставил

окей, хай так і залишається на «не про»

что же ты отредактировал, не хо срач?)

но я все равно отвечу, архитекторы почти никогда не занимаются архитектурой, основная занятость это разговоры и «мертвые» документы. и это одна из причин почему архитектуру ии не возьмет, тех людей кто реально занимается архитектурой очень мало

на мой взгляд, при текущем положении вещей, вообще не стоит предлагать AI создать архитектуру сервиса с нуля и потом ее использовать. но использовать как ассистента обычно оказывается хорошей идеей. ты описываешь в общих чертах как ты видишь архитектуру и чего ты хочешь добиться, потом просишь тебе задавать вопросы по всем аспектам, причем неочевидные вопросы, пока не получится ясная картина. практика показывает, что такой мозговой штурм дает хорошие результаты и предложенное в итоге агентом решение остается только дошлифовать и сохранять как план.

на мой взгляд, при текущем положении вещей, вообще не стоит предлагать AI создать архитектуру сервиса с нуля и потом ее использовать

при текущем положении вещей без смены технологии ии дает стабильный результат немного ниже среднего в технических вопросах и как будто бы выше среднего в гуманитарных. это важное исходное условие

но использовать как ассистента обычно оказывается хорошей идеей. ты описываешь в общих чертах как ты видишь архитектуру и чего ты хочешь добиться, потом просишь тебе задавать вопросы по всем аспектам, причем неочевидные вопросы, пока не получится ясная картина. практика показывает, что такой мозговой штурм дает хорошие результаты и предложенное в итоге агентом решение остается только дошлифовать и сохранять как план.

и вот здесь это условие раскрывается. есть несколько вариантов. 1 оператор знает меньше (полное непонимание или низкий уровень квалификации), в этом случае ии очень помогает и тянет оператора вверх. 2 уровень примерно равен (уровень квалификации ниже среднего), ии помогает быстрее применить знания, которые и так есть и дает моральную поддержку, мол, ты таки шаришь, просто сказать не можешь. 3 средний уровень, ии не помогает и не вредит, все его советы простые и очевидные. 4 высокий уровень квалификации, стойкое впечатление что время на печатание тратится впустую, ии не понимает основ, но делает вид что эксперт при этом пытается вывозить софтскилами, многое не понимает с первого раза (а то и 2-3-4-5) и рассказывает как ты бесконечно прав, дает общие советы из разряда надо делать хорошо, а плохо делать не надо

при этом всем этот уровень ниже среднего берется не из уровня специалистов, а из данных на которых модель обучалась, что дает сильную неравномерность по областям знаний

не хо срач? но я все равно отвечу, архитекторы почти никогда не занимаются архитектурой ... архитектуру ии не возьмет

По «не хо» — юнацького запалу для того немає. А погляд-аргумент відносно «не возьмет» побачив/витягнув, того достатньо було щоб отримати трохи більш розгорнутий objection по архітект-пункту.

Загальної інформації думаю достатньо при бажанні можна знайти.

а не треба «думати».
загальної інформації як вчать LLM, і скільки треба інформації щоб добре навчилась — повно, для любого рівня підготовки :)

Ви якось забуваєте що GenAI не AGI, по книжкам з описом абстрактних ідей вчитися не вміє. Йому тра купу — прикладів.
Як до речі часто і людям, навіть на ДОУ: «ой, я заплутався, давай не так абстрактно, а візьмемо от такий конкретний приклад...»
А GenAI плутається ще швидше. І це наслідок його архитектури. тобто підлікувати трішки мабуть і можна, але інвалідом так і залишиться.

Тобто ймовірність генерації доволі унікальних продуктів

Те що кнопка на UI виглядає однаково, ніяк не означає що вона створена — однаково. Що React такий самий як Svelte, а тому однакова архитектура.
Що Laravel, Nest та Spring Boot які обслуговуюють її клік — однакові, а тому архитектура теж буде однакова. І така сама як на AWS лямбдах на Пітоні.

Ви якось забуваєте про той зоопарк. І тому — зоопарк і архитектурних підходів, які тому й несумісні, бо що добре для фронтенда — заборонено для бекенда.
А що архитектурна бест практика на Ноді — фу-фу на Джаві.

Ви якось забуваєте що GenAI не AGI

А навіщо сперечатися навколо intelligence термінів, хай то чи generative чи general-general чи навіть super-general). Хоча іноді і цікаво буває навколо — коли-як-і-яку термінологію обирають і що в неї вкладають, і в цьому плані цікавіше побачити-послухати думки поза рамками програмування, і таких поглядів «поза» наврядчи тут треба шукати.

Відносно топіка — більш цікаво нп не наскільки вдало-не-вдало відпрацьовує ШІ, чи як саме його застосовують з тим що зараз маємо, чи наскільки то унікальна архітектура UI фреймворків, — а погляди у яких напрямках у програмуванні будуть найбільш ймовірно застосувати-впроваджувати ші. І то можна розглядати у різних площинах — нп кодування будь-якого типу чи рівня абстрактності, чи загальний дизайн продуктів, чи інший ракурс з нп спершу скриптові та умовно в якомусь з планів safe мови — до ші, etc.

Це так, хайпуючі уникають чіткості термінів.
Можна тоді лити воду.

Обговорення комплексної термінології яка чітко не фіксована і часто викликає суперечки у дефініціях, та ще й відрізняється у різних сферах, — то якраз і лити воду, а фокусуватися на чомусь такого типу то як заряджати воду, або промпти щоб не виходити занадто поза топік-офтопік)

Тікет — завдання — перевірити — сказати щоб зробили ревью — вручно подивитися — залити у прод. Не бачу тут програміста чи інженера. Бачу оператора конвеєрної збірки машин.

Ви таким не займаєтесь?
Скільки часу у вас йде на оці типові таски?
У мене в команді умовно 90% завдань таких, і то це якісний продукт з активним розвитком.
Це business as usual, і він завжди буде.
А «конвеєр» дозволяє на ті 90% завдань потратити не 90 а 50% часу.
І залишається більше для навчання, досліджень чи хоча б вільного часу (хоча в моєму випадку для додаткового заробітку)

Не розумію тільки навіщо у кожній статті на Dou у коментах тут це усім доказувати?

Я активний учасник форуму, виражаю свою думку.
Не подобається чи не згідні то проходьте мимо або аргументовано заперечуйте)

За різними дослідженнями ще до епохи ШІ, програміст займається написанням коду від 11% до 20% свого робочого часу.

Звісно, це в цілому по галузі.

Якщо у вас 90% часу, то це рідкисна ситуація. Не неможлива, а просто статистично не значуща.

програміст займається написанням коду від 11% до 20% свого робочого часу...у вас 90%.

Я за час написання коду нічого не писав.

Я писав за час потрібний на фікс баги/створення фічі

У мене в команді умовно 90% завдань таких,
А «конвеєр» дозволяє на ті 90% завдань потратити не 90 а 50% часу

Юзайте АІ не тільки для кодингу, він чудово генерить діаграми, тех спеки, розбиває сторі на таски.

Останній раз я щось схоже пояснював оперейшинам (по старому адмінам) в 2014 за aws.
То реакція така сама була, а нащо то треба, ще кудись логінитись, та в нас все є, чого не деплоїти баш скріптами, нащо ті сервіси якщо файли дешевше на серваку тримати.
Кароч, 1 в 1 ситуація)

youtu.be/pfknyZhiMnU
Це ми ще не обговорювали проблеми біотехнологій та безпеки. Он Сем прогнозує, що до 2027 ми побачимо багато цікавого в сфері біотероризму

Спостерігаю цікавий парадокс у дискусіях із ШІ-активістами. З одного боку, вони палко захищають концепцію «вайб-кодингу», де розробка базується на генераціях ЛЛМ. При цьому ігнорується факт, що модель застаріває в момент завершення її навчання, і багато речей неможливо «виправити» промптом у принципі.

Проте варто використати ЛЛМ для швидкої аналітики (наприклад, порівняння цін), як ті самі люди починають вимагати «аптечної точності». Хоча природа явища однакова: похибка в даних — це та сама похибка, що і в коді.

Важливо розуміти кілька моментів:
1. В індустріальній аналітиці (наприклад, при розрахунку коефіцієнтів для 100+ компаній) похибка у 3% в одному рядку не руйнує загальну картину. Ми свідомо жертвуємо стерильною точністю заради швидкості, інакше роботу неможливо закінчити ніколи(реальні фін показники по такій вибірці корегуються буквально рілтайм).
2. Якість вашого коду — точно така сама. І жоден Claude чи інший ШІ-агент у режимі код-рев’ю цього не змінить. І ніякий промпт чи спроби скормити ЛЛМ якісь мануал — теж. Там всередині така сама ЛЛМ із тими самими вадами.
3. Нічого, окрім прискіпливого рев’ю «очима» та глибокого осмислення людиною, не допоможе. Але якщо це визнати, то виявиться, що скепсис щодо «магічних можливостей» ШІ цілком виправданий. І тоді нема з чим сперечатись і у статті.

Звідки ця впевненість, що опонент просто «не вмів промптити»? Можливо, людина якраз пройшла достатньо курсів, щоб зрозуміти межу інструменту. Здається, ми маємо справу з новою формою карго-культу, де віра в магію промпта затьмарює розуміння обмежень архітектури моделей. Звідки зневага до використання опонентом того ж самого інструменту який ви самі використовуєте, причому захищаєте його використання в такій формі де похибки неминучі і іх наслідки важливі(з втратою точності в вигляді роздутих кодових баз), на відміну від всяких кейсів з маркетингу, аналітичних комплексних ресерчей?

ты копипастишь галлюцинации ллмки не задумываясь, попутно добавляя свои
от авторов пулл реквестов все-таки ожидается, что они немножечко будут смотреть диффы и также контроллировать процесс выдачи ллмки перед тем, как диффы пойдут на ревью дальше

парадокс разрешен, не благодари

Ви щойно блискуче підтвердили проблематику статті, навіть не зрозумівши цього.

Ваше «ожидается, что они немножечко будут смотреть диффы» — це і є рецепт катастрофи, яку я описую.
1. Дивитися «немножечко» — це і є Rubber Stamping. Саме так у код потрапляють критичні вразливості та архітектурні помилки, які ЛЛМ маскує під правильний синтаксис.
2. А щоб дивитися нормально, а не «немножечко» — потрібен час і когнітивний ресурс. І дослідження доводять, що цей час часто перевищує час написання коду з нуля (ті самі −19% продуктивності у сеньйорів).

Тобто ви пропонуєте вибір: або «дивитися немножечко» і пропускати баги (швидко, але неякісно), або дивитися ретельно і втрачати швидкість (якісно, але повільно).
Парадокс не вирішено. Ви просто обрали сторону «імітації контролю».

😭😭😭
No, i keep telling you that phone-screen code reviews is your pure hallucination! try again this time but please dont hallucinate and make no mistakes!!

. А щоб дивитися нормально, а не «немножечко» — потрібен час і когнітивний ресурс. І дослідження доводять, що цей час часто перевищує час написання коду з нуля (ті самі —19% продуктивності у сеньйорів).

а что займет больше времени: чтение кода или написание + чтение 🤔🤔🤔
нужно исследование!

Вже проведені, є в статті і показують що ллм генерують код на 39% з вищою складністю та на 130%+ більший лок ніж людина. І читати його вдумчиво — довше ніж одна людина написала а інша людина перевірила. А якщо його не читати і не розуміти а просто немножечко глянути та залити в репо то чим це відрізняється від звичайного говнокоду? Швидко, брудно , результат такий же тільки токени не палите і гроші економите

а если 1 человек сгенерировал, поревьювил, внес правки (опять ллмкой), создал пулл-реквестик и код ушел ревьюверу? 🤔🤔🤔

я даже боюсь упоминать о том, что вайб фичу можно ВНЕЗАПНО деливерить не 1 коммитом, чтобы тебе прям окончательно мир не перевернуть

возвращаясь к разнице в твоем вопросе: ты же делаешь абсолютно обратное от того, что ожидается от автора пулл-реквеста: ты ДОБАВЛЯЕШЬ галлюцинации, вместо того чтобы уменьшать их количество и проверять спорные моменты

на самом деле от авторов статей можно было бы ожидать, чтобы они вели себя больше как авторы пулл-реквестов, но ведь им и за статьи не платят ¯\_(ツ)_/¯

А якщо його не читати і не розуміти а просто немножечко глянути та залити в репо то чим це відрізняється від звичайного говнокоду?

ТА-ДАААМ: НИ ЧЕМ!
что раньше у тебя могли быть безответственно сделанные чейнджи, что сейчас
что раньше у тебя был риск, что сейчас
что раньше выстраивался целый пайплайн, чтобы такой риск минимизировать/митигейтить, что сейчас
что раньше то самое «немножечко», к которому ты прицепился, являлось необходимым но не достаточным условием, что сейчас

я так рад! ты не можешь себе представить! этот вопрос — это самое лучшее, что я от тебя читал в этой теме! я говорю это абсолютно честно и без иронии
я честно скажу: местами я даже отчаивался — мне казалось что ты меня троллишь
но теперь я могу сказать, что это все того стоило!

Нічого, окрім прискіпливого рев’ю «очима» та глибокого осмислення людиною, не допоможе.

Ви фактично привели цю гілку коментарів до того, з чого вона почалась =D

Ще ні, але далі буде цікавіше якщо адекватність аудиторії не підведе

Тоді зафіксуємо — ллм генерить говнокод. Перша частина статті — валідна, там якість цього говнокоду — просто була виміряна дослідниками, а я звів ці джерела в 1 місці. Рухаємось далі. Пропоную вам уявний експеримент, без приколів, без спроб вас образити чи принизити, я опишу вам уявну ситуацію, ви не сперечаєтесь з тим наскільки вона реальна чи ні — бо вона уявна. І я вас в цю уявну ситуацію перенесу. І в мене буде до вас одне питання щодо ваших дій в цій ситуації — тобто як би ви як людина діяли якби в цих обставинах опинились? Нагадаю — вона уявна, і не образлива аж ніяк. Ви згодні?

ну зачем, так же было хорошо
ллм может генерить говнокод. человек тоже может генерить говнокод, может даже при этом думать, что генерит не говнокод

можем попробовать, но не особо горю желанием. потому что, как аналогии не являются доказательствами, так и вымышленная ситуация что-то да исказит просто в силу своей промышленности

возможно в этом и есть моя проблема с этой статьей. пока аналитики анализируют и пытаются на основании этого построить свою вымышленную картинку, пока другие аналитики анализируют аналитиков и пытаются построить свою, я вижу как ии инструменты успешно используются

значит ли это, что можно делать спокойно проекты в «аксепт олл чейнджес»? я не знаю, кто в здравом уме на сегодня такое ожидает

являются ли проблемы кардинально новыми? для людей с опытом планирования, делегирования и контроля качества — опять-таки нет.
раньше некритичные модули делали аутсорсеры, сегодня ллмка.
раньше чтобы не было беды надо было план обсудить с джуном — сегодня с ллмкой
раньше было понимание, какие вещи не стоит поручать джуну — сегодня есть такое же понимание какие вещи не стоит поручать джуну с ллмокой
раньше если возникали сомнения в способности проверить критичные изменения из-за объема чейнджей, их просили вынести отдельно. сегодня ничего не поменялось
как раньше надо было спросить, как человек убедился в безопасности чейнджей, так и сейчас

существует ли проблема, что люди могут превращаться прокси для галлюцинаций? да, существует, и мне приходилось с такой проблемой сталкиваться. к счастью, донести, что это неправильно, было довольно легко

при всем этом, я все также оцениваю адопшн как успешный. его оценивают как успешный все техлиды, с которыми я общался, его оценивают как успешный те самые бедняги-сеньоры, которые бедные должны тонуть в тоннах говнокода

в целом общий сентимент выглядит довольно положительно: раз в пару дней я вижу как кто-то делится прикольными кейсами использования ии

при наличии мониторинга стабильности всего приложения и здоровья команд в частности все показатели остались в норме

при этом например польза от ии в проекте с проприетарными фреймворками буквально для всего была уже при самом старте этого самого адопшена

Нарешті ми прийшли до спільного знаменника. Хіба я десь стверджував, що LLM не варто використовувати взагалі? Аж ніяк. Я визнаю їхню користь за умови обережного підходу. Проте, як я неодноразово наголошував, ця користь на індивідуальному рівні не масштабується.

Коли я працюю з репозиторієм сам, увесь SDLC і вся «команда» — це я один. Якщо я чітко розумію, де можна припустити використання згенерованого коду, а де це неприпустимо, то жодних проблем немає. Я — єдина точка контролю.

Стаття ж описує не мій чи ваш приватний досвід, а макрорівень: те, що відбувається з індустрією в цілому. А дані свідчать про масове засмічення промислових репозиторіїв низькоякісним кодом у гігантських масштабах.

Ось вам ситуація для нашого експерименту якщо ви погодились.

Ви — головний розробник у великому банку, де працює близько 2000 програмістів. Ви маєте авторитет, високу зарплату та відповідальність, але в масштабах корпорації ви — просто виконавець без реального політичного впливу. Ваша команда підтримує частину продукту з 10-річною історією, яка є гвинтиком у величезній екосистемі зі 100 пов’язаних проектів-команд.

Усім цим керують менеджери. На нижчих ланках вони ще мають технічний бекграунд, але чим вище — тим менше там розуміння розробки. І ось банк ухвалює рішення про масове впровадження ШІ-копілотів. Не будемо шукати в цьому логіку — рішення прийнято, і впровадження йде ударними темпами через механізми KPI та метрики адаптації.

Для вас це виглядає так: протягом 4-5 місяців ваша команда зобов’язана почати генерувати та заливати в репозиторій код, створений ШІ. Це суворо контролюється. Не виконуєте нормативи з «адопшну» — вам «гаплик» у корпоративному сенсі. Паралельно прилітає вимога збільшити швидкість і частоту всього: деплоїв, комітів, PR та мерджів.

Ви розумієте, що це шлях у нікуди, і йдете до менеджера. Він слухає вас і питає: «Ти що, луддит? Усі команди встигають, а твоя — ні. В чому проблема?». Це, до речі, класична пастка примусової корпоративної адаптації. Спроби ескалації чи розмов із колегами призводять до того, що HR запрошує вас на «милу бесіду» на теми «корпоративної культури та командного гравця». Вам натякають, що ваша позиція виглядає токсичною, і пропонують «допомогу».

Ви усвідомлюєте, що фінал близько. Якщо ви хочете залишитися на посаді, у вас є лише два варіанти: або стояти до кінця на принциповій інженерній позиції (і бути звільненим), або почати заливати «говнокод» у репозиторій.

Прошу не змінювати умови описані і не вносити ніякі корективи, а ще — припустимо вам ця робота — вкрай потрібна. Може ви внутрішньо готові і звільнитись — але вам потрібен час, скажемо півроку або рік щоб змінити роботу.

Що оберете ви? Лити говнокод чи принцип?

значит ли это, что можно делать спокойно проекты в «аксепт олл чейнджес»? я не знаю, кто в здравом уме на сегодня такое ожидает

я тут буквально рассказываю как люди перестали ручками код писать и как это замасштабировалось на всю бигтех компанию — всего-то нужно аксепт олл не нажимать, а оно оказывается не масштабируется.

все, спасибо за диалог. это безнадежно

Ви обіцяли відповідь. І ми домовились що це уявна ситуація, я її вам чітко описав. Ви будете лити говнокод чи оберете принципи? прошу просто відповісти. Це уявний експеримент, чітко сформульований, де мене цікавить ваш вибір в таких обставинах — все. Ніяких змін контексту або привʼязки до реальності.

можем попробовать, но не особо горю желанием. потому что, как аналогии не являются доказательствами, так и вымышленная ситуация что-то да исказит просто в силу своей промышленности

покажи пожалуйста пальчиком где ты тут обещание увидел. статьи ты похожу также читаешь

ты мне еще загадку про два стула загадай

сам на пики сяду, мать на колени посажу

возьму код от ллмки и буду над ним с ллмкой работать, пока он не будет продакшн реди. это буквально тот самый дев экспириенс, который я описывал выше

Гаразд. Ви обрали принципи — і вас звільнили. Ваші колеги, побачивши цей приклад, роблять інший вибір. Вітаю: ми з вами щойно послідовно валідували всі тези статті.

Ви можете заперечити, мовляв, ця ситуація вигадана і в реальності такого не буває. Але це не так. Наш ринок — складна екосистема, де розрив у розумінні технологій між топменеджментом та інженерами часто є критичним. Це трапляється не завжди, але коли такий розрив виникає — стається криза.

Більше того, подібне вже відбувалося. За абсолютно такою ж логікою розвивалася фінансова криза 2008 року. Цей механізм не просто існує — він уже довів свою руйнівну силу в минулому, хоч і в іншій сфері.

Чи обов’язково це станеться знову? Ні. Моя стаття — це лише опис механізму можливого зламу та аналіз даних, які свідчать про те, що такий сценарій стає дедалі реальнішим. Ось і все.

Якщо чесно, мені вже не зовсім зрозуміло, про що саме ми з вами сперечаємося весь цей час.

пришел менеджмент и сказал, что если я хоть раз не приму чейнджи, а попрошу ллмку что-то поменять, то меня уволят, ага
такое уже случалось, ага
риск для индустрии, ага
реальный сценарий, ага

понял-принял. так бы сразу в статье и написал — не пришлось бы мучать буквы

Розберіться з механікою кризи 2008. Дуже здивуєтесь. Бо саме так це все і відбувалось коли здавалось що ну як же так? Ну не може ж бути що так тупо? С левел же такий розумний, фінансисти розумні, банківські радники по інвестиціям розумні і тп. Ви розумієте що таке системна динаміка на масштабі? Пропоную вам заспокоїтись і реально подумати. І почитати. Я вас не переміг в дискусії. Ми з вами дебатували та і все. Якби ми говорили би чисто за код — скоріше всього ви би мені розказали більше цікавого ніж я вам і я би вас дослухався.

чтобы оставаться на рынке все компании должны будут нажимать авто-аксепт и не отклонять ни одного чейнджа от ллмки
очень реалистичный сценарий! спасибо за аналитику

Ще раз — вивчить механіку кризи 2008. Не компанії а виконавці внизу це роблять. А роблять тому що на них давлять зверху. І між верхом і низом прірва в розумінні технології. Бо інженери розуміють суть а с левел не кодить. Він читає форбс, звіти інших компаній і ведеться на хайп

тот факт что в технологических компаниях есть такие вещи как СЛА, публичные пост-мортемы и инцидент-репортинг мы конечно же упустим
а так да, ты молодец — очень похоже на ипотечный кризис!

Вивчіть механіку 2008 кризи. Це все було і відомо давно і не допомогло. І почитайте статтю нарешті та подивіться дані

господи, высокорисковые активы обеспечивались еще более высокорисковыми, а потом перепаковывались в ценные бумаги а класса
те кто в моменте давал больше ипотек имел больше прибыли и всем пришлось выдавать ипотеки. ну оооочень сложная мысль. обязательно пойду изучу подробнее

вот только в технологических компаниях это так не работает

когда мета прилегла на 6 часов ее акции упали на 5%
когда у нетфликса стал хуже ux — акции упали на 3 процента моментально
боинг упал на 20% за несколько недель после инцидентов

когда качество напрямую влияет на стоимость акций эти ужасы «зааксепти все чейнджи или умри» не сработают

еще раз: в технологических компаниях все инциденты публичны. во время же ипотечного кризиса все риски были скрыты от рынка и инвесторов

Чому це відбувалося в 2008? Чому? Всі тупі чи як? Вивчить механіку нормально. Який комплекс факторів привів до того що весь фін ринок на всіх рівнях як єдина система діяв ірраціонально і на самознищення?

скорее наоборот: очень умные и нашли как скрыть аналог инцидентов
а боинг вот не нашел и 20% за неделю потерял

Дозвольте і мені трошки прийняти участь.

Теза Vitalii щодо кризи 2008-го (у моїй вільній інтерпретації)

Є розрив між тими, хто приймає рішення, і тими, хто розуміє механіку.
На верхах — KPI, хайп, pressure.
Внизу — виконавці, які не можуть опиратись.
Система накопичує ризик, поки не ламається.

Це не безглуздо. Системна динаміка з перверсивними стимулами — реальність.

Але, LLM адопшн — це не те саме, що іпотечні деривативи.
Що стосується 2008:
— ризик був непрозорий
— важелі були фінансові
— стимул був короткостроковий прибуток при довгостроковому ризику
— колапс був нелінійний

Що стосується SDLC:
— деградація зазвичай повільна і видима (інциденти, velocity drop)
— маємо технічні метрики
— є CI/CD, rollback, observability etc.

Аналогія красива, але вона риторична, не доказова.

Щодо цього треду загально, тут двоє відповідають не на те, що каже інший. Vitalii каже з позиції системної динаміки, опонент — каже про операційний рівень.

Ваш конфлікт — це протистояння макро vs мікро.
Це зіткнення світоглядів:
— один мислить категоріями системної крихкості,
— інший — категоріями практичного дев-досвіду.

І обидва частково праві.

Ви праві, той механізм стосувався грошей напряму, цей деградації кодових баз і це повільніше. І не факт що криза розвинеться вибухово, в репо я описую більш реальний сценарій — повільне гниття. Щодо того що все під контролем через контроль велосіті дроп, це метрики активності. Злам же вібдуіається по метрикам здоровʼя коду. А метрики активності при втручанні ллм в сдлс можуть гуляти і показувати дуже різне. Велосіті при реалізації паттерну швидких апрувів зросте. А здоровʼя коду не так часто нормально трекають. Інциденти ближче до здоровʼя але якщо ллм генерований говнокод швидко фіксить — можуть не звертати уваги довго. Щоб звернути треба не просто співставити мттр та частоту появи інцидентів а і порівняти зі статистикою минулих років — до початку Ші адопціі. Далеко не всі все це роблять в комплексі. Я би обережно навіть сказав — це робить меншість. Метрики здоровʼя кодової бази вважаються зайвим задротсвом яке не потрібне

А так то згоден — казати однозначно що завтра апокаліпсис наче підстав нема. Складна система взаємодій і безліч змінних які невідомі. Але глобальні сили на ринку і закономірності небезпечні. Дані які доступні і розрив між репортами зверху і реальністю знизу в тому числі в тих самих дослідженнях — мене вже насторожують. Чи це доказово все? В контексті того що криза буде — ні. Але в контексті того що вже сьогодні код від ллм потребує особливої уваги на рівні компаній і своїх протоколів безпеки — так

мой основной тейк в том, что в технологических компаниях качество — это и есть часть цены и рынок на проблемы качества реагирует более явно

зум из-за уязвимостей упал на 17% за неделю
краудстрайк после своих мемных апдейтов — на 11% за 1 день

что-то мне кажется, что в эти дни те самые далекие от исполнителей люди вполне себе могли пересмотреть свое виденье kpi/хайпа и вот этого всего. при чем не только из зума и краудстрайка

Якщо вам ллм швидко фіксить баги і інциденти умовно швидко зникають то це довго може бути не помітно. До тих пір поки через лиття говнокоду в репо кодова база не отруїться настільки що ллм сгенеровані говнофікси вже перестануть допомагати. І в цей момент ще і зʼясується що людина в цьому коді і розібратися вже не здатна. І щоб такий сценарій деградації помітити — треба торкати метрики здоровʼя коду і порівнювати їх з лонг горизонтом. Як часто ви таке в реальності бачили?

хелсчек как бы основан на количистве инцидентов в том числе, а не только на mttr
советую ознакомиться

Як часто ви таке в реальності бачили?

эмм всегда когда видел хелсчек?
ты там это, может сходи все-таки почитай?

І він росте, бачив не так давно доречі статистику але вже не памʼятаю де по одній компанії яка як раз адаптує ШІ. Але — і що? Фулстоп — с левел на вихід? Ні — красиві звіти про криву адопції, тимчасові негараздиі ударна доза звітів про те як все пришвидшилось — от що буде.

І ви плутаєте трохи здоровья і частоту інцидентів. Це близько звʼязані речі. Але саме метрики здоровья це темпи росту лок, темпи росту збільшення складності коду і т.п. — іх трекають всі разом одиниці.

та вроде не путаю: для sre частота инцидентов — это как раз-таки хелс метрика. время на фикс — тоже метрика. 2 разные метрики
советую все-таки почитать

а дальше уже команда сама может решить что ей делать в случае проблем: искать проблемы в коде или например тестирование поменять
это контроль качества называется

Це не те саме що трекати метрики обьему кодової бази та метрики складності коду. Інциденти — наслідок. І не завжди деградації кодової бази. А і зламу активності. Тож так — це речі повʼязані але різні

а дальше уже команда сама может решить что ей делать в случае проблем

И снова вынужден сказать — ваша планета очень хороша, но это не здесь. Традиционно прошу назвать номер в тентуре.

ну будет и будет. а потом кто-то на 10+% упадет за день

Ну слава богу — ми знову згодні:) То стаття не пуста?:) Ну було приємно подискутувати. Знову ж — я не кажу що завтра колапс. Чи післязавтра. Але вся ця тема разом — не здорова. Саме системна динаміка, вона руйнівна. І як вище людина описала — так, в моїй статті недостатньо фактів в вигляді хард дати. Але іх просто не так багато в реальності. Інша розумна людина в іншому місті мені наводила як аргумент посилання на семплінг — це валідно. Якщо ми не маємо достатньо семплів ми не можемо регенерувати певний сигнал. Але — це чітке правило для тех задач. Якщо семплів не достатньо ти не «регенеруєш» аудіо доріжку. В реальному світі ж це часто працює інакше — через переніс досвіду. наприклад — в археології можна регенерувати скелет при недостатній кількості фрагментів якщо археолог знає анатомію, стикався з подібними скелетами і має професійну інтуїцію. Так і тут. Але — це не пророцтво про катастрофу. Це попередження бути обережним

ну для того, кто про сре и контроль качества впервые слышит — может чем-то полезна, правда не понимаю чем именно, если там вместо ссылок на практики только «караул все пропало»

для тех кто об этом слышал — как-то не очень =/

Контроль якості тут знову ж — похідна. Саме здоровья кодових баз деградує. Це рідко трекають

Я ваш тейк чудово розумію.

Але також, маю зауважити, що «якість» як ринкова стійкість продукту, та внутрішня «якість» коду — це дві різні якості.
Не пишаюсь, але я був у командах продуктів зліплених з «гівна та палок», які мали чудові uptime та інші зовнішні метрики, при цьому настількі ж жахливі testability, maintainability та інші показники внутрішньої ентропії.

Ринок бачить outage.
Тобто він карає за видимі симптоми (інциденти, security, SLA), а от структурна деградація може лишатись непоміченою роками. Це дуже різні часові горизонти.

забавно, что частично рынок это тоже видит. акции компании могут упасть после отчета если рост есть, но не такой как хотелось инвесторам

Я не скажу, що я геть не погоджуюсь, швидше не розділяю вашого оптимізму щодо саморегуляції.
Ринок — це механізм корекції, але з лагом.
LLM підвищує throughput змін.
Якщо швидкість накопичення складності перевищить швидкість зворотнього зв’язку — система може довго деградувати без явної кризи.

До того ж описані механізми в вигляді пост мортем, сла, я би сюди додав і лессонс лернед — це мікрорівень. Якщо це все синхронно та в унісон буде працювати — то може допомогти. Але так буває рідко. Системні фактори які потенц можуть призвести до кризи — макро рівень. І вони перемагають мікро рівневі сили часто. Тобто як мінімум — це має сенс публічно і максимально широко почати обговорювати. Може форма, тон, стиль, подача які я обрав — не найкращі. Але — і розмова не сама проста. Аудиторія дуже різна і т.п.

Що стосується SDLC:
— деградація зазвичай повільна і видима (інциденти, velocity drop)
— маємо технічні метрики
— є CI/CD, rollback, observability etc.

З цього всього валідний лише перший пункт. Метрики і observability вам нічого не покажуть. Вони покажуть, що в рамках цієї задачі цикломатична складність/дублікати/код смели/споживання ресурсів збільшилися на 1%. І от тут хз, чи це в рамках поточної архітектури це необхідне зло, і краще ви вже не напрограмуєте цю фічу без значного рефакторингу, чи ллм погано нагенерувала. Тому ви вважаєте, що хай буде. І потім у вас кожна задача додає ще по 1%. І ви візьмете аналітику за останні півроку і побачите, що починаєте тонути в поганому коді, що ви будете ролбечити? Останню задачу? Так вона додала всього 1% поганого коду. Чи відкотите усі задачі за півроку?

Якщо по-чесному... Я не маю відповіді прямо зараз.
Ролбек працює проти «аварій», але не проти легітимних компромісів — тут ви цілком праві.

«Я підготуюсь, і прийду на пересдачу», ну або не прийду — я також можу помилятись =D

еще раз: в технологических компаниях все инциденты публичны.

С удивительной планеты вы прилетели.

На нашей и без AI код типового галерного дерьма такой что страшно читать, а испытан он в варианте ровно одного сценария после ребута, и привести в порядок нельзя, надо фичи гнать, в репе на 20GB 15 не используются, но иногда мешают, а удалять нельзя. А что в этом коде будет с AI, я и не пытаюсь представлять себе, здоровье дороже. И ни одна из этих проблем не влияет на акции — по крайней мере пока не придёт тот, кто умеет работать (шанс менее 1%, потому что 99% что до наступления успеха его венчурные инвесторы приведут к общему безобразию).

Но вы продолжайте себе думать, что везде так, как у вас, и кроме тех 3-5 инцидентов, что вы привели, других не было, и вообще везде полный идеал и благорастворение воздухов.

следуя тону беседы мне стоит отправить тебя читать что такое сла, публичные пост-мортемы и инцидент репортинг?

Покраще ніж ви це знаю;),а от ви явно не розумієте точну механіку той кризи. І наявність схожих за змістом фідбек луп там не допомогли

какой еще похожий фидбек луп? регуляции вышли только в 2010
до этого ничего не мешало паковать фантики в ааа бумаги

сейчас же удачи скрыть какой-то инцидент особенно в хипаа домене/наличии сла

а при чем тут ипотечный кризис к технологическим инновациям? вы лучше изучите как появление ткацкого станка стало драйвером промышленной революции — этот пример более релевантен.

этот популярный пример как раз — один из самых нерелевантных.

во-первых «ткацкий станок» и его «результат» — материальны. Приведение аналогий материальных технологий для нематериальных — практически демагогия.

во-вторых ткацкий станок сильно упростил профессию, смогли работать домохозяйки и дети, «люди с улицы», без лет учебы подмастерьями.
работа с ИИ — требует наоборот, более высокой квалификации. Иначе бы увольняли синьоров и набирали джунов.
Ткачи же взбунтовались потому что
1. упал уровень их доходов.
2. нарушались разнообразные виды лицензирования деятельности. примерно как бунтовали французкие таксисты против Uber.

в-третьих драйвером той революции стал паровой двигатель, а а ткацкие станки, паровые молоты, логистика, и тд — стали следствием.

Вообще, уровень ИИ хайпующих в этом затасканом примере очень ярко проявляется :)
Хотя история НТР показывает, что влияние революционной технологии предсказать, просчитать невозможно, как в позитивном, так и негативном.
Если влияние революционно — то ни на что не похоже из предыдущих видов НТР.
А ИИ — точно обещает революцию, и никак не такую мизерную как «ткацкий станок». или «паровоз».

работа с ИИ — требует наоборот, более высокой квалификации

Якщо так — то булаб тупикова гілка розвитку.

Якщо потрібна аналогія — можна подивится які тулзи розходяться масово — то все то що являється простим у використанні. Нп мас-популярність пайтона доволі суттєво базується на тому що використовується користувачами які зовсім не позиціонують себе програмістами.
Відносно кваліфікації роботи з ШІ — якщо дивится більш широко на його використання (тобто не програмістами) то по ідеї треба говорити про кваліфікацію у свому домені, а ніяк не у програмуванні. А для того сам інструмент для широкого вжитку має бути максимально простим наскільки то можливо, і не потребувати спеціалізованої «високої» кваліфікації для його використання.

точно обещает революцию

Випадок ШІ сам по собі доволі цікавий, коли здається з прозаїчною симуляцією одного з принципів роботи розуму — несподівано отримали доволі вражаючі результати. Але це тільки один крок відповідних копіювань з природи, хоча і досить показовий за результатами.

Про вимоги до кваліфікації — вам треба просто визирнути за інф бульбашку нас, гікнутих на ШІ.

90% навіть у чатику не навчились з ШІ спілкуватись, і даючи дурні питання радіють що він дурень, бо дає дурні відповіді.
90% не в змозі зрозуміти поради як писати промпти у чатику, правільно ставити питання.

І тому, програмісти будуть і, далі потрібні, як ви і сказали — для створення інструментів широкого вжитку.
кодити будемо все менше і менше. Але цей тренд був і до ШІ.

А сам ШІ так, дуже цікава технологія. І гайп навколо теж, сам по собі, цінний. Для культурологів, та психиатрів колективного підсвідомого.
Але це офтоп :)

при всем этом, я все также оцениваю адопшн как успешный.

100 лайків цьому коменту
Жаль що автор статті засирає коменти своїм АІ.

Можете розписати детальніше що і як юзається у вас на проекті?

так если самому писать, то можно потом не читать! человек же не LLM, чтобы галлюцинировать :)

Ми ще про роботу в хоч якійсь компанії говоримо ? Код ревью робить інша людина. Якщо ти собі сам вдома вайбкодиш для себе і нема ні сталої кодової бази ні команди — то кому це заважає? Роби що хочеш

ну то есть, ревьюеру приходит пулл реквест, он смотрит: вот спека, вот код, вот комментарии по коду, вот тесты. отлично. какая разница ревьюеру, как зовут автора пулл реквеста: Клод или Виталий?

А в тому що якщо робити не говнокод а якісно, тобто вичищати результати роботи ллм які на 130%+ більші за розмірами та на 39% більш складні порівняно з кодом людини — то швидше щоб 1 людина писала код руками а друга робила ревью. Ви намагались реально прочитати статтю? Чи вас просто тригерить будь яка критика технології?

Та не дивуйтеся
Люди читають жопою. Жопою читають люди...

Так і з тим що ШІ пише.
Бо це одна й таж навичка, а хто автор немає значення.

Я ще до ШІ казав, якщо нові покоління читають менше то як же вони читають код?
А так і читають зазвичай — гірше.
Тепер ШІ генерить, і спеки, і план, і сам код.
То як ці ж молоді та енергійні будуть те читати, коли в них так фігово з навичкою — читання, тобто розуміння написаного?

Звісно не всі.
Але ж ми про статистичні числа.

Спостерігаю цікавий парадокс у дискусіях із ШІ-активістами.

А я бачу цікавий парадокс коли чувак юзає АІ щоб генерити відповіді до коментів і в той жеж час заперечує що АІ дає буст продуктивності.

Чого ти його тоді юзаєш?)

З одного боку, вони палко захищають концепцію «вайб-кодингу», де розробка базується на генераціях ЛЛМ

Це дуже поверхневе твердження. Крім LLM ще є MCP, тулзи, контекст інжінірінг які «добавляють» недостающі знання. LLM це лише мозги.

При цьому ігнорується факт, що модель застаріває в момент завершення

її навчання, і багато речей неможливо «виправити» промптом у принципі.

Наприклад? Як би це було так, вони б не могли б читати, скажімо, новий фінансовий звіт Тесли, не змогли б допомагати з новими бібліотеками які вийшли після тренування моделі.

ШІ десиденти мають дуже поверхневе і віддалене уявлення стану сучасного АІ і як все працює під капотом, а потім від нерозуміння, народжують всякі міфи і видумують паралельну реальність.

Я вже писав, але повторюсь. LLM це лише мозги, reasoning, розумності останніх моделей вже достатньо для вирішення майже всіх задач. Питання лише в знаннях і контекстному вікні. Якщо дати моделі в контекст задачу і всю необхідну інформацію для вирішення цієї задачі при цьому не перевантажуючи контекст (до 50к токенів) — вона її вирішить.

Всі фейли з ЛЛМ, це кривий контекст менеджмент, це означає що:
1. Ви не дали достатньо інформації для вирішення вашої задачі
2. Ви перегрузили контекст непотрібною інформацією яка не має відношення до задачі.

99% фейлів це одне із двох, при умові що використовуєте сучасні моделі.

Цей контекст менеджмент, це надскладна задача. Тому AI агенти (які існують поверх LLM) намагаються цю проблему менеджити з різною долею успішності. Розбивають задачі на підзадачі, запускають саб-агентів з чистим контекстом, підключать десятки тулзів для пошуку необхідної інформації для вирішення конкретної підзадачі. Але навіть для них це складна задача і юзеру (оператору) треба їм допомагати (через промти, скіли, МСР тулзи).

Тому я кожен день на роботі ловлю фейспалми, коли бачу як колеги-сінйори намагаються кодити однострочними промтами і потім скаржитись що не працює. Так звісно що не працює, ти не дав знання про проект, не надав достатньо деталей, а поки воно саме все знайде, то вже контекст закінчиться. У мене для цієї задачі буде 5 скілів і я її розіб’ю на 2-3 етапи, і потім ще прожену через ревью 2-ома агентами з інструкціями на 200 строчок кожен. А тут одним промтом максимум на один абзац намагаються щось робити. І потім такі горе-вайбкодери з’являються в подібних статтях що «АІ робить повільнішими».

techcrunch.com/...​ce-december-thanks-to-ai

Поки ми тут сперечаємося про теорію, вийшов цей звіт від Spotify. Описане виглядає захопливо, але водночас тривожно. Це фактично маркетинговий матеріал для інвесторів від десіжн-мейкерів, які зробили кар’єрну ставку на ШІ. Картина викривлена і неповна, тому встановити з неї реальний рецепт успіху для ринку неможливо. Що можна сказати по пунктах

1. Spotify — це гігант. У них інвестиції в інженерну інфраструктуру навколо ШІ-асистентів обчислюються мільярдами. Те, що є робочим сценарієм для них, технічно та фінансово непідйомно для більшості інших компаній.

2. Відсутні дані про здоров’я кодової бази. Ми бачимо зростання швидкості доставки фіч, але що відбувається з якістю? Швидко почати говнокодити можна і без ШІ — це відомий спосіб короткостроково роздути швидкість делівері.

3. В інших джерелах вони описують систему яка в них начебто щодня автоматично переписує кодову базу. Звучить цікаво, але якщо система автоматично переписує кодову базу і генерує по 1000 PR щодня, виникає питання: хто здатний розуміти цей код і осягати його складність через рік-два?

4. Трансформація ролі розробника. Теза про те, що найкращі розробники перестали писати код, збігається з незалежними дослідженнями про штраф для сеньйорів: вони тепер просто завалені код-рев’ю. Проте розгортання коду зі Slack з телефона по дорозі на роботу викликає скепсис щодо якості. Не певен, що архітектуру та edge cases можна ретельно перевірити на екрані смартфона.

5. Ризики Model Collapse. Що буде за 2-3 роки, коли моделі почнуть отримувати для навчання вже не людський код, а код моделей минулих поколінь? Людський код — це про елегантне подолання складності, де логіка зрозуміла іншій людині. ШІ-код, за даними досліджень, привносить на 39% більше непотрібної складності. Це означає, що людині потрібно не на 39% більше часу на аналіз, а в рази більше, бо обробка складності — це не лінійний процес.

Можливо, у Spotify дійсно знайшли спосіб обійти ці системні пастки, але поки що питань залишається значно більше, ніж відповідей.

тривожно
фактично маркетинговий матеріал ... зробили кар’єрну ставку на ШІ
Картина викривлена і неповна
нвестиції .... обчислюються мільярдами
почати говнокодити
хто здатний розуміти цей код
сумарний профіт для бізнесу дорівнює нулю
викликає скепсис щодо якості
привносить на 39% більше непотрібної складності
системні пастки
питань залишається значно більше

ПРИПЕЧАТАЛ! 😂

чувствую, скоро будет новая статья 🤦‍♂️

Це по-своєму майлстоун — у мене з’явився мій перший персональний хейтер, який так ретельно конспектує мої тези. Дякую за увагу до проєкту! Не перемикайтесь, далі буде ще цікавіше

обчислюються мільярдами

Після цього зрозумів що висери даного автора не варто читати

500k-2ляма на сонар просто показалось мало ¯\_(ツ)_/¯
с миллиардами поярче звучит

Давайте подивимось на цифри. R&D бюджет Spotify — це понад $1,6 млрд на рік (згідно з офіційними звітами). Ви справді думаєте, що такі кошти йдуть виключно на розробку нових кнопок чи дизайн плейлистів?
Ні, це кумулятивні інвестиції в інженерну екосистему, яку більшість компаній просто не може собі дозволити. І саме тут криється системна пастка:
1. Platform Engineering як фундамент: Spotify — це розробник Backstage (фактичного світового стандарту для IDP). Левова частка їхнього R&D роками йшла на створення інфраструктури, яка зараз дозволяє їм «перетравлювати» ШІ-код. У них ШІ-викид падає в ідеально відшліфований пайплайн автоматичної перевірки, тестування та DX (Developer Experience). Для компанії без такого фундаменту спроба повторити цей темп закінчиться просто завалом із техборгу.
2. L4 інженери та когнітивна пропускна здатність: Ніхто не ставить під сумнів кваліфікацію сеньйорів у Spotify. Питання в іншому — людський мозок не масштабується так само швидко, як LLM. Навіть ідеальний дизайн-док не рятує, коли перевірка сотень PR на день перетворює сеньйора на вузьке місце. Коли архітектура «перевіряється» в Slack з телефона — це не про ретельність, це про вимушений «rubber stamping» (формальне схвалення), бо глибина розуміння при такому темпі фізично неможлива.
3. Розрив між «друком» та «розумінням»: Дослідження (ті самі 39% росту складності та про уповільнення досвідчених девів на 19%) фіксують цей розрив. ШІ прискорює генерацію символів, але не прискорює здатність системи(людей) ці символи верифікувати та підтримувати.
Може, для вас це все очевидно, бо ви оцінюєте «вайби», а от мені — не дуже. Мені б хотілося мати повну картину в цифрах, щоб робити висновки, особливо коли маркетингові матеріали настільки кардинально суперечать відкритим даним, що є в доступі

л4 — это мидлы...

прикольная ситуация получается: ты там 500к на сонар (это по-божески если на 2 ляма не влететь) насчитал и миллирды на аи, а «вайбы оцениваю» я

у меня в целом складывается ощущение что ты «вайбоцениваешь» или «вайбанализируешь», возможно без использования ллмок

или это такой некст лвл иллюстрации той самой когнитивной нагрузки на сеньоров, где среди полотна текста надо улавливать несостыковки?

з чого ви це взяли? Можете навести пруф? От що я швидко наллмив
—-
У Spotify кар’єрна сітка не така жорстка як у Google чи Meta, і назви/рівні не завжди стандартизовані в усіх командах, але загальна ієрархія виглядає приблизно так за даними публічних джерел:

Основні рівні інженерів:
1. Associate Engineer — Початковий рівень/джуніор.
2. Engineer I / Engineer II — Внутрішні «middle» рівні (Engineer I ≈ мідл, Engineer II — наступний крок перед Senior).
3. Senior Engineer — Сеньйор.
4. Staff Engineer — Старший досвідчений інженер, що має вплив за межами однієї команди. 
5. Senior Staff Engineer — Наступний технічний рівень вище Staff.
6. Principal Engineer — Ще вищий технічний рівень (топ-IC).

Таким чином:
• L1 = Associate Engineer — Джун/початківець (так).
• L2 ≈ Engineer I/II — Скоріше мідл (так, але всередині може бути дві підступені Engineer I і II).
• L3 = Senior Engineer — Сеньйор (так).
• L4 = Staff Engineer — Так, це — перший рівень senior-technical leader: вплив на архітектуру, співпрацю між командами тощо.

Але важлива деталь: у Spotify після Staff («L4») йдуть ще Senior Staff і Principal, які відповідають за ще ширші технічні області.

Да і взагалі це не дуже важливе питання як точно називається в середині той чи інший рівень. Суть я думаю зрозуміла — відповідальність щодо ревью — на самих досвідчених, як ти іх не називай

отично нллмил — в спотифай ДЕЙСТВИТЕЛЬНО грейды отличаются

так а по сути будет что сказать? как думаешь, мидлы в спотифае в состоянии дизайн доке следовать или там чисто обезьянки-прокси промптики вбивают и пулл-реквестики создают?

Це вам буде що по суті сказати? Бо наразі ви генеруєте просто нові питання, які мені не цікаві в межах того що ми обговорюємо. Я десь писав щось в коменті про мідлів? До чого ця розмова?

у тебя там контекст забился, может давай заново попробуем?
я тебе по сути и сказал что
1) фичи в энтерпрайзе обычно сначала дизайнятся, а потом делаются
2) миддлы обычно в состоянию следовать дизайн документу

и повторю снова вопрос: с чего ты вдруг взял что пункты 1 и 2 неверны и бедные сеньоры должны с телефона за архитектурой следить? откуда вообще этот тейк родился?

признавайся: нагаллюцинировал?

Ви зараз дискутуєте з власними припущеннями, а не з моїми тезами. У моєму коментарі не було жодного згадування про мідлів — ви самі вигадали цей аргумент і тепер намагаєтесь його спростувати. Це не конструктивно. Пропоную взяти паузу, переосмислити прочитане і повернутися до розмови, коли матимете суттєві зауваження.

Також відповім вам тут щоб зекономити час і вам і собі щодо ваших цифр: повторюю втретє — дані у статті наведені не для того, щоб надати вашій компанії прецизійний розрахунок структури витрат. Мета — вивести коефіцієнт асиметрії між вартістю ліцензії та витратами на «обв’язку» (інфраструктуру, підтримку тощо), які існують у BigTech, але відсутні або мінімальні у тих, хто просто купує ШІ-асистентів.

Мене не цікавить аптечна точність кожної строчки, адже ціни на ринку (як-от у SonarQube) постійно змінюються. Важливо показати саме порядок різниці. Якщо ви вважаєте, що ця асиметрія виглядає інакше — надайте власні розрахунки. Якщо вони суттєво змінять підсумковий коефіцієнт, я з радістю оновлю статтю. Таблиця створена для осмисленого використання: наприклад, якщо у СЕО компанії на 1000 людей Sonar вже оплачений, він просто викреслює цей пункт і бачить решту витрат.

получается пруфов для цифр не будет, объяснений откуда взялся тейк про архитектуру в телефоне — тоже

штош, спасибо, пиши галлюцинируй еще

Саме так — до вашої бравої битви в вашій же уяві з вами же вигаданими «аргументами» я приєднуватися не буду

Проте розгортання коду зі Slack з телефона по дорозі на роботу викликає скепсис щодо якості. Не певен, що архітектуру та edge cases можна ретельно перевірити на екрані смартфона.

эх, а как хорошо было написано! но часть с расчетами стоимости сонара без пруфов мне понравилась даже больше
с нетерпением жду следующий слоп!

“As a concrete example, an engineer at Spotify on their morning commute from Slack on their cell phone can tell Claude to fix a bug or add a new feature to the iOS app,” Söderström said. “And once Claude finishes that work, the engineer then gets a new version of the app, pushed to them on Slack on their phone, so that he can then merge it to production, all before they even arrive at the office.”

в одном из чатиков инсайдер из Spotify с тайтлом Staff Engineer по поводу статьи прокомментировал буквально следующее

ну в целом они имели в виду, что мы промптим изменения через слак и гитхаб, а сами мало пишем, это верно. но я пишу POC код чтобы понять что вообще промптить

я ему уже написал, что по мнению экспертов, их ждет катастрофа и Spotify поглотит Model Collapse.

По сонар
SonarQube не тарифікується за кількістю людей, він тарифікується за LOC (Lines of Code). Для 1000 інженерів, які працюють над складними продуктами (data pipelines, AI-моделі, інфраструктура), типовий обсяг коду — від 5 до 50 мільйонів рядків.
1. Розрахунок ліцензії (база)
• Enterprise Edition (1M—10M LOC): це базовий рівень для такої команди. Вартість стартує від $100K і легко доходить до $300K—800K з урахуванням branch analysis та security hotspots.
• Data Center Edition (20M+ LOC): якщо організація велика і має розподілені AI-тіми, вартість ліцензії злітає до $500K—1.5M+.
2. Інфраструктура та підтримка (~30—50% від ціни ліцензії)
Сканування коду 1000 розробниками генерує 10K+ скан-івентів на день. Це потребує:
• Compute (AWS/GCP): Потужні інстанси (типу r6i.8xlarge), DB (Aurora), Storage — це ще $100K—400K/рік.
• Support & Add-ons: Розширена підтримка (20% від вартості), Advanced Security та AI CodeFix додають ще $100K—300K.

До якої ще суми доколупаємось враховуючи те що в самій статті вказано що це приблизні розрахунки. І очевидно що дати точні можна тільки на реальну організацію, а не абстрактну. Але — дякую за реакцію — перепишу цю частину щоб це було ще очевидніше

А ну і так — чи можна дешевше? Да завжди можна. Але коли ми кажемо про Ентерпрайз — то дешевше це завжди в мінус якості. Ентерпрайз так не працює. І про це ж і мова — великі гравці як той же Майкрософт — мають в цьому сенсі просто захмарну перевагу в інвестуванні в свою інженерну культуру. І ШІ асистенти сіли зверху на це. І «це» — міліарди інвестиций десятками років, це не гіпербола — реальній. Думати що ви собі встановили дома на лаптопа клауд і тепер будете кодити як в Майкрософт і компанія де ви працюєте(підозрюю що це теж не біг4 і не фаанг) — зараз почне повторювати подвиги які описують вендори в своїх звітах — занадто опримістично

отлично наллмил, можно пруф, пожалуйста?
советую глянуть 1 глазочком на цену за тим эдишн (до 1.5m LOC) за сонар клауд
ну и тут есть пример цен aws.amazon.com/...​pp/prodview-s3pnrftdpyang

Порахуйте самі та дайте розрахунок , це ж не важко? Чи міг я помилитися десь? Звісно. В статті як я вже писав — це подається для розуміння порядку цифр а не точності до копійки. Але сумніваюсь що у вас при нормальному розрахунку по структурі яку я описав — вийде значно менший діапазон.

на самом деле сложновато, потому что энтерпразный план у сонаркуба не публичный и нужно общаться с сейлами. ты бы знал это, если бы иногда проверял то что наллмил

но у тебя же точно есть пруфы — ты же не мог просто наллмить галлюцинацию, правда? не мог же...

Не певен, що архітектуру та edge cases можна ретельно перевірити на екрані смартфона.

не уверен, что в спотифай хоть 1 фича идет в разработку до того, как продумана архитектура и согласовано что-то типа рфс/дизайн доки
не уверен, что в спотифай л4 не способны следовать дизайну фичи

не уверен, что процитированная неуверенность не ставит под сомнение остальные предположения автора

І знову простиня тексту, де більшість галюцинації АІ без логіки.

Ви все ще не вірите що сіньори деліверять фічі не пишучи код?
В статі ж чітко написати про делівері фікса а не про

штраф для сеньйорів: вони тепер просто завалені код-рев’ю.

Не про рев’ю коду йде мова, а про створення коду.

Я останній раз код правив руками може 2 тижні тому.
Попробуйте самі або попросіть толкого дева якщо самі не інженер.

Мені потрібен ші щоб оце все прочитати

Для тих, хто шукає короткий виклад, я додав стислий чек-лист у коментарях нижче. Проте сама стаття — це не просто думка, а агрегатор публічних досліджень, їхній системний аналіз та побудована на них гіпотеза. Стислість тут завадила б аргументації: без цифр висновки виглядали б голослівними.

Важливо розуміти: цей матеріал не є «пророцтвом катастрофи». Це аналіз системної динаміки. Я досліджую, як нинішня зрілість ШІ, реальні наслідки його застосування та ринковий хайп разом формують механізм, що веде до кризових сценаріїв. Чи є вони неминучими? Ні. Динаміка може змінитись, але поки що дані закликають до максимальної обережності.

Досвідчений інженер, імовірно, не знайде тут «одкровень» — він і так інтуїтивно «вайбкодить» обережно. Але стаття дає професійній спільноті головне: структуровану базу цифр та аргументів для розмови з менеджментом та C-level. Це інструмент для захисту інженерних стандартів у світі, де хайп часто перемагає здоровий глузд.

Важливо розуміти: цей матеріал не є «пророцтвом катастрофи».

ну як бачите, люди не відрізняють опис трендів, ризиків і факторів які їх породжують, і дискутують з тезами як догмами.
Чому?
Бо самі догматики, і з релігійною вірою борются проти богохульників :)

Звернення до місцевих ШІ-гуру:
Друзі, я цілком допускаю, що ви можете бути не згодні з моїм «діагнозом» чи самою статтею. Це нормальна частина професійної дискусії. Але замість того, щоб ламати списи в коментарях, я пропоную перейти на поле, де ми всі почуваємося впевнено — у код та процеси.
У репозиторії вже є протоколи: конкретні кроки, як працювати з ШІ безпечно та ефективно.
Мій заклик до вас простий:
• Доповніть систему: Якщо ви вважаєте, що проблема не в технології, а в тому, що її «не вміють готувати» — чудово! Зайдіть у репо і через Issues або Pull Requests допишіть те, чого, на вашу думку, не вистачає.
• Будьте прагматичними: Нам не потрібні надскладні теорії. Потрібні прості, універсальні та повторювані правила, які зможе застосувати будь-який розробник, щоб не «вистрілити собі в ногу».
• Визнайте наявність тертя: Навіть якщо ви найбільший оптиміст, ви бачите, що певні проблеми існують. Нехай мій прогноз помилковий, але протоколи безпеки — це те, що принесе користь індустрії в будь-якому випадку.
Це значно ефективніше, ніж доводити щось один одному в коментарях. Якщо у вас є дієвий «рецепт» — поділіться ним там, де він стане частиною рішення, а не просто частиною шуму.

Бобер видихай:
www.youtube.com/watch?v=OfMAtaocvJw
АІ і третя золота епоха для програміздів

Ну дивіться. Я ж не проти, щоб усе працювало добре — я тільки «за». Але цей цирк триває вже третій рік за сценарієм «миші плакали, але їли кактус». Знову хайп, знову чергові «евангелісти» розповідають, що треба ще трохи почекати. Періодично це приправляють заявами про швидку появу AGI — що взагалі-то чиста ерунда.
Колесо хайпу крутять три роки. Може, досить?
Я розумію, що дані в моїй статті не є вичерпними. Але вони є, і вони показують далеко не найкращу картину. Наприклад, навіть у звітах корпорацій, де заявляють про приріст швидкості у 42.36%, самі автори визнають: завдання були атомарними та алгоритмічними, що не відображає реальної роботи в ентерпрайзі. При цьому загальний настрій розробників часто не дотягує до «сильно позитивного».
Що мене насторожує:
• Поєднання поганих (хоч і недостатніх) даних із ударними дозами маркетингового булшиту.
• Ілюзія «золотої епохи»: Коли бізнес женеться за швидкістю, ігноруючи ріст когнітивного навантаження та технічного боргу.
Я не виключаю, що ми проходимо вкрай складну криву адаптації. Можливо, це триватиме ще років 10, і потім дійсно «все стане харашо». Але розробник — не дитина. Розмовляйте зі спільнотою як із дорослими: пояснюйте про небезпечні моменти, про які самі знаєте. Приглушіть мегафони та сповільніть цей хайп-трейн.
З’являться нові дані, які впевнено покажуть, що все змінилося на краще — я перший про це напишу. А поки — вибачте, я обираю обережність.

про приріст швидкості у 42.36%, самі автори визнають: завдання були атомарними та алгоритмічними, що не відображає реальної роботи в ентерпрайзі.

Ще коли в перший ШІ взяв топові місця на олімпіадах програмуванню, мене тригернуло:
от же «брехуни»!
— Та в індустрії давно знають що спортивне програмування ну геть не дотичне до промислового.
— Настільки, що звичайний програміст навіть назв тих всесвітніх олімпіад не знає, не кажучи щоб слідкувати, та прокачувати скіли які вимагає спортивне програмування. Бо займається — ну зовсім іншою роботою кожен день, для якої треба ну геть інші компетенції.

Але кругом реакція на ці новини — ну все, раз ШІ переміг топових програмістів, то звичайних — рік, ну два — і замінить!

Та і нехай собі замінює. Будемо всі каву пити, промпти писати, а потім благополучно забудемо, що таке інженерія. Повернемось у ліси, будемо бігати голі й щасливі — головне, щоб ШІ до того часу навчився сам собі сервери лагодити.
Але якщо серйозно, то цей порівняльний аналіз «олімпіадник vs інженер» — це як казати, що якщо робот навчився швидко бігати стометрівку, то він завтра замінить досвідченого рятувальника в завалах.
Навіть автори хайпових репортів (як той самий ANZ Bank) дрібним шрифтом пишуть: «завдання були легкими, атомарними, і це взагалі не те, що люди роблять на роботі». Але хто ж читає дрібний шрифт, коли хочеться порізати кости вже сьогодні? Дожити до «лісів і полів» буде непросто, бо хтось має розгрібати ці гори ШІ-згенерованого сміття, поки ми ще пам’ятаємо, як працює комп’ютер.

це як казати, що якщо робот навчився швидко бігати стометрівку, то він завтра замінить досвідченого рятувальника в завалах.

на «олімпіадник vs інженер» в мене такє:
це як порівнювати вдалого рибалку з вудкою, який круто тягає карасів з зарибленого ставка, з робітником на сейнері.

або, коли реально топового програміста приводять як приклад, і який сказав «...»:
це як порівнювати Насера Аль-Атіяха з водієм трака, або автобуса.

і нехай собі замінює. Будемо всі каву пити, промпти писати

Трохи напевно не так, — якщо поза хайпом дивитися — то мета не замінити айтішників, а ймовірніше надати інструменти для профі у своїх доменах щоб їм не треба було звертатися до когось з айті та вони мали можливість вирішувати більшість своїх задач інструментами які будуть мати, тобто як додатковий звичайний скіл користування комп’ютерами. Як приклад-етап такого розвитку може бути навіть і пайтон у використанні поза айтішним середовищем. А серед програмастів має залишитися саме спеціалізована частина роботи з тим не пов’язана, а айті-промптери мабуть то скоріш усього тимчасова перехідна ніша при здуванні айті бульбашки.

Це якщо дивитися як на загальний розвиток зі спрощення мас-програмування (бейсіки, вебпргорамування, пайтон, etc.) і розповсюдження того максимально широко серед більшості професій та спеціалізацій кому то необхідно.

і розповсюдження того максимально широко серед більшості професій та спеціалізацій.

що виглядає сумнівно, навіть якщо взяти термін вайбкодінг від Карпати:
Програмувати будемо просто англійською!

Головне в ньому — програмувати :)

Що чітко видко — кодерам так, 314ць. Їх і так терпіли в галузі, тепер все, можна позбавлятись.

Але програмувати треба вміти, хоч з ШІ, хоч без.

ШІ як CAD системи. Креслити олівцями на папері інженеру вже не потрібно.
Але — можемо ми кого завгодно посадити за CAD систему?

Але програмувати треба вміти

Різні задачі, різний рівень, тобто комусь достатньо буде отримати невеличкий пайтон скрипт для вирішення своєї мінізадачі. Якщо більшість задач такого типу, тоді то цілком логічно має виглядати.
Менша кількість задач, для яких потрібна достатня спеціалізація, то задачі для програмістів.

можемо ми кого завгодно посадити за CAD систему?

Скажімо так — якщо для вирішення спеціалізованої задачі потрібно більш досвіду і знань у відповідному домені, ніж скілів з програмування, — то так, більш логічно щоб інженери у своїх доменах то і вирішували (ніж айтішники які не мають відповідних знань/досвіду/etc. у тих доменах).

Різні задачі, різний рівень, тобто комусь достатньо буде отримати невеличкий пайтон скрипт для вирішення своєї мінізадачі.

ну так, інструменти no/low code розширись.

але ми ж про проф розробку?
ці скриптики ми все одно не писали б.

Скажімо так — якщо для вирішення спеціалізованої задачі потрібно більш досвіду і знань у відповідному домені,

нє-а :)

Програмування — це надання інструкцій комп’ютеру для виконання ним відповідної роботи.
А спосіб — та хоч співом і танцями. якщо «посереднику» так краще.
«Посередником» до ШІ виступав — транслятор.

Зараз ШІ.
А програмування, вимоги до нього тіж самі.
Чітке розуміння чого ти хочеш.
Чітка артикуляція своїх бажань.
Чітка валідація результату.

Фахівці у спеціалізованих задачах зазвичай цього — не вміють.
Бо ніколи цього не мали потреби робити, і ніхто їх цьому не вчив.

Звісно, хтось це вмів бо має навичку. хист до — рефлексії.

Але переважна більшість людей — не мають.
І далі скриптика — нічого й собі не напишуть.

Vibe coding promised to democratize software engineering. Instead, it’s created a new class of power users without touching everyday consumers.
...
That’s maybe 1% of the population.
a16z.com/...​de-heres-how-we-fix-that

Інша річ, що серед нас, програмістів, багато тих хто теж — не має цих навичок.
Таких так, ШІ замінить, зробить не потрібними.

але ми ж про проф розробку?

Тут можна зауважити — що вважати професійною розробкою, абож точніше — грань тієї розробки, тобто коли частина того стає звичайним скілом, нп науковці зачасту вирішують свої задачі і без айтішників (і це вже було давно). З появою нових інструментів та засобів — все то поступово поширюється також і на інші домени та задачі, тобто це то що можна умовно назвати спрощенням програмування. Якщо вже говорять про ШІ — то як інструмент його також можна розглядати як частину такого «спрощення/демократизації» у використанні.

Чітке/Чітка/Чітко
Фахівці у спеціалізованих задачах зазвичай цього — не вміють

це очікувано що у програмуванні завжди буде відстоювання свого розуміння що вкласти в «чітко» та «вміють», і додам що відповідний скіл навіть і раніше не був яким-небудь «рокет-саєнс» — а купа народу з будь-яким бекграундом у айті є по суті тому підтвердженням

Тут можна зауважити — що вважати професійною розробкою

це дуже просто.
проф — це твоє головне джерело доходу. та робота — за яку тобі платять.

нп науковці зачасту вирішують свої задачі і без айтішників

тобто вони не займаються проф розробкою, бо їм платять за — їх наукову діяльність.

тобто це то що можна умовно назвати спрощенням програмування.

західний бухгалтер писав на VBA у Екселі собі.
Це спростило — програмування?

все то поступово поширюється також і на інші домени та задачі

тренду no/low code не одне десятиліття.

Проф розробка зникла?

і додам що відповідний скіл навіть і раніше не був яким-небудь «рокет-саєнс»

рокет сайенсом не був.
але скіла такого — дефіцит.

і про те купа нашого, програміського гумору.
і мемасік
«Поки кастомери так ставитимуть завдання як ми знаємо — ніякий ШІ нам не загрожує»
про те ж.

а купа народу з будь-яким бекграундом у айті є по суті тому підтвердженням

Не купа.
І це за роки добре видко навіть по форуму ДОУ.
А я тут давно.

Про це, ще ого коли сказав, і більшість так і не має цієї навички, щоб вважатися — компетентними програмістами:
Besides a mathematical inclination, an exceptionally good mastery of one’s native tongue is the most vital asset of a competent programmer. — Edsger Dijkstra;

Проф розробка зникла?

Про зникнення професійних програмістів мови і не було (у моїх коментах), поінт в тому що програмуванням буде займатися все більше і більше людей.

Не знаю яку найкраще аналогію навести... нп візьмемо категорію населення таку як «водії» — де існують як професійні водії, так і водії які використовують авто для своїх повсякденних потреб (читаємо «задач» в айті паралелях). Так само і з програмуванням буде як і з водінням авто.


Не купа

Тут цікаво би статистику у нас знайти — яка складова з тих хто тим зараз займається — в айті прийшла не маючи до того бекграунд в CS (мається на увазі не проходження курсів, а саме відповідну освіту). Можу і помилятися, але щось мені підказує що саме «не купа» то якраз «купа»).

поінт в тому що програмуванням буде займатися все більше і більше людей

мій пойнт у тому що цей тренд виник задовго до епохі ШІ.
ШІ його посилив? ну да.
Але він і без ШІ — зростав би.

в айті прийшла не маючи до того бекграунд в CS

і тренд що бекграунда у CS для професійного розробника все менш треба — теж виник задовго до епохі ШІ.

Ми ще побачимо, як знання CS обесціняться, і у тих хто їх має :)

і про «купу», я мав зовсім інший майндсет.
той що до епохі ШІ називався
T-shape men
Fullstack craftsmen
Product mind oriented

Але він і без ШІ — зростав би.

Так, тут і немає що заперечити, — зростав і зростав би надалі, а ШІ схоже все то суттєво прискорив (безвідносно наскільки вдалим/невдалим є впровадження чи як далеко зайдуть з ним зміни).

що вважати професійною розробкою

що дає основний дохід

А так, як роботизовані заводи давно роблять машини, то робітники не потрібні: зварники, слюсарі, електрики

Ну... як на мене промпти писати ще простіше

Я тут не дуже згоден. Проблема LLM це прорахунок варіантів. Олімпіаді задачі це в першу чергу прорахунок всіх варіантів. Тому це пристойне досягнення, але усуває головний недолік. Але питання якою ціною це досягнуто.

промислове програмування зовсім не про прорахунок варінатів.
тому нічого значущого досягнення у «шахових програмах» не дали світу :)

а недетермінована LLM, яка видає галюцінації, деякі з яких нам подобаються — змінює світ.

програмування давно розірвало стосунки з математикою.
і, про це холіварив багато років, насправді воно і з звичним типом інженерій розірвало стосункі, і є таким собі спеціалізованим видом «прикладної філософії»

якщо збудеться хоча б третина обіцянок у розвитку ШІ — це стане зрозумілим уже не тільки мені, і ще, чимало насправді кому, а більшості.

ну а олімпіадне, спортивне програмування тому й не цікаво майже нікому навіть серед програмістів — бо воно залишилось розділом математики, або CS у найкращому випадку

Ну... на Kaggle проводився чемпіонат з шахів серед LLM. Грали вони жахливо. LLM можуть описати позицію словами, пригадати початок, ... Але коли треба прорахувати варіанти вони туплять. Проблема не в недетермінованості, бо LLM з температурою поводить себе детерміновамно, тобто це фіча додана зверху.

Більшість проблем, що я стикався, що вона просто не бачить тактику, те що вона пропонує працювало добре, якби не провтик. Тому саме аналіз помилок, які припускають LLM, як раз свідчить про те, що вони або запам’ятали всі рішення, або там зовмсім інші потужності.

LLM можуть описати позицію словами, пригадати початок

саме так. саме в цьому їх така велика цінність.
і фактично нульова у — шахових програм.

Але коли треба прорахувати варіанти вони туплять.

не так вже й туплять. бо коли можна — не прораховувати, а описати декларативно...
(пропускаю великий шмат посилання на ідєї періоду гайпу по функціональному програмуванню)

Тому саме аналіз помилок, які припускають LLM, як раз свідчить про те, що вони або запам’ятали всі рішення

а це і є велике дискусійне питання:

бо може ці помилки викликані тим що людина ТАК поставила завдання LLM, тіпа:
порахуй скільки букв ’r’ у слові strawberry
на якому звісно LLM буде лажати

бо як знати конструктивні особливості LLM можна було б поставити завдання
напиши функцію на пітоні, яка рахує кількість заданих літер у заданому слові
виклич цю функцію для літери `r` і слова strawberry

Розумієте у чому суть дискусії
та LLM дурна
та ні, то ти дурень

не так вже й туплять.

Ну... наприклад, якась власна синхронізація потоків, де треба прорахувати кілька варіантів. І вона може або в лямбді захопити якусь змінну зі стеку, та не порахувати що вийти з функції можемо до виклику лямбди. Чи не подумає, що один потік може закінчитися раніше іншого. Так, це можна вважати неточним ТЗ, але в принципі коли ти кодуєш, то відразу розраховуєш на песимістичний сценарій.

порахуй скільки букв ’r’ у слові strawberry

Це просто недоліки того, як слова кодуються у вектори чисел. Там може бути вектор дуже схожий на фразу «порахуй скільки літер „к“ в слові клубніка». Я не це маю на увазі. Я маю на увазі, коли у нас є контекст, в який ми можемо попасти з декількох сценарієв, які треба тримати у мозку, то... вона часто пропускає.

та це все зролуміло, в мене самого списочок такого ого.
з 23 року ж використвую. і прогрес бачу, і те що так і залишається вадами GenAI

але.
вперше нескладний, але асінхроний баг знайшов в моєму досвіді Opus 4.5

До цього ніхто таких речей не міг знаходити, з мого досвіду. Ретельні тести не робив.

Другє що я бачу, код рев’ю у Копайлоті (на GPT) покращилось ого як останні місяці.
Майже немає вже дурних зауважень, особливо коли 5 рядками вище ж є код, а він його не враховує і пише фігню: ой, тут у вас проблема.

Зауваження стали прямо сіньористими, глибокими.
І про асінхронний код теж, став бачити його, і потенціальні проблеми.

Я про це. У шахах мав 3 розряд. І що відомо про шахистів — у більшості випадків не прораховують варіанти. А інтуітивно зразу вибирають тільки декілька напрямків. тобто оцінюють позицію «декларативно». Шахові програми до нейромережевих — теж так робились, аналізатор на основі емпирічних правил, швидкий.

Так от, сила трансформерів у самій їх суті — вони «запам’йотовують» — патерни. починаючи з T9.
і тому, галюціонують, тобто ця сила і є недолік, але й тому — не прораховують, а аналізують «декларативно».
Що вказує що імперативний код, з купою змін стейту — для них незручний.
А чим декларативніший, тим краще розуміють.

А от що в них хронічна проблема — відсутність абстрактного мислення.
Тому декомпозицію по рівнях абстракцій — можуть робити просто дуже жахливо.
Видко що у цьому — джуни.

про букву ви не зрозуміли. Це був приклад як аналогія що модель може обійти свої ж недоліки зміною способу рішення.
Тобто значить і невміння абстрактного мислення — можуть обійти якимось іншим способом. І можливо цей спосіб — задати патерн.
і т.д.

Я про це. У шахах мав 3 розряд. І що відомо про шахистів

У мене FIDE рейтинг 2130, стареньких гросмейстерів типу Стеллана Брюнелля вдавалося перемагати в класику. Тому чесно, навіть не зважаючи на те, що ти обираєш план, оцінюєш позицію, і це звужує кількість, варіантів треба рахувати багато, перевірку ніхто не відміняв. При тому що я лінюся це робити :-)

Тому декомпозицію по рівнях абстракцій — можуть робити просто дуже жахливо.

Видко що у цьому — джуни.

Можливо. А все-таки більше працюю більше на більш низькому рівні (мережі, протоколи, драйвера, для себе рушії логічних ігор). Там, по-перше, мені складно уявити як можна написати декларативно, усе одно буде стейт, яким треба керувати. Різніх комбінацій багато. Там я бачу більше фундаментальне обмеження.

А от якщо брати архітектуру, то скоріше маємо проблему в нестачі даних для навчання, все ж таки досвід багатьох досвчених розробників ніде не підсумований, а рівень джуна це як раз і є начитатися дядька Боба й почати ліпить фігню.

треба рахувати багато, перевірку ніхто не відміняв.

та треба звісно.
але, якось зустів статтю про Го.
про те що європейці грають гірше не тому що менше досвід, а по стилю гри видко — багато рахують, чипляются за тактику, там де азіат розуміє — це фігня, дріб’язкова тактика, не впливаюча на стратегічний тренд.

і точно, прорахувати стратегічно у Го неможливо для людини.

А все-таки більше працюю більше на більш низькому рівні (мережі, протоколи, драйвера, для себе рушії логічних ігор).

так. про це зараз якось ніхто і не пише.

Що давно ще Спольскі написав про «5 світів програмування». Зараз думаю ще тра декілька.

і ШІ — буде використовуватись, впливати на ці світи — дуже по різному. і десь майже геть ніяк.

А от якщо брати архітектуру

Яку з них :)

Їх дві є, два не пов’язані геть сенса, у розробці ПЗ.

От друга, про яку менше кажуть, більш важливіша у більшості випадків, аніж перша, яку промовляють надуваючи поважно щоки :)

про те що європейці грають гірше не тому що менше досвід, а по стилю гри видко — багато рахують, чипляются за тактику, там де азіат розуміє — це фігня, дріб’язкова тактика, не впливаюча на стратегічний тренд.

так розуміння у нього зʼявилось тому що він досвід цей якось отримав, а не тому, що він азіат

розуміння у нього з’явилося бо їх зразу так вчать, поезії-філософії Го, а не розрахункам.

це різні традиції мислення.

і, шахи більш тактична гра, ніж Го, тому європеєць автоматично вчиться мислити тактично.

і ще раз, звісно і в Го треба рахувати, і рахують.
Всяка гра де є послідовність кроків, і їх вибір — буде потребувати розрахунку.

Мова про пріоритетність підходу.

та треба звісно.
але, якось зустів статтю про Го.
про те що європейці грають гірше не тому що менше досвід, а по стилю гри видко — багато рахують, чипляются за тактику, там де азіат розуміє — це фігня, дріб’язкова тактика, не впливаюча на стратегічний тренд.

Ну... можливо трохи не так зрозумілось

По-перше, маємо історичний факт, коли гравці з Кореї та Китаю потіснили японців на топі саме тому, що вони запропонувати го, яке базувалося в більшій мірі на розрахунку варіантів.

По-друге, це проблема де зупинитися. Наприклад, я дійшов до позиції, яку оцінив як кращу для себе. І перейшов до інших варіантів. Менш досвічений гравець не зупиниться, а буде рахувати ще варіанти, доки не переконається що вона гірше. Але це не означає, що я рахую менше, я просто рахую те що треба. Взагалі, як на мере, в го треба набагато більше конкретних знань, починаючи від дзесёки, тесузді, ...

Плюс в го в більшій мірі є розрахунок на ідеях. Це і є в шахах (особливо у закінченнях), коли ти просто думаєш якщо я зроблю вторгнення тут, він почне мене тіснити, отримає вплив, який я можу нейтралізувати і т. п. Тобто без конкретних варіантів, серіями, ...

Ну а йосе це взагалі рахунок, рахунок та ще раз рахунок..

P. S. Хто вгадає партнера?

res.cloudinary.com/...​/wu3064osmk0uiadepnnj.jpg

Наприклад, я дійшов до позиції, яку оцінив як кращу для себе. І перейшов до інших варіантів. Менш досвічений гравець не зупиниться, а буде рахувати ще варіанти, доки не переконається що вона гірше.

Саме так, якщо прагматично:
декларативність зменшує витрати енергії.
І от тут, диво — нейромережі теж не пропрацьовують всі варіанти. галюцінації LLM — це чимало і є наслідком — зупинки на «кращому», не «прораховуючи» до кінця

Але це не означає, що я рахую менше, я просто рахую те що треба

Означає що рахуєте — менше :)
Замість 10 варіантів ви прорахувуєте — 2.

Плюс в го в більшій мірі є розрахунок на ідеях.

Так. Я про це.

Ну а йосе це взагалі рахунок, рахунок та ще раз рахунок..

ну тобто ми не порозумілися геть ;)
хоча ви самі навели приклади до моїх тез.
ну ок, дискусія завершилась як у більшості випадків :)

Означає що рахуєте — менше :)
Замість 10 варіантів ви прорахувуєте — 2.

Час гравці витрачають однаково. Тому щось та рахують. Просто якщо є три альтернативи, то я швидко забракую один варіант, а потім буде більше часу обирати з двох. А суперник, який витратить забагато часу на трею, потім аналіз перших двох буде не настільки якісним.

Тобто в сумі він прорахує 10 + 10 + 10, я прорахую 14 + 14 + 2.

галюцінації

В мене їх теж повно, що в шахах, що в програмуванні. Просто у мене багато стоп-прапорців, що я зайшов не туди, щось не б’ється, ...

чи взагалі ШІ код-асистенти є доказово корисними? Чи дають вони збільшення швидкості делівері загально? Чи є вони надійною технологією на 4-му році існування для бізнесу?

Спойлер: ні, не дають і не є надійними

Мені успішне використання АІ протягом минулого року дало підвищення і + до ЗП. І це при −20% інженерів на проекті.
Тому для мене АІ точно є «доказово корисним»

Всю статтю не осилив, ваш АІ нагенерив забагато тексту, ще й дубльованими тезами

Задорний топік, підпишусь. Здається щось нарешті краще за емігросрачей зявилось :-)))

Зараз вже ніхто не пише копілятори, асемблер...Почитайте дяду боба про його перші робочі місця коли він писав код на перфокартах і дебажив очіма код на папері...Він доречі інденером так і залишився бо не доводив що компілятори та гарбедж коллектори сповільнюють програмістів.

Таке враження що світ деградував та став неспроможним робити навіть самий елементарний аналіз та прогнозувати розвиток подій в майбутньому. А потім дивуються, що результати не відповідають очікуванням.
Достатньо було задати прості запитання та дати односкладні відповіді на них, щоб передбачити деякі «ефекти» оптсані в статті.

  • Чи може AI розробити складну архітектуру проекту? Ні.
  • Чи може AI генерувати код краще за спеціаліста середнього рівня? Ні.
  • Чи може ШІ робити аналіз коду? Ні.
Всі відповіді випливають з технології, яка застосовується. Імітувати не значить розуміти. Але кого це цікавить, якщо можна намалювати красиві звіти та цифри в них. Правильно було зауважено, що KPI були обрані доволі примітивні та, попри позитивну динаміку, майже не впливали на реальний стан бізнесу.
Таке враження що світ деградував та став неспроможним робити навіть самий елементарний аналіз

Ви цьому здивовані? Я — ні.

Не здивований ані трішки. Тенденцію було вже видно 10 років тому.

Достатньо було задати прості запитання та дати односкладні відповіді на них,

Так ви головного питання не поставили:
Чи може АІ підвищити майбутні прибутки?

Яке для нас (програмістів) спускається як
Чи може AI оптимізувати делівері(пришвидшити, та/або зменшити вартість)?

Враховуючи що активне впровадження йде всюди крім Developex (зі слів автора), то відповідь очевидна що Так.

Чи може АІ підвищити майбутні прибутки?

Наскільки майбутні? Мені здається ключова причина срачику в топіку в тому, що палкі прихильники оцінюють емпіричний досвід й короткотермінові результати (і в першу чергу особисті), а критики намагаються підняти як раз проблематику довгострокового впливу в великому масштабі (де емпірічного досвіду або ще немає, або в принципі не може бути бо мова йде про динаміку великих систем, яким взагалі притамана контр-інтуітивність).

Чи можуть окреми девелопери чи тіми деліверити більше? Цього здається ніхто не заперечує (навіть якщо посилатись на якісь обмежені дослідження зі «скромними» десятками процентних пунктів бусту — це все одно дофіга в грошах). Звісно що якщо позвільняти трохи кодерків, а ті що залишились за допомогою агентів будуть деліверити за себе і тих хлопців, на короткому інтервалі в пару рочків PLS та баланс будуть виглядати як цукерочка. І фондовий риночок таке любить.

Але як щодо довгострокових ефектів? Прибутки-то генерують не кодерки, й не кількість фіч — прибутки генерують клієнти. Хтось рахував скільки потенційних або навіть актуальних контрактів в бітубі вже гигнулись тому що важелі вагів похились в бік «build» замість «buy»? Та й в бітусі можливи «ексцеси», просто динаміка інша. Отой весь хайп який розганяється потроху в пресі про те що люди втрачають роботу завдяки ШІ в перспективі цілком можливо призведе до того, що домогосподарства почнуть скорочувати витрати на некритичні речі — це дуже добре відома реакція в період будь-якої невизначеності. І цілком можливо що ті самі люди які сьогодні радісно рапортують перед бордою що всьо харашо прєкрасная маркіза бо ми скоротити охуліард кодерків а делівері тільки росте, через якийсь час будуть збирати наради «чому ніхто не купує підкиски, churn rate злетів в космос і що з цим тепер робити».

Мені здається в цій дискусії «обидві сторони праві». Кодеркам і технічним менеджерам необхідно бути в темі, бо буст продуктивності особистий і команд — це реальність. Але відмахуватись від питань чи навіть сумнівів щодо більш віддалених переспектив імхо не варто.

Чи можуть окреми девелопери чи тіми деліверити більше? Цього здається ніхто не заперечує

Та заперечують, звідси і дискусія)
І звідси і йдуть звільнення пов’язані з АІ, метрики адопшину і т.п.
Бо якщо можуть окремі тіми/девелопери, то звільнивши тих хто не можуть отримаємо менші витрати.
Найнявши на місце звільнених «тих хто можуть» отримаємо приріст продуктивності.
Цим компанії зараз і займаються

Чи може АІ підвищити майбутні прибутки?

Може. Непрямі. У компаній, які розробляють AI та які роблять все для інфраструктури все буде добре. У решти — буде залежати від глибини інтеграції та бізнес-моделі.

Класична помилка — думати, що є чарівна технологія, яка зможе щось покращити та автоматизувати, а це призведе до зменшення витрат. Але це ментальна пастка. Щоб отримати вигоду від автоматизації завдяки певній технології треба перебудовувати процеси та робити це в першу чергу, а не в останню. Іншими словами, не треба автоматизовувати наявні процеси, вигоди не буде або вона буде мінімальна. Треба створювати нові процеси, які з початку вже враховують всі плюси та мінуси впровадження AI. Наприклад, AI може прискорити онбордінг, написання документації, розробку PoC, автоматизацію тестування, перевірки різні на відповідність правилам та нормам, але важливі частини коду залишити під контролем НІ (натурального інтелекту). Тоді ви зможете тримати якість та надійність під контролем.

Це як приклад приведено було, не треба це вважати єдино правильним варіантом.

ктивне впровадження йде всюди крім Developex (зі слів автора)

а на сайте пишут, что активно используют Codex для

For specialized code generation tasks and deeper code understanding, often integrated into specific engineering workflows.

developex.com/...​ivity-across-departments

где правда? :)

Чи може АІ підвищити майбутні прибутки?
Чи може АІ не підвищити майбутні прибутки?
Чи може AI оптимізувати делівері(пришвидшити, та/або зменшити вартість)?
Чи може AI не оптимізувати делівері(не пришвидшити, та/або не зменшити вартість)?

відповідь очевидна що Так

«може» не «буде»

x.com/...​/2021209931400040526?s=46

Дядя Боб как раз вот на злобу дня высказывается. На ДОУ ему надо, тут-то эксперты раскроют старику глаза 😂

Нічого не буде. Одні почують лише його «the game has changed» та «some of the rools are going to change» як підтвердження власній позиції, а інші будуть чути «and some of the rules (in fact probably most of the rools) are going to remain».

Це видно всюди зараз, особливо від палких прихильників «ШІ», для яких достатньо побачити ім’я Лінус та слово вайбкодинг в одному заголовку статті, щоб зробити висновок, що Лінус став вайбкодером по суті.

я думаю що цей рік буде переламний, тобто для перших він буде долиною розчарувань, бо над «the game has changed» будуть сміятись як над «кріпта замінює фіат, а NFT — то нові активи»
а другі вийдуть на плато продуктивності, бо вже промацують його, з минулого року, коли різонінг моделі чимало додали необхідних властивостей моделям.

навіть у тусовках вайбкодерів вже чимало хто виріс з минулого року, і використовує вже не вайбкодерські, а суто інженерні практики.

Як раз згадував його постом вище.

GitHub Copilot Business: $19/користувач/місяць ≈ $228K/рік для 1 000 інженерів.

Бізнес платить не за користувачів, а за токени

Сканування якості коду та безпеки (SonarQube, Semgrep) $500K—2M

Та ну, ми просто користуємося сервісом сторонньої компанії, яка аналізує код і видає репорти. Це коштує небагато. Навіщо собі городити всю інфраструктуру, коли можна орендувати?

Про токени там далі. Це теж прихована стаття витрат. А розрахунки по інфрі ви ж розумієте що дуже приблизні. Щоб показати порядок цін. Причому це цифри все такі для західних компаній і наші будуть нижчі бо рейти нижчі. Але все одно це доволі суттєві витрати якщо ми хочемо щоб копілот працював у нас так же гарно як у Майкрософт . Для цього надо не ліцензію купити а витратити значно більше грошей а без цих витрат — ефект від копілоту буде значно нижчий а ризики вигрібти повні репо техборгу вищі.

Hi team,

During the past week, some of us crossed $1,000/person on Cursor. That’s not sustainable.

це з робочого чату на цьому тижні xD

crossed $1,000/person on Cursor

це за тиждень? тобто десь 4К на міс?

може і за місяць, але все одно дичина), я дивився наш дашборд юзейджа курсору, там в топі якісь тіпи з відділу тестування, в одного були взагалі страшні цифри за місяць в 80 тисяч апрувнутих строчок, не знаю що він там ганяв по колу якщо чесно. у мене на мобільній розробці за місяць токенів на 260$ вийшло, в мого колеги на 90.

чему ты удивляешься? было бы желание, сжигать токены очень просто. вообще это та сумма, которую должен тратить каждый чтобы это все продолжало развиваться. неужели себе кто-то напредставлял что купит лицензию за 20 долларов одному разрабу и тот заменит целый отдел?

з чого ти взяв, що я дивуюся? я уточнюю і збираю статистику :) цікаво почути про реальну практику в інших компаніях і які в кого «ліміти». очевидно, що доволі легко можна накрутити на значно більші суми

представляю эту статистику... из данных с постов на доу :D

это мощно! явно один Опус гонял на тысячи строк ежедневно. Cursor дорогой, подписка на Claude Code выходит дешевле.

это на Flutter?

ні це якісь тестувальники, точно не знаю що там за стек в них, але в тіпа на default моделі в дашборді пише що за місяць 3.133 аксепнутих діфа і 227 табів, 92к агентських строчок коду) там ще пара таких як він.
у мене на мобілці з чим я працюю 221 діф і 12к строчок за місяць.

В мене був $1000 ліміт на тімку з 20 інженерів.
Зараз підняли до $1500.

Поки $100 для активного девелопменту хватає

Дякую за статтю.
Сам думав таку зібрати, бо спостерігаючи на брехню ґайпу на думку спадає така аналогія

Кажуть що провели дослідження, зелені рослини у цеху підвищують продуктивність працівників.
Я звісно не вчений, може й бути що так.
Але я працюю у мартена, і думаю собі — а які рослини витримають той цеховий клімат...

Мені показують фоточку, офіс, щасливі обличчя, а я все бурчу:
фік його знає, може й в офісі так, але... то які рослини і скільки витримають у цеху? хто їх буде замінювати? ...

— Ти лудіт!, — відповідають мені.

ну ок, піду собі роботу робити.
у нас є рослинка, у роздягальні, тому й знаю, що в цеху — не витримає...

ґайпу

Сподобалось )

а які рослини витримають той цеховий клімат

Кактуси?

Та навiть в офiсах. Поставлять якесь велике дерево прям на проходi та оминай його кожного разу. Чи ось вам кiмната для пiнг-понгу, ще чогось, натикають туди рослин, через якi можна навернутися, бiсить

Працеголіки з вами не погодяться. Для них зростання тиску лише в кайф. Як я вже коментував десь — ШІ це посилення експлуатації через примус виконувати подвійну, а може й більше, роботу вдвічі дешевше (бо звільняють жеж) Ведмежка, що наче скрізь натякає що ШІ це можливо лише привід для звичайного ведмежого скорочення штатів.
Це буде феєричний епік фейл усього IT, ШІ апокаліпсіс, саме через те, що ШІ не працює як Regular Expressions
Закинув до Грока і він відкрив для мене Америку: x.com/...​4f6cb4751a07146e1628aeeb8
Перше: сучасні LLM це інструменти для розробників. Немає розробника поряд з інструментом — не буде виконана робота. Жодного розробника через — «ШІ все зможе і без тебе» — звільняти не можна. Бо не зробить.
Друге: LLM потрібні, але й потрібні ще інші ШІ — що працюватимуть як Regular Expressions.
LLM це компаньони, а RE це RE

Жодного розробника через — «ШІ все зможе і без тебе» — звільняти не можна. Бо не зробить.

будут увольнять тех, кто не хочет/не умеет работать с LLM. потому что грамотный инженер с coding agent сделает гораздо больше за то же время, чем обычный «старокодящий» :)

тільки спочатку потрібно тих новохіпстерних з гайпом і вайбом нагенерити в неіпічних кількостях

Зараз ринок працедваця, вже десь майже чотри роки, в сша безробіття найгірше з 2009-го.

вюсди чи ти будеш і тут проти вітру плювати? )))

в топе признаков грамотного инженера — эмпиризм.
а кто ведется на хайп — тот неграмотный. и не инженер.

потому что грамотный инженер с coding agent сделает гораздо больше за то же время, чем обычный «старокодящий» :)

Тут є декілька умов, щоб це було правдою:

  1. ШІ мусить «знати» фреймворки, бібліотеки, технології, які використовуються на проекті. Для чогось новітнього або «незнайомого» результат буде поганим
  2. Не розробляються нові алгоритми, фреймворки, бібліотеки
  3. Немає особливих вимог до якості, швидкодії, ресурсоємності коду.
Інакше ШІ буде виключно заважати.

Та наче девелопери гарно знають фремворки що використовують, читають в інтеренті ти питають ШІ бо основам. Скільки програмістів реально розробляють алогритми, фереемворки та бібліотеки? Скільки програмітів можуть писати не просто копіпасту із стек оверфлоу чи медіума а реально з урахвання ресуросємності особливо коли і час і память і ІО виконання?

Я не знаю. Ви хоч раз в житті написали хоч одну бібліотеку, чи фреймворк?

Ну виходить що звичайний девелопер навіть сеньор вже нуль якщо не писав біблотеку? Бо 99 відсотків не пишуть біблотеки а мовчки копіпастять із стек оверфлоу та оф доки, але гонору що спєци просто п**ц.

Насмикати готових рішень та зліпити абияк кінцевий продукт — це рівень джуна. Звісно, що можна на лоба наліпити кокарду будь-якого розміру та називати себе яким завгодно рівнем, але без досвіду створення унікального продукту то все дитячі забаванки. Вміти компілювати щось з готових блоків та вміти розробити готові блоки — два різних вміння, але дуже показовий маркер рівня спеціаліста.

особенно когда у всех готовых решений есть явный фатальный недостаток!

Насмикати готових рішень та зліпити абияк кінцевий продукт — це рівень джуна.

Я б сказав що це рівень business-oriented, product mindset Staff engineer.
За такі вміння «насмикати готових рішень» бізнес платить дуже багато

До певного часу, поки оте насмикане на швидкоруч зліплене не почне сипатися. В мене є живий приклад такого тупого рішення бізнесу, коли PoC без переробок майже відправили в прод. Вже років 5 як не можуть дати ладу цьому, собівартість космічна, вихлоп — як кіт насрав. Всьому є ціна. Скупий платить двічи, а довбень — тричі та більше разів.

Вже років 5 як не можуть дати ладу цьому,

Тобто воно вже 5 років на проді.
А з найкращими інженерними практиками могло б на прод і не попасти

Так, воно 5 років приносить купу головного болю, витрат, впливає на задоволеність клієнтів та інші підсистеми. Саме смішне, що цей «продукт» намагалися оптимізовувати, переписувати, покращувати, але все марно, бо помилка в базовій архітектурі, в принципах, на яких був побудований продукт та повній неготовності до справжнього навантаження.

А з найкращими інженерними практиками могло б на прод і не попасти

Якщо б воно не попало, не було б всіх тих збитків, які «продукт» наніс компанії. Він не прибутковий та не окупається в тому вигляді, що є зараз.

тепер замість SO AI копіпаста

ШІ мусить «знати» фреймворки, бібліотеки, технології, які використовуються на проекті. Для чогось новітнього або «незнайомого» результат буде поганим

Claude Code знает фреймоворки/библиотеки, включая те, которых не знаешь ты. Что-то свое внутреннее? — даешь прочесть документацию. Нет документации? — просматриваешь с Claude Code сорцы и составляешь документацию, которая пригодится потом коллегам. С ассистентом ты это сделаешь гораздо быстрее, чем вручную.

Не розробляються нові алгоритми, фреймворки, бібліотеки

Все это тоже проще и быстрее делается с ассистентом. Больше того скажу, практически любая умственная работа. Я PRD регулярно пишу с Claude Code, например.

Немає особливих вимог до якості, швидкодії, ресурсоємності коду.

На сегодняшний день AI ассистенты пишут код ЛУЧШЕ среднего программиста. Как минимум потому что этот код хорошо структурирован и документирован, и потому что нехитрые приемы позволяют оценить и улучшить и качество, и эффективность кода. И итоговый код будет лучше того, который находится в среднем репо средней аутсорс конторы.

то-то свое внутреннее? — даешь прочесть документацию.

Навіть якщо буде документація, без кодової бази кількість маячні, що буде згенеровано ШІ буде неймовірною. Чим більше прикладів коду — тим краще. Якщо прикладів нуль, а технологія нова та кардинально відрізняється від всіх інших, очікувати гарного результату я б не став.

На сегодняшний день AI ассистенты пишут код ЛУЧШЕ среднего программиста.

Спірна заява.

Как минимум потому что этот код хорошо структурирован и документирован

Структурованість коду не показує його якість.

оценить и улучшить и качество, и эффективность кода

Це все маркетинговий булшит. Якість за якими критеріями оцінюємо? А ефективність?

Навіть якщо буде документація, без кодової бази кількість маячні, що буде згенеровано ШІ буде неймовірною. Чим більше прикладів коду — тим краще

я просто по твоим ответам (да и других комментаторов в этом и прочих топиках) вижу, что ты не дупля не смыслишь в теме AI coding, не отслеживаешь тренды, не пробуешь на практике техники. ну это полбеды, настоящая ваша беда в том, что вы пошли по пути отрицания, закостенелости мышления.

Якщо прикладів нуль, а технологія нова

а вот это особенно смешно. если инженер выбрал такую технологию в стек (при наличии альтернатив), то тут проблема в инженере.

Спірна заява.

да, на все 100% субъективное суждение. имею право, не собираюсь доказывать, мне достаточно своего мнения.

Структурованість коду не показує його якість.

да, это не достаточное, но необходимое и базовое требование. которое в подавляющем большинстве среднестатических реп не соблюдается, я их повидал порядком.

Це все маркетинговий булшит. Якість за якими критеріями оцінюємо? А ефективність?

так это же ты писал про

вимог до якості, швидкодії, ресурсоємності коду

вот так и оцениваем.

ты не дупля не смыслишь в теме AI coding

Може тому що я розумію, як ця технологія працює під капотом та що від неї слід очікувати, а чого ні? Мені чхати на маркетинговий булшит.

что вы пошли по пути отрицания, закостенелости мышления.

Неправильні висновки. Я можу назвати купу різних юзкейсів, де AI coding буде корисним, які я використовую періодично. Але є фундаментальні речі, які важко обійти, бо вони закладені в саму сутність генеративного ШІ.

а вот это особенно смешно. если инженер выбрал такую технологию в стек (при наличии альтернатив), то тут проблема в инженере.

Точно, всі мусять бути однаковими, ходити в однакових светрах, однакову бороду носити та писати однаковий код для однакових продуктів. Якщо людина вибрала якусь конкретну технологію собі в стек, значить вона провела як мінімум аналіз на співпадіння технології з поточними та майбутніми вимогами до продукту. Це показує зрілість розробника, а не недолугість. Це у зумерів популярно хапатися за щось, про що найгучніше кричать, а потім вони страждають та вигорають за пів року. Формошльопство не є єдиним способом розробки в світі.

Може тому що я розумію, як ця технологія працює під капотом та що від неї слід очікувати, а чого ні?
Але є фундаментальні речі, які важко обійти, бо вони закладені в саму сутність генеративного ШІ.

да ничего ты не знаешь, это же очевидно. почитал пару статеек про трансформеры и демонстрируешь не просто невежество, а воинствующее невежество.

вона провела як мінімум аналіз

на основании чего? напомню, ты же писал

прикладів нуль, а технологія нова

запутался уже в своем фантазерстве. выдыхай.

да ничего ты не знаешь, это же очевидно. почитал пару статеек про трансформеры и демонстрируешь не просто невежество, а воинствующее невежество.

Ок, не буду сперечатися.

на основании чего?

На основі вимог, критеріїв оцінки та власної технічної експертизи.

запутался уже в своем фантазерстве. выдыхай.

Ні, це ти не розумієш того, що тобі кажуть.

Типовий приклад того, як зазвичай відбувається вибір технологічного стеку

  • Перевагу віддають популярним рішенням
  • Вибір за принципом «відомий команді продукт»
  • Хочу спробувати щось нове.
А як бажано робити
  • Вибір технологій під всі вимоги до продукту, не під якусь частку
  • Перевага стабільним та надійним рішенням
  • Не використовувати продукти, технології, бібліотеки, які тільки частково вирішують певні задачі.
  • Власне рішення робити у випадку, якщо воно покриває унікальну частину вимог або приносить іновації

Це зрозуміло? Пояснень вимагає?

На основі вимог, критеріїв оцінки та власної технічної експертизи.

«примеров нет, технология новая». собственная техническая экспертиза в новой технологии на чем основана? на самомнении?

Перевагу віддають популярним рішенням

вполне адекватный критерий. популярное — значит, накоплен большой опыт, развитая экосистема, фиксятся баги

Вибір за принципом «відомий команді продукт»

и это тоже правильно. команда уже обладает компетенцией, при прочих равных нужно брать знакомое решение и начинать давать результат

Вибір технологій під всі вимоги до продукту, не під якусь частку

в реальных проектах так редко бывает.

Перевага стабільним та надійним рішенням

популярные, стабильные и надежные решения прекрасно знакомы AI ассистентам, кстати говоря.

но напомню, ты там парой комментов выше писал, что «ноль примеров» и «новая технология». так это не «стабильное и надежное решение». ты снова запутался.

Це зрозуміло?

да все мне давно ясно про тебя

собственная техническая экспертиза в новой технологии на чем основана? на самомнении?

На попередньому досвіді та знаннях розробників.

вполне адекватный критерий. популярное — значит, накоплен большой опыт, развитая экосистема, фиксятся баги

А якщо воно повністю не підходить під задачу? Приклад з одного продукту, побудованого на React, тому що модно-молодіжно, багато досвіду та все таке. Проста примітивна задача. SaaS SPA. При переході з однієї «сторінки» на іншу та поверненні назад на першу треба просто показувати вже відрендерений стан, не перерендерювати наново. Щоб не втрачати контекст, інпути, позицію скрола, тощо. Не можуть зробити вже рік. Все добре, технології модні, екосистема розвинута, баги фіксяться, але це ніяк не допомагає вирішити таку просту задачу.

команда уже обладает компетенцией, при прочих равных нужно брать знакомое решение и начинать давать результат

Читати вимоги треба спочатку. Щоб потім не закривали проект з причини того, що недостатня продуктивність команди. Найняти треба тих людей, які принесуть потрібну експертизу. Ви ж не приходите в дитячий садочок, щоб вам побудували будинок, бо місцеві спеціалісти вельми вправні в будівництві пасочок?

в реальных проектах так редко бывает.

Так, в курсі. Це мене дуже тішить.

но напомню, ты там парой комментов выше писал, что «ноль примеров» и «новая технология». так это не «стабильное и надежное решение». ты снова запутался.

Останній пункт чого проігнорував? Це була як раз прелюдія до наступної порції даних. Отже, якщо ти обираєш писати щось нове, принципово нове, наприклад, з використанням специфічного DSL (domain specific language), то ШІ тобі буде постійно пропонувати нереальні варіанти рішень. Неважливо, буде в тебе детально розписана документація чи не буде. Чому? Тому що частотна характеристика буде на рівні похибки. Все, що вибивається з «норми» буде мати найбільшу варіативність вибору векторів.

З цим зрозуміло?

Мені цікаве більш концептуальне питання: ці ШІ-копілоти зараз знають лише те, що вже стало мейнстримом. Звісно, можна спробувати тренувати вузькоспеціалізовані LLM, але тут ми впираємося в стіну — де брати якісні датасети для чогось принципово нового?

Існує думка, що все вже винайдено і нічого нового не треба, але практика показує зворотне: нові мови та SDK продовжують з’являтися. І тут виникає парадокс: якщо ми всі станемо «вайбкодерами», то хто буде по-справжньому програмувати на новій технології, щоб створити базу знань? Stack Overflow у таких умовах просто не встигне наповнитися, а отже, нейромережі не матимуть джерела для навчання.

Виходить, єдиний реалістичний сценарій — це коли вендор, випускаючи нову мову на ринок, одразу запускає і свою навчену LLM. Тобто ШІ стає не просто помічником, а невід’ємною частиною релізу технології, бо без готової моделі вона просто не злетить у світі, де ніхто вже не хоче писати код руками з нуля.

ничего нового не появится, если все станут генерить код, соответственно и проблем с тем что ллм не знает нового не будет

Мені цікаве більш концептуальне питання: ці ШІ-копілоти зараз знають лише те, що вже стало мейнстримом. Звісно, можна спробувати тренувати вузькоспеціалізовані LLM, але тут ми впираємося в стіну — де брати якісні датасети для чогось принципово нового?
Виходить, єдиний реалістичний сценарій — це коли вендор, випускаючи нову мову на ринок, одразу запускає і свою навчену LLM. Тобто ШІ стає не просто помічником, а невід’ємною частиною релізу технології, бо без готової моделі вона просто не злетить у світі, де ніхто вже не хоче писати код руками з нуля.

Виталий, не позорь себя и свою компанию. ты просто расписываешься сейчас в некомпетентности.

что же в его словах такого позорного?

его посты полны попросту некомпетентных утверждений. Виталий — публичное лицо своей компании на этом форуме и когда такую чушь пишет PMO&Delivery Head, то конечно, это бросает тень на всю компанию.

и, по-твоему, он опозорил компанию тем что задал вопрос в воздух и предложил крайне необычное решение? жестко...

да, наверное, я действительно хватил лишнего со словами «позорить».

Виталий, я приношу свои извинения за эти слова. это было сгоряча и действительно несправедливо по отношению к тебе.

Певний час вагався, чи відповідати взагалі — бо бачу лише дивні переходи на особистості. Описано доволі очевидний парадокс, який наразі не зрозуміло як вирішувати.
1. Професійна експертиза vs Менеджмент
Менеджмент у великій компанії — це не конкурс на «найрозумнішу людину в кімнаті». Коли працюєш із сотнями інженерів, вкрай рідко ти найрозумніший. Завжди знайдеться той, хто в своїй експертизі на 5 голів вище за тебе.
Моя робота не в тому, щоб перепрограмувати сеньйора, а в тому, щоб:
• Зрозуміти суть проблеми, яку озвучує людина.
• Прибрати бар’єри, що заважають команді (юридичні питання, фінанси, політика чи невдоволення клієнта).
• Бути «нубом», коли це потрібно. Найдорожчі консультанти світу часто починають мітинг із фрази: «Я нічого не розумію у вашій техніці — розжуйте мені як нубу». Це єдиний шлях дістатися до істини, і соромитися тут нічого.
2. Парадокс «стіни датасетів» та Model Collapse
Парадокс, який я описав, — це реальна загроза деградації моделей. ШІ тренується на публічному досвіді людей. Якщо ми перейдемо на «вайбкодінг» і перестанемо створювати унікальний контент (Stack Overflow, документацію, обговорення), моделям не буде на чому вчитися. Вони почнуть споживати власний же «викид», що призводить до поступової втрати зв’язку з реальністю. Без людського Ground Truth для нових технологій ШІ просто перетвориться на статистичне ехо мейнстриму минулого.
3. Чому «дати Claude опис DSL» — це не рішення
Поради «просто дати опис DSL в Claude» — це вирішення локальної задачі з написання синтаксису, а не системної проблеми.
• Мануал дає правила, але він не дає Best Practices та архітектурної глибини, яка народжується лише через реальний людський досвід експлуатації.
• Щоб «дати опис», людина сама має спочатку пройти шлях пізнання. Якщо ми делегуємо цей шлях ШІ, ми просто перестаємо бути джерелом нових знань.

здесь нет переходов на личности, я только высказываю свое мнение, что ты в этом и в предыдущем своем топике неоднократно делаешь глубоко ошибочные утверждения и занимаешься алармизмом. об этом тебе писал не только я, но и другие авторы.

Бути «нубом», коли це потрібно

это красивые слова и быть нубом — не зазорно. но нуб — учится, сомневается, рассуждает и прежде всего проверяет свои сомнения практикой. напиши пост о том, как ты запустил контрольную группу в своей компании с таким-то процессом и получил такие-то резулььтаты. это было бы профессионально. но вместо этого ты претенциозно подбираешь материалы и пишешь длинные статьи в псевдонаучном стиле. на мой взгляд это некомпетентно и глубоко непрофессионально.

Якщо ми перейдемо на «вайбкодінг» і перестанемо створювати унікальний контент (Stack Overflow, документацію, обговорення), моделям не буде на чому вчитися

это не так, уникальный контент по прежнему создается, просто с помощью AI ассистента. инженер делает постановку задачи, принимает решения, генерирует код, верифицирует его, документирует итоги. все это дает уникальный контент. GitHub/Reddit/Твиттер по прежнему полны людей, которые обсуждают код, обсуждают подходы, делятся решениями.

«просто дати опис DSL в Claude» — це вирішення локальної задачі з написання синтаксису, а не системної проблеми

ты манипулируешь и подменяешь тезис. скормить описание DSL модели — это конкретный совет как решить конкретную задачу.

Щоб «дати опис», людина сама має спочатку пройти шлях пізнання.

так проходи. все познание осуществляется через абстракцию чужого опыта: учитель в школе, книга, stackoverflow. я учился программированию еще покупая книги на книжном рынке Петровка, потому что интернет был по диалапу только и никакого stackoverflow не было. эволюция инструментов только ускоряет процесс познания, поиск в интернете быстрее книги, а познание с AI ассистентом — быстрее чтения stackoverflow. повторюсь, ты занимаешься алармизмом, это путь не инженера, а истерички.

Ваша відповідь — це приклад змішування локальних інструментальних перемог із системними операційними ризиками. Давайте розберемо суть парадоксів, які ви, здається, пропустили:
1. Про методику та «доказовість». Вимагати від PMO&Delivery індивідуального дослідження індустріального рівня — це методологічний абсурд. Вибірка однієї компанії (N=1) нічого не доводить у масштабах індустрії. Проводити такий «експеримент-самогубство», ігноруючи вже наявні незалежні макро-дані на 211 млн рядків коду — це марнотратство. Якщо ви стверджуєте, що ШІ доказово корисний для бізнесу — покажіть дані на 10,000+ розробників із підтвердженим зниженням TCO та дефектів. Поки їх немає — обережність є єдиною раціональною стратегією.
2. Парадокс масштабу: чому «мануал» не рятує. Ви не зрозуміли суті парадоксу датасетів. Неможливо одній людині (чи навіть команді) нагенерувати достатньо унікального контенту, щоб модель могла на цьому вчитися. ШІ — це дзеркало, а не джерело. Коли ви даєте Claude мануал DSL, ви отримуєте синтаксис, але не створюєте нову ентропію знань. Якщо шлях пізнання делеговано моделі, а людина лише «підтверджує» вихід — нове знання (Ground Truth) не народжується. Ми просто споживаємо «інформаційний фастфуд», висушуючи паливний бак для майбутніх поколінь ЛЛМ.
3. Про унікальність та Model Collapse. «Вайбкодінг» — це шлях до інтелектуальної стерильності. Без людського досвіду подолання складності та унікальних помилок, ШІ замикається в петлі самоповторів. Це і є Model Collapse — перетворення коду на статистичне ехо мейнстриму минулого. Це не алармізм, а математична неминучість, яку зараз активно досліджують на arXiv, поки індустрія святкує ілюзорне прискорення.
Мій висновок — обережність. В інженерії безпека базується на аналізі ризиків, а не на вірі в те, що чергове оновлення моделі скасує закони системної динаміки.

Вимагати від PMO&Delivery індивідуального дослідження індустріального рівня — це методичний абсурд. Вибірка однієї компанії (N=1) нічого не доводить у масштабах індустрії. Проводити такий «експеримент-самогубство», ігноруючи вже наявні незалежні макро-дані на 211 млн рядків коду — це марнотратство. Якщо ви стверджуєте, що ШІ доказово корисний для бізнесу — покажіть дані на 10,000+ розробників із підтвердженим зниженням TCO та дефектів.

господи, Виталий, какие 10 тыс+ разрабов? у вас в компании 350 человек с уборщицей, только половина из них — программисты и более чем уверен, что минимум треть от этой половины — джуны, которых вы продаете по цене сеньора. у вас в кейс-стади — веб-аппликации и мобильные приложения, команды максимум до 10 человек. вы себя-то с ФААНГом не равняйте, задачи ваших проектов вполне релевантны тем, на которых сейчас западные небольшие команды получают рост эффективности за счет Клод Кода. а Вы — ПМО и Хед оф деливери — как та обезьянка, закрываете себе глаза, уши и только ждете исследований на 10+К разработчиков. ну смешно просто.

«Вайбкодінг» — це шлях до інтелектуальної стерильності.

продавать код джунов по ставке сеньоров — путь к интеллектуальной стерильности. только не надо говорить, что на вашей галере так не делают :)

Мій висновок — обережність.

ваш путь — пассивность. пока ваши конкуренты смотрят вперед, вы закапываетесь в arxiv и примеряете на себя Model Collapse и Парадокс масштаба. ту энергию, с которой вы пишете статьи, да в практическое русло...

Перехід від обговорення математичних моделей та системної динаміки до підрахунку моїх співробітників і закидів про «галери» — це, зазвичай, «білий прапор» у технічній дискусії. Коли закінчуються аргументи по суті, починаються спроби знецінити статус опонента.

По суті:

1. Масштаб не скасовує фізику. Закони ентропії коду та деградації систем однакові як для команди з 5 людей, так і для 5000. Якщо 10 людей генерують «субпраймовий» код через ШІ — це проблема 10 людей. Якщо індустрія робить це масово — це системний дефолт. Пошук «релевантності» за розміром компанії — це ігнорування суті ризику.

2. Де дані? Ви багато пишете про «ріст ефективності», але за весь час не навели жодної цифри щодо TCO, Defect Rate чи Maintainability на тривалому проміжку. «Вайб» — це не метрика, це настрій. Я ж оперую даними незалежних досліджень на мільйонах рядків коду, які показують зворотну картину.

3. Практика vs Теорія. Моя енергія йде на створення реальних протоколів безпеки (репо на GitHub), щоб мої команди та клієнти не отримали технічний борг, який неможливо обслужити. Це і є шлях інженера — оцінювати ризики до того, як вони стануть катастрофою.

Резюме: якщо у вас є щось, крім емоцій та припущень про мій штатний розклад — я готовий слухати. Якщо ні — пропоную завершити цей сеанс «професійного гадання» на успіх без цифр. Мій висновок залишається незмінним: обережність.

:) нет, это я просто ткнул пальцем в тот мыльный пузырь, который вы тут пытаетесь надуть. все данные взяты с сайта вашей компании.

Я вже описав вам — це з вашого боку банальна тактика атаки на опонента за відсутністю аргументів. І описав що за відсутністю конструктиву ця розмова завершена.

Ну... LLM потужний трансформер, тому я не бачу тут проблеми. Я обговорював створення нової мови програмування, в принципі все ОК.

Можна подивитися на Leela Zero, яка зі зворотнем зв’язком досягла великої майстерності у шахах, і, особливо, в го, коли люди просто переглянули концепції, почали грати нові дзьосекі та почали швидше прогресувати. Все нове складається зазвичай з всім відомих кроків. LLM може узагальнювати, переносити знання між доменами, ... Питання скоріше щоб швидко знаходити тупіки, маркувати варіант як хибний та пробувати новий. Як раз концепція рою це крок у потрібному напрямку.

з використанням специфічного DSL (domain specific language)

ну дай ты Claude Code описание этого DSL и он тебе через минуту будет генерировать валидный код по твоим требованиям.
устал уже, честно. видно, что ты чистый теоретик, застрял в своих стереотипах, апломбе, самоуверенности. сочувствую, что ж.

Ага, вірю, вірю.

Write JOLT transformer to convert this JSON
{
«items»: [{«id»: 1, «ref»: 100 }, {«id»: 2, «ref»: 100}, {«id»: 3, «ref»: 101} ],
«refs»: [{«id»: 100, «title»: «one»}, {«id»: 101, «title»: «two»}]
}
into this
{
«items»: [{«id»: 1, «ref»: 100, «title»: «one» }, {«id»: 2, «ref»: 100, «title»: «one»}, {«id»: 3, «ref»: 101, «title»: «two»} ]
}

Claude зробив вигляд, що він качечка та за допомогою JOLT неможливо зробити таке перетворення. Gemini та ChatGPT таки щось нагенерували, але воно невалідне, хоча й більше схоже на правду. Отже, на простому прикладі я показав, що все, що маловідоме та непопулярне буде призводити до неправильних рішень.

Додам. Взагалі нашим ШІ євангелістам все здається таким простим — це вражає. Тільки от є проблема — чомусь реальні дослідницькі групи, вчені та академіки з професорами про цю проблему наукові роботи пишуть «Knowledge Collapse in LLMs» (arXiv:2509.04796) та «Model Collapse Demystified» (arXiv:2402.07712). І це тільки 2 приклада — їх там більше і зʼявиться думаю ще більше — бо тема проблематична. Науковій спільноті — невідомо як проблему вирішити. А на доу всі все знають:)

лучше бы это научное сообщество чем-то нормальным занималось, а не хайпило в интеренете. от таких исследований никакого толка нет

Ну я тут з вами частково не згоден. Це світ теорій та абстракцій і звісно академічним колам тут теж потрібен свого роду піар. Але — вони для того щоб це реалізувати адресують цілком реальні і актуальні проблеми. Більше того — це ж те саме середовище яке і створило по суті всю необхідну «теорію» для появи ЛЛМ. Так і не секрет що і над прямою розробкою технології працювали ті сами реальні вчені в тому числі. Тобто без хайпу і піару в цьому світі — не обходиться. Але як на мене представники математичної академічною науки — потрібні люди і роблять вкрай корисні речі

Але — вони для того щоб це реалізувати адресують цілком реальні і актуальні проблеми

это не актуальная проблема уж кому как не им знать что текущий способ реализации ии никуда не ведет

Більше того — це ж те саме середовище яке і створило по суті всю необхідну «теорію» для появи ЛЛМ

и хоть кто-то жив еще из тех кто писал эту теорию? ей уж сто лет скоро. а в преемственность в науке не существует

Так і не секрет що і над прямою розробкою технології працювали ті сами реальні вчені в тому числі

не совсем понял о чем речь... вот эти современные модели типа гптчата делали без ученых, за каких-нибудь преподов-теоретиков соглашусь, но точно не ученые

Тобто без хайпу і піару в цьому світі — не обходиться. Але як на мене представники математичної академічною науки — потрібні люди і роблять вкрай корисні речі

ну вот Карпатый распиарился и что? был перспективный студент, но выбрал не науку в конечном счете

А тобто ви вважаєте не те що вчені — зло, а що саме ті хто в піар пішов — не вчені? Радикально. Не певен що згоден. Світ академій специфічний, там теж все є. Але я би так не спрощував — є різні історії та обставини.

не совсем так, одно дело когда это Тесла, Хокинг, Опенгеймер и т.п. а совсем другое когда пиарятся ноунеймы еще и через сомнительные темы

Ну слухайте — генії зʼявляються не так часто. Це ж одиниці. При цьому звичайні наукові робітники хоч і не генії і яких в сотні і тисячі раз більше — вкрай не дурні люди. І головне що воно все глибоко звʼязано — це своя екосистема. Геніям треба середовище де прорости. Наукова спільнота саме про це в тому числі. Та і освіта ж. Я персонально цей світ поважаю. Але так — там все як у звичайному житті — політика та перегони за посади і т.п. Тут без ілюзій. Звичайні ж люди теж

Уся доказова медицина базується на працях ноунеймів та метадослідженнях. Також мета приблизно така сама — прибрати суб’єктивну оцінку (я почав пити власну сечу, мені дуже домогло, гомеопатія рулить, треба тільки найти власного гомеопата, ...). Щоб робити це не треба супер знаннь, треба дизайн та методологія експерименту, який виключить суб’єктивне сприйняння, рівень студенту, якщо чесно. Взагалі, головне досягення науки XX сторіччя у тому, що людина дуже підвержена когнитивним викривленням, тому якщо хтось каже «от у мене був такий досвід», то це або щосбь тривіальне, але помилкове.

лучше... чем-то нормальным занималось, а не хайпило в интеренете

ага, хтоби міг подумати — ніша «хайпити в інтернетах» вже зайнята айтішниками...
краще чимось нормальним зайнялися, хочаб багами своїми чи tech debts якими-небудь, що невідомо для кого генерують)

Знаєте це я думаю продовження класичноі війни фізиків проти математиків, тільки в неї влетіли ще і програмісти. Та ще і в середині середовища програмістів — свої кастові війни теж є. Це було ще коли я студентом був. Навіть книжки були «Фізики жартують» та «Математики теж жартують» і т.п.. Ну це переважно було без агресії — але позиції у цих 2 каст були непримиренні.
Математики мали аргумент — фізика сама по собі наука вторинна, проста та примітивна. Більше того — використовує як інструмент математику, але часто вкрай в примітивній формі. А отже — це для тих хто не дотягнув до реальної науки.
Ну а у фізиків був свій — ми світ реальний вивчаємо, на наших роботах все кругом побудовано і саме фізика дала людству прогрес. А ваша математика, особливо найбільш складна та абстракції — це якісь не потрібні нікому «жвачки для розуму» які окрім роздумів 10-20 голів по всьому світу — нікому більше не потрібні. То ми іі вашу математику і використовуємо за призначенням — як лопату. Як інструмент.

Моє дитинство та юність пройшли частково за столом та в квартирах представників цих 2 таборів. І це цікавий досвід і спогади.

фізики проти математиків

а зараз ще багато зустрічається баталій-суперечок (принаймні в інтернет) на стику також й інших наук, як нп метафізики з фундаціями наук (включно з фізикою) та безпосередньо погляд фізиків, чи розгляд часу з точки зору фізиків та нейро-науковців

ага, хтоби міг подумати — ніша «хайпити в інтернетах» вже зайнята айтішниками...

айтишниками никакая ниша не занята и не будет, это просто инженерия. или это ты дизентерию от местного трампа подхватил про местных экспертов и это типа ирония?

это просто инженерия

прикольно, «інженерія хайпа», а то дехто задається питанням в якому сенсі айтішники інженери)

А на доу всі все знають:)

Коли ти знаєш мало, то тобі здається, що ти розумніший за всіх. ;) Таке собі DOU простих рішень...

Взагалі нашим ШІ євангелістам все здається таким простим — це вражає. Тільки от є проблема — чомусь реальні дослідницькі групи, вчені та академіки з професорами про цю проблему наукові роботи пишуть «Knowledge Collapse in LLMs»
Науковій спільноті — невідомо як проблему вирішити. А на доу всі все знають:)

Бо на доу пишуть практики. Це форум девів. Мені не треба думати як там працює двигун щоб бачити що авто їде.
А ви доводите що замість коней взяли авто і віз не їде. Тому коні це краще.

Або про науку. Був в мене на 4 курсі проект де дуже кучерявими рівняннями з похідними розраховували траекторію перехоплення ракети коли дані приходять з запізненням.
Проект я здав, все порахував, але зробив ще демо з анімацією (Wolfram Mathematica).
Викладачі дивувались як таке складне рівняння вийшло розв’язати в тій математиці ще й з анімацією. А я це зробив простим циклом і майже лінійним рівнянням, вважаючи що час дискретний а не неперервний (типу дані про ракету приходять кожну секунду).

Тому наука наукою, а практика рішає

Бо на доу пишуть практики. Це форум девів

это не так

Бо на доу пишуть практики. Це форум девів.

з мого досвіду ДОУ — пишуть в основному молоді пацанчики.

і може 10, 20 %% досвідчених, і з ролями вище мідла.

Мені не треба думати як там працює двигун щоб бачити що авто їде.

ну це так, їжа росте в холодильнику, а гроші генеруються з татового гаманця — то навіщо думати?

вполне адекватный критерий. популярное — значит, накоплен большой опыт, развитая экосистема, фиксятся баги

Главное, что конечным заказчикам важнее: маловероятно, что популярное и уже много где работающее «умрёт» или окажется тупиковой веткой и придётся всё переписывать с нуля.

Може тому що я розумію, як ця технологія працює під капотом та що від неї слід очікувати, а чого ні?

Лол, що ж ти тоді не в OpenAPI заробляєш мільони на рік?

Чи твоє розуміння це «LLM це T9 на стероїдах який вгадує текст»?

Лол, що ж ти тоді не в OpenAPI заробляєш мільони на рік?

Тому що в мене є інші проекти, які дадуть той самий або кращий вихлоп, але без стресу.

Чи твоє розуміння це «LLM це T9 на стероїдах який вгадує текст»?

Ніт. Але це й не чарівна хрінь яка вміє думати. Не вміє.

Статю не читав. Лише по заголовку то є бред.

Навіть перехід від клод опус 4.5 на 4.6 показує вражаючи результати(це десь пів року). Пишу розподілений додаток просто щоб повчитись на своєму пет проджекту, більш про біг дата та архітектуру.

Великі обьеми данних (десь близько террабайту), розподілена архітектура, ШІ сервіси на моєму залізі, лінукс сервери...І купа купа інших речей. Сам би я таке писав та рісьорчів як робити, мінімум рік фулл тайм, це ж я зробив десь за останній рік по вихідних десь 2-4 години на тиждень.

Як лід\архітект\техменеджер в продукті (ентерпрайз фінтех), я дуже прекрасно в курсі про усі ці поінти про сесуріті, тех борг, ціну помилики та інше, я в айті вже 15 років.

Ви можете стільки завгодно роказувати за єнетрерпайзні проєкти і галюцинації але те що ШІ знесуть нахрін звичайне бачення будування не просто додатків на рівні розробки а і на рівні юай та інших речей, че факт.

Заперечувати немає сенсу. Єдине що варто робити, лупитю цю скалу самому. Справжніх інженерів воно не замінить але наприклад той самий асемблер вже давно ніхто не чіпає окрім вузько спеціалізованих спеціалістів.

Гадаю десь через 5-7 років ми не віпізнаємо розробку як ми звикли до цього. Так само як колись клауди були фігнею із шаленою латенсі, так само як колись деплоїли руками файли через файзіллу...

За останні як мін 15 років айті навіть без ШІ воно неймовірно змінилось через неймовірну кількість автоматизації звичайних речей. І до цього воно змінювалось, просто не такими темпами.

Так само із ШІ, скоро ідіоти що бездумно комітять усе лайно не думаючи що саме вони комітять, зрозуміють що треба думати перед тим як опускти лапи на клаву, і потім почнеться впровадежння інженерних стадартів та процесів і все піде своїм шляхом.
Так само десь 10-15 років тому усі пхали монгу там де вона не потрібна а потім скиглили що вона гамно, як і купу інших технології.

Звісно, що у нас немає експериментальних даних про використання Claude Opus 4.6 Але... кожного разу коли виходили нові версії, було дуже багато постів про значне покращення, а потім по факту цього ніхто не бачив. Тому подивимося...

Але чому не замінить справжніх інженерів? Яку саме роль не може виконувати LLM?

потім по факту цього ніхто не бачив

не надо тут за всех. кто пользуется — тот разницу видит. а кто тратит время на написание портянок в полтора десятка экранов, тому конечно, некогда пользоваться.

потому да, практика — по прежнему критерий истины. а так да, статья — бред.

не надо тут за всех. кто пользуется — тот разницу видит.

Так, це має назву AI Productivity Paradox: ті хто користується LLM бачуть різницю, ті хто вимірює теж бачать різницю, але ці цифри мають протилежний знак.

Субʼєктивна точка зору, а саме це я бачу за словами «хто користується той баче» це дно наукової доказованості.

Чистий приріст продуктивності (зважена медіана): ~9.0% — усереднюючи медіанні Commit Counts (+6.1%) та значущі зміни коду (Diff Delta +14.1%), ми отримуємо чистий приріст приблизно 9-10%.

там буквально обезьян с попугаями усредняют лишь бы циферки получить

между такими аналитиками и открытой табой с моими пулл реквестами как будто я больше доверяю табе

одно дело если бы речь шла о том, чтобы проверить метриками свои же наблюдения, но утверждать что «аналитики правы потому что они там что-то анализировали» — это где-то рядом с дном этой доказуемости.

записать все возражения, мол эта ваша теория никак не соотносится с наблюдаемой практикой, в «да это AI Productivity Paradox» — это тоже не так далеко от того дна.
этот парадокс, для которого я, кстати, ни разу не видел логического обоснования вместо «ну аналитики что-то там считали» — это всего-лишь причина присмотреться к наблюдениям внимательнее, но никак не причина просто взять их и игнорировать

статья как раз про то, что кодерки и не знали никогда. и не понимали.
и теперь радостно генерят хню, с энтузиазмом — а я теперь на ИИ перешел!

Навіщо мені єксперементальні данні, коли я йому пишу підніми кафка консьюмер, запусти процес, прочітай логи, перевіртчи все відпрацювало без багі, потім сходи в еластік і подивись чи вірний мапінг данних, він не просто пише скрипти він чудово розуміє які поля зберігаютья, говорить мені про те що іде перезатирання полів при партіал апдейт, знайшов проблему із рейс кондішен бо в мене тоді був запущений сервак на дуже старому компі....Недавно попросив прогнати декілька простих сервісів із разними параметрами, він мовчки написав скріт на павершел запустив, почекав поки воно все десь за пів години відпрацює і вив мені таблицю із результатами, вказав які параметри можна змінити щоб покращіти...я весь це час займався своїми справами. Можете страдати хуйнею тут стільки щавгодно але сьогодняшній ШІ неймовірно потужний. Я коли навіть запускаю китайскі моделі локально я бачу чк вони банально чудово можуть проаналізувати фото за сенсом, розкласти обьекти, колори, людей пози та як люди взаємодіють, він навіть прочитав тескт вірно на одежі і по фотці зрозумів що на фото батько та дитина і святкують перше різдво бо так написано на одежі.

Я правда не розумію якою хуйнею тут займаються люди що доводять що це фігня, коли навіть на домашньому компі воно вже робить вражаючі речі.

Зараз вже ніхто не пише копілятори, асемблер...Почитайте дяду боба про його перші робочі місця коли він писав код на перфокартах і дебажив очіма код на папері...Він доречі інденером так і залишився бо не доводив що компілятори та гарбедж коллектори сповільнюють програмістів.

Ну так, вакцини вбивають, почни вірити в бога, він з тобою заговорить, а від онкології допомагає бураковий сік.

Почитайте дяду боба

Макулатуру не читаю. Тут я більше на боці Кайсі Мураторі, Дена Норта, Джона Оустерхаута, які вважають його шоуменом. Так, успішний шоумен.

Ця макулатура залишалась інженером із часів перфокарт а до сучасної розробки.

Ну так, вакцини вбивають, почни вірити в бога, він з тобою заговорить, а від онкології допомагає бураковий сік.

Це ти таку маячну пишеш, а от загадний приклад в моєму пості — ШІ аналізує фото і дуже гарно і лише на звичайній 5090 відеокарті і робить це дуже гарно. Це технологія із неймовірним потенціалом котрий ми лише зараз починаємо усвідомлювати.

Вобщім далі вір що земля пласка і що книжки то зло і все що треба то ходити в церкву та слухати батюшку.

Щодо ШІ та аналізу фото для медицини — є ж інше ШІ, за нього навіть Нобелівку дали 2 роки тому з думками, що ось воно, зараз будемо генерувати вакцини без дорогих дослідів. Багато ти почув нових вакцин за два роки? Виявилося, що ні, не здатне.

то ші лише якусь потенційну речовину пропонує для лікування. всі ці дорогі перевірки нікуди не зникають

Там куди більше проблем, які навіть таке вузькоспеціалізоване ШІ не здатне вирішити

Я не лікую рак, є 100500 інженерних задач де звичайний аналіз фото дуже корисний. Те що ШІ не вилікував рак не говорить що він не потрібний. Ти також рак не лікуєш.

Взяти одну задачу та екстраполювати її рішення на решту — ще той рівень експертизи.

Ну так це ж не я хочу щоб ллм лікувала рак чи робила вакцини.

AlphaFold не LLM. Для аналізу картинок LLM теж не потрібен. Однак саме LLM вонабі-євангелісти ШІ (та інфоцигани) вважають срібною кулею

Є VLM для аналізу зображень, звісно що таким як ти нічого не треба, як собака стара вивчала один трюк в цирку і досить ))))

Почитай як китай вже викорситовує ці моделі для автоматизації в промисловості та портах.

Єнівей я бачу що тобі та подібним пофіг на все це, аби круди місити та доказувати як ви ебть кпть специ незамінні :-)

Чому? Воно ж он як вправно картинки розпізнає!

Почитай як китай вже викорситовує ці моделі для автоматизації в промисловості та портах. Але ти так само як і жук у сатдії заперчення бо боїся що твої старі трюки не будуть потрібні або здешевіють.

Які саме моделі? Як саме використовує? Давай деталі, не треба маркетингового булшиту.

До чого тут маркетинг? Деталей може і не буде бо це була не технічна стаття а аналітична. Китайскі моделі це квен жлм діпсік. китай зараз багато вкладається в ші. це факт.
Канал Космос політки переклад статті www.wsj.com/...​na-manufacturing-89ae1b42

t.me/politikosmos/4870
t.me/politikosmos/4871
t.me/politikosmos/4872
t.me/politikosmos/4873

Посилання з інфопомийок на кшталт єлєграма не приймаю.

Це переклад із волл стріт джоррнал. Сам ти помийка, канал нормальний Космос політики. Ти вкотре газифікува калюжу, іксперд.

Вчись читати уважно написані тексти. Цілком, не частинами. Покажи мені хоч одне слово, де я називав саме WSJ інфопомийкою? Я навіть приклад навів після фрази «на кшталт», щоб було явно зрозуміло про що йшла мова.

Без технічних деталей важко вести предметну розмову. А в статті їх дуже мало

Вибачте, але я нічого з вашого тексту не зрозумів, окрім «я 15 років в айті», «я лід-менеджер у Десь», «сам би писав та не написав», «знесе нахрін», «статтю не читав, але це брєд». Автор цієї статті 20 років в айті. Будемо далі мірятися хто довше?

Як іронічно, що активний користувач ші не читав статтю. Попросіть ші скласти вам короткий її переказ

знаешь, для того, чтобы эффективно работать с LLM нужно не забивать контекст мусором. вот это правило справедливо не только для LLM.

А, і тепер ще й кичаться тим, що не читають. Це прям пік ллм культури

от цікаво, швидше закінчиться вода для охолодження серверів з АІ, чи електрика, чи виконання АІ коду на хмарних сервісах буде настільки дороге, що в треті країни світу будуть і далі намагатися аутсорсити вакансії на кштал «потрібен експерт низькорівневого Rust із досвідом низькорівнвої оптимізації системного програмування на рівні SIMD інструкцій Hadoopa бо приходе дупа»

Статю не читав. Лише по заголовку то є бред.

я теж дуже скептично сприйняв заголовок, але почав читати.
вважаю стаття варта щоб прочитати хоча-б половину, далі вже як духу вистачить.

это все еще стадия отрицания или уже стадия торга?

Так не користуйтесь — ринок розсудить. Що ви думаєте про кейс с заявою Jaana Dogan, Google’s Principal Engineer: “I’m not joking and this isn’t funny. We have been trying to build distributed agent orchestrators at Google since last year. There are various options, not everyone is aligned... I gave Claude Code a description of the problem, it generated what we built last year in an hour.” Якось складно звинуватити її в некомпетенції, або заангажованості — оскільки вона хвалить майже конкурентний продукт. Що на рахунок Linus Torvalds що почав використовувати Google’s Antigravity? Ви может поставити під сумнів його оцінку?

Що на рахунок Linus Torvalds що почав використовувати Google’s Antigravity? Ви может поставити під сумнів його оцінку?

Але мова не йде про Linux Kernel. Мова йде про Python, який він ніколи в житті не чіпав. Для вирішення якоїсь музичної таски. Про це в статті, доречі сказано:

Ми не заперечуємо, що AI прискорює ізольовані завдання кодування, особливо для менш досвідчених розробників. Докази цього надійні. Peng et al. (2023) провели рандомізоване контрольоване дослідження (n = 196), яке показало прискорення на 55.8% на greenfield-завданнях.

А це типовий greenfield.

Linusа додав вкінці як додатковий аргумент — все ж таки людина з високою планкою стандартів. Що на рахунок основного аргумента — думка розробників рівня Principal Engineer Google про конкурентний продукт.

Він так написав одну фічу для візуалізації якихось параметрів для обробки звуку. Тобто, другорядної фічі у своєму хобі-проєкті. Ці параметри він добре розуміє і протестувати їх візуалізацію (лише!) не дуже складно. Саму логіку обробки Лінус робив власноруч, не вайбкодив.

І це дуже важливі деталі. Вони не заперечують користь від «ШІ», але дозволяють дивитися реалістічніше. Бо ми чудово розуміємо, що під заголовком «Лінус вайбкодив» масово робиться висновок про те, що він вайбкодив навколо того, що зробило його відомим — ядро Linux, а виявляється, це зовсім не так. Чи варто робити як Лінус? Я певен, що так. Але лише враховуючи весь контекст історії та відмічаючи для себе, де Лінус досі працює «руками».

Ви может поставити під сумнів його оцінку?

а audio-noise-effects з точки зору вайб-промпт-інжинірів зацінили як щось типу:

a small step for Linus, a grand leap in ballet?

Jaana Dogan, Google’s Principal Engineer: «I’m not joking and this isn’t funny.
I gave Claude Code a description of the problem, it generated what we built last year in an hour.»

це як найняти бригаду будівельників за прайсом у три рази вишче ніж медіана на ринку, а вони будуть цілий рік морочити голову і робити те, що вона потім сама зробить за годину по відюшці з ютубу. і так, це funny, я не знаю чому ця пані так драматизує

Якщо прочитати весь допис разом з наступними, де вона давала більше деталей, то виявиться, що історія зовсім інша і там взагалі не йдеться про те, клод код зробив за годину те, що команда за рік. Розбирати можна, починаючи з того, як легко «last year» переклали як «1 рік», адже вони могли почати у січні. Далі вона каже, що насправді дала клоду список ідей, над якими команда увесь цей час працювала. І це дуже важлива деталь, бо клод спирався на результати роботи команди, яка виробляла ці ідеї... since last year! І що вона спростила опис проблеми, що також звузило контекст, особливо разом зі списком ідей:

she created a simplified version of the problem using existing ideas to see how Claude Code would perform

І ми можемо вважати це гарним результатом, бо чому б ні? Але я закликаю дивитися реалістично, не додумувати те, чого насправді й близько не відбувалося.

Наприклад, всі обирають не бачити цієї її цитати:

Dogan said the result was not perfect and still needs improvement

Бо у нас дуже чорно-біла оцінка зараз популярна. Наче можна бути лише у повному захваті від «ШІ» чи бути відвертим луддитом. Оцінка «ШІ» для айті зовсім не дихотомічна, це лише шкодить оцінці технології та її застосуванню.

Ми увійшли в епоху Спагетті 2.0.
Олди зрозуміють.

Спагетті 2.0.

3.0, ООП це 2.0

goto спагетті, ООП спагетті, LLM спагетті

а потім буде як після обфускаторів типу аспротекту..

Стаття гарна, нарешті в нас є свій Ед Зітрон. Але дозвольте поцікавитися, хто такий цей таємничий «Борд»? Це персоніфікація ради директорів? «Ригористичний» в українській означає дещо інше і має негативне значення наскільки мені відомо, якщо ж це калька з «rigorous», то може краще так і казати? Що таке «лонгітьюдний»? Як на мене це досить гарна ілюстрація деяких тез самої статті.

Дякую за порівняння з Едом Зітроном — це висока планка! І окрема подяка за мовний рев’ю. Текст має бути зрозумілим людям, а не лише «агентам». :)
Щодо термінів:
1. Ригористичний — погоджуюсь, це калька з rigorous. В українській має відтінок «надмірної суворості», тож заміню на «ретельний» або «ґрунтовний».
2. Лонгітьюдний — специфічний академічний термін. Справді перевантажує текст, виправлю на «тривале дослідження».
3. Борд — це «Рада директорів», мій щоденний професійний жаргонізм. Повернуся до класики.
Дякую за влучні зауваження. Внесу правки в статтю, щоб зробити їх «людськішими».

Ще ви не додали момент про cognitive degradation. Коли я сідаю писати код руками після довгої перерви, я відчуваю що навик просів, та мені треба деякий час увійти у форму. Я не уявляю як просидіти за промтінгом та вайб кодінгом пів року і не втратити наприклад навички дебагу, коли замість «Клод, скажи що це?» на кожен чих сідаєш та думаєш своєю макітрою про «що це», «як», «чому» та «що робити» та «яка це предметна область»?

Ви підсвітили вкрай болючу тему — назвемо це «ментальним техборгом».
Я свідомо залишив це за межами поточної статті, і ось чому:
• Межа ресерчу: Виміряти просідання «синтаксичного м’яза» чи навичок дебагу значно складніше, ніж порахувати Code Churn чи Cycle Time. Це потребує окремого довготривалого дослідження.
• «Продаж» ідеї С-level: На жаль, для бізнесу «просідання макітри» — це занадто ефемерно. Керівництво зазвичай реагує на ROI, TCO та Time-to-Market. Я фокусувався на «хард-даті», щоб аргументи мали вагу в бордрумах, де мова йде про гроші, а не про нейронні зв’язки розробників.
• Приземленість: Моя мета — зафіксувати шкоду, яка наноситься системі тут і зараз на рівні процесів.
Але ви абсолютно праві: через пів року вайб-кодінгу ми ризикуємо отримати ситуацію, коли сеньйор без Клода не зможе знайти витік пам’яті. Це «тиха катастрофа» людського капіталу.

Сеньйор без Клода не зможе знайти витік пам’яті

— і це вже не сеньор. буде, а пропт інженер.

Коли я сідаю писати код руками після довгої перерви, я відчуваю що навик просів

Є таке, мені вже навіть if дописати лінь)

Результат: З використанням frontier AI-асистентів (Cursor Pro з Claude 3.5/3.7)
RCT з 246 завданнями, 16 розробниками

лол

Проблема всіх цих «досліджень»:
1. Вони застарілі, на основі старих тулзів не мають ніякого відношення до сучасних
2. Вони оцінюють avargage Joe, якому дали курсор claude code, і через місяць міряють як виросла його продуктивність.

Хай промірюють продуктивність окремих розробників, хто мінімум пів року активно програмить з умовним claude code, у якого кілька десятків команд і скілів налаштовано і ворклоу виставлений.

Хай промірюють продуктивність окремих розробників, хто мінімум пів року активно програмить з умовним claude code, у якого кілька десятків команд і скілів налаштовано і ворклоу виставлений.

«А ви неправильних не оцінюйте, оцінюйте правильних!»

Йде четвертий рік активного ШІ хайпу, а євенгелісти все ще розповідають про якихось міфічних уберспеціалістів які в одне рило вайбкодять за цілий департамент, а всі хто в це не вірять — луддити-технофоби.

Та вам вже неодноразово приклади приводили, но ви починаєте включати іншого дурачка: «та хіба то задачі? (самі при цьому виконують такі ж задачі) хай на реальних задачах, на реальних проектах так зроблять» (ніби всі тут на перфокатах андроїдний колайдер розробляють)

Та вам вже неодноразово приклади приводили,

наприклад moltbook, де ти епічно злився, коли виявилось що це решето і ненужно.

Ну або взяти твій смішний github...

що це решето

Так ніхто і не привів приклади, цитують лише юзера, який підключив дешеву китайську модель (модель яку деякі тут рахують вбивцею опенаі і антропіка), яка в принципі не може протистояти промт інжекшн атакам, і потім дивувався видаленим імейлам.

Ну а moltbook робить те, що від нього вимагається, він лише міст між юзером, тулзами і агентами.

ненужно

Кількість юзерів і зірочок на гітхабі з тобою не згодні.

Навіщо ви так «спеціаліста з 20-річним досвідом» який як джунік повівся на золотий молоток (ага повірив) розносите, це ж вбиває віру у золоті молотки 😆

Які є, вже хліб. В будь якому разі ви інтерпретуєте «немає даних» на свою користь.

А по факту про нові тулзи та досвід нам кажуть з самого початку. І в 2023, і в 2024, і в 2025 і зараз відповідь одна й та сама: старі тулзи та недосвічені розробники.

Вони застарілі, на основі старих тулзів не мають ніякого відношення до сучасних

комивояжер в дешевом костюме и лучезарной улыбкой постучался в вашу дверь, чтобы продать вам вечную иглу для примуса.

принципиальные ограничения технологии были видны с самого начала, с осени 22-го года.
с той поры влили логарифмически несоразмерную кучу денег, чтобы получить прирост в полпроцента, который надо искать под лупой. а безмозглый рандомный генератор токенов как стабильно выдавал полную хрень, так и продолжает множить энтропию этого мира.

Вони оцінюють avargage Joe, якому дали курсор claude code, і через місяць міряють як виросла його продуктивність.

Доречі, а чи не нейроєвангелісти розповідали що ШІ це така емейзінг технологія що кожна собака може собі промтити що завгодно? Що програмісти будуть не потрібні і що продукт менеджмент сам зможе собі вайбкодити що захоче без отих задротів? А тут виявляється що працювати з ШІ — це прям особливий інженерний скіл, який ще не кожному average Joe під силу.
То де тут революція і граунд брейкінг емейзінг?

працювати з ШІ — це прям особливий інженерний скіл, який ще не кожному average Joe під силу.

это совершенно так. мой прогноз, что количество работы увеличится, но да, умение работать с AI assistant — это будет просто is a must и учиться профессии придется по серьезному. сис дизайн, аналитику никто не отменяет.

е работать с AI assistant —

це складніше чим освоїти IDE?

Вкрай влучний аргумент:) але тепер у них інша пісня — треба розуміти магію!

В треді все ще не висрався дональд трамп, це дивно. Мабуть закидує статтю в десяток різних моделей з реквестом «скажи автору що він неправий» і порівнює відповіді. А це, як ми знаємо, дуже довгий та кропіткий процес.

Насправді я буду тільки радий такому «Red Teaming». Я не луддит і не заперечую користь ШІ на індивідуальному рівні, особливо коли весь твій SDLC — це ти сам. Проблема, яку я препарую в статті, — це саме системний ефект у великих командах.
Я й сам активно використовую ШІ: зараз це ціла низка агентів, які допомагають мені з аналітикою, включно з «атакою» моїх власних гіпотез. Такий собі інтелектуальний спаринг-партнер, щоб перевірити висновки на міцність.
Тому, якщо хтось прийде і знайде суттєві прогалини в моїй логіці чи аргументації — це буде круто. В інженерії перемагає не той, хто найголосніше кричить, а чия модель витримує зіткнення з реальністю. Чекаємо на результати порівняння моделей! 😉

В інженерії перемагає не той, хто найголосніше кричить, а чия модель витримує зіткнення з реальністю.

Не правда!!!

:) теж згоден. Давайте перефразую — так в ідеалі

8000+ переглядів, 230+ коментарів

а лайків?

Сиджу на доу з 18 року, за цей час лайкнув може 3-5 статей, бо кнопка лайку крихітна і занадто близько до секції жирнючих коментарів

Дослідження 25-го року справді показували що AI не підвищує продуктивність і це всім дуже зайшло, особливо менеджменту.

Проблема в тому, що кінець 2025-го (реліз Opus 4.5 і конкурентів) став якраз тою самою переломною точкою.
У нас 26-ий рік несеться з такою швидкістю, що менеджменту вже двічі довелось переглядати плани на цей рік.

Субєктивно, це перший рік, коли в програмісти почали втрачати роботу саме через ріст продуктивності від AI.

Цій мантрі про «ось-ось вийде нова модель і все змінить» уже понад три роки. Спочатку чекали на GPT-4, потім на пам’ять, потім на RAG, тепер на Opus 4.5. Я погоджуюся: технологічний прогрес вражає. Але моє дослідження не про інтелект моделей, а про системну надійність SDLC.
Проблема в тому, що навіть «розумніша» модель не вирішує фундаментальну асиметрію: ШІ генерує код миттєво, а людина рев’юїть його на людській швидкості.
Навіть якщо Опус 4.5 пише код «краще», він все одно генерує його в промислових обсягах. А ми бачимо дані: +131% обсягу коду при стагнації реальної швидкості доставки фіч. Це і є пастка: ми плутаємо «швидкість друку» з «продуктивністю».
Щодо звільнень через «ріст продуктивності» — це класична помилка вижившого. Скорочення штату на фоні впровадження ШІ часто є не результатом росту ефективності, а кредитом під майбутнє. Компанії економлять на P&L сьогодні, але накопичують технічний борг через деградацію кодової бази, яка проявиться через 12-18 місяців. І вони роблять велику помилку скорочуючи штат і не маючи індустріальної хард дати про ефективність ШІ. Більшість отримають від цього тільки збитки і нічого іншого. Чому? Якщо коротко — бо це поганий план трансформації, не працюючий. Детальніше тут про цю стратегію і чому вона те руйнівна для організації яка іі застосовує — dou.ua/forums/topic/57244 . Звісно якщо взагалі дійсно є мета — перейти на ШІ. Бо часто це просто привід для с-левелу позбавитись збиткових проектів під прикриттям «хайпу» і ховаючи свої менеджерські помилки.
Я повірю в «переломну точку» не тоді, коли вийде нова модель, а коли незалежні дослідження зафіксують зниження вартості підтримки (TCO) та зменшення дефектів у реальних Enterprise-системах. Поки що статистика каже про зворотне. До того часу — це не інженерія, а «vibe coding» під тиском маркетингу.

коли незалежні дослідження зафіксують зниження вартості підтримки (TCO) та зменшення дефектів у реальних Enterprise-системах. Поки що статистика каже про зворотне. До того часу — це не інженерія, а «vibe coding» під тиском маркетингу.

Існують не лише ентерпрайзи.
І погіршення ентерпрайзного коду може нарешті відкрити ринок меншим гравцям.

Згоден, що світ IT не обмежується лише ентерпрайзом, і малі гравці дійсно мають перевагу в гнучкості. Але я б не був таким оптимістичним щодо «відкриття ринку» через деградацію великих систем.
Якщо ми подивимось на IT як на екосистему, то побачимо кілька критичних моментів:
1. Системний ризик: Ентерпрайз — це фундамент попиту та ліквідності на ринку. Якщо цей фундамент почне серйозно «просідати» через технічний дефолт, це не створить вакуум для нових гравців, а скоріше спричинить кризу довіри до всієї індустрії. Коли падають гіганти (згадайте фінансову кризу 2008-го), малий бізнес не розквітає, він зазвичай «випаровується» першим через брак ресурсів.
2. Хто платить за банкет? Глобальні кризи (а деградація кодових баз на рівні індустрії — це саме вона) б’ють по середньому та малому бізнесу найболючіше. У них немає «подушки безпеки», щоб пережити період, коли вартість підтримки ПЗ раптово злетить.
3. Стратегія «пилососа»: Гіганти мають величезний капітал. У гіршому випадку вони просто виживуть за рахунок маси, а в кращому — за безцінь скуплять ті самі молоді та перспективні бізнеси, які змогли побудувати щось чисте та ефективне в цьому хаосі.
Тому погіршення ситуації в ентерпрайзі — це не шанс для малих, це ризик для всієї харчової нитки. Нові ніші з’являться (наприклад, сервіси з «де-аїзації» та очищення коду), але загальний баланс навряд чи зміститься на користь менших гравців. Скоріше ми побачимо ще більшу консолідацію ринку навколо тих, хто має гроші, щоб виправити власні помилки.

Коли падають гіганти (згадайте фінансову кризу 2008-го), малий бізнес не розквітає, він зазвичай «випаровується» першим через брак ресурсів.

Якщо люди мають до кого йти. Якщо усі ентерпрайзи загинаються — то відбувається демонополізація чи, як в нас кажуть, деолігархізація. Де зараз Ксерокс?

Хто платить за банкет? Глобальні кризи (а деградація кодових баз на рівні індустрії — це саме вона) б’ють по середньому та малому бізнесу найболючіше. У них немає «подушки безпеки», щоб пережити період, коли вартість підтримки ПЗ раптово злетить.

А чому вартість підтримки ПЗ малого бізнесу має злетіти, якщо в них:
— менше технічного боргу
— не критичний софт

Гіганти мають величезний капітал. У гіршому випадку вони просто виживуть за рахунок маси, а в кращому — за безцінь скуплять ті самі молоді та перспективні бізнеси, які змогли побудувати щось чисте та ефективне в цьому хаосі.

Якщо кодова база достатньо отруїться, то гіганти зупиняться, а стартапи підуть далі. Згадайте як Мікрософт не купив Гугл.

Мені здається, ми по-різному трактуємо термін «Enterprise». Це не лише Google чи Microsoft. Це сотні тисяч компаній (від 500 до 5 000+ працівників), які роками працюють над єдиною кодовою базою: банки, страхові гіганти, медичні системи. Вони часто невидимі, але саме вони є головними клієнтами для всього ринку IT-послуг.
Ось чому я не поділяю ваш оптимізм:
1. Хто платить за банкет? Коли умовний банк середньої руки отримує «отруєну» ШІ-кодом систему, вартість її підтримки злітає не через складність софту самого банку, а через ризики та дефіцит сеньйорів, здатних це розгрібати. Якщо у «Paymasters» закінчуються гроші на інновації, бо все йде на «гасіння пожеж» у легасі, бюджет для стартапів та аутсорсу зникає першим.
2. Історія поглинань. Кейс із Google — це радше помилка Microsoft, ніж правило. Згадайте, що сталося з Nokia чи BlackBerry: вони не просто «поступилися місцем», вони були розібрані на частини або поглинуті тими ж гігантами. Гіганти мають «інерцію капіталу». У кризі 2008-го сотні локальних банків зникли, а великі стали ще більшими (JP Morgan, Goldman Sachs), просто скупивши активи тих, хто падав.
3. Ефект масштабу. Коли кодова база отруюється, стартап може просто «згоріти», бо в нього немає грошей на повний перепис системи. Гігант же може виділити $100M на «санітарну чистку» і жити далі.
Приклади для контексту:
• Xerox, який ви згадали, не впав — він став нішевим гравцем, а його місце зайняли інші гіганти (Canon, HP), а не розсип малих бізнесів.
• Коли впав Lehman Brothers, він не «відкрив ринок», він ледь не зупинив світову економіку.
Мій поінт у тому, що деградація коду в Enterprise — це не «деолігархізація», а системне забруднення середовища, де дихати стає важко всім: і великим, і малим. Тільки у великих є кисневі маски (капітал), а у малих — ні.

Це сотні тисяч компаній (від 500 до 5 000+ працівників), які роками працюють над єдиною кодовою базою: банки, страхові гіганти, медичні системи.

Так, і вони тримають високий поріг входження до своєї галузі, створюючи олігополію. Якщо вони посиплються — їх місце займе дрібний та середній бізнес. Приклад — банки та телеком в Україні та Європі. В Європі воно старше та зарегульоване, в результаті в Україні набагато кращий був рівень та якість послуг за нижчими цінами — саме через свіжість бізнесів та конкуренцію.

Хто платить за банкет?

Великий старий бізнес, що тримає олігополії на ринку, і заважає розвиватися новим дрібнішим конторам.

Згадайте, що сталося з Nokia чи BlackBerry: вони не просто «поступилися місцем», вони були розібрані на частини або поглинуті тими ж гігантами.

І в результаті лідують китайські нонейм телефони!

Коли кодова база отруюється, стартап може просто «згоріти», бо в нього немає грошей на повний перепис системи.

В нього нема легасі бази, поведінку котрої потрібно підтримувати. Те, що є, має суттєво меншу складність, і легше модифікується.

що деградація коду в Enterprise — це не «деолігархізація», а системне забруднення середовища, де дихати стає важко всім: і великим, і малим. Тільки у великих є кисневі маски (капітал), а у малих — ні.

Ви самі писали, що ШІ допомагає стартапам швидко перевіряти їх ідеї — себто, економить їх гроші.

Ви навели чудовий приклад з українським фінтехом, але він ілюструє якраз інтелектуальну перевагу, а не просто «відсутність легасі». Наші банки стали кращими за європейські, бо вклали величезний людський капітал у створення досконалих систем. Якби вони будували свій core на «vibe-коді» від ШІ без архітектурного контролю, ми б отримали не Monobank, а купу багів у гарній обгортці.
Давайте розберемо ваші контраргументи:
1. Про «молодий код» стартапів: У світі ШІ стартап може отримати «миттєве легасі». Якщо джун-фаундер за 3 місяці «напромптив» систему, когнітивна складність якої на 39% вища за норму, цей стартап помре не від конкуренції, а від власної ваги. Він не зможе змінити бізнес-логіку, бо ніхто не розуміє, як працює те, що нагенерував ШІ. Це «технічний рак» на стадії ембріона.
2. Про Nokia та китайські телефони: Nokia вбили не «нонейми», а Apple та Google — нові гіганти з принципово іншою інженерною культурою. Китайські нонейми з’явилися лише тоді, коли технологія стала комодіті (товаром широкого вжитку). Але софт — це не товар, це живий організм.
3. Про економію на PoC: Так, ШІ економить гроші на перевірку ідей. Але бізнес — це не PoC. Бізнес — це sustenance (підтримка). Економія 10% на старті, яка призводить до росту TCO на 100% через рік — це найшвидший шлях до спалювання інвесторських грошей.
Мій висновок: Демонополізація — це добре. Але якщо на зміну «олігархам з кисневими масками» прийдуть стартапи, що дихають «токсичним смогом» ШІ-коду, вони просто загинуть швидше.

Наші банки стали кращими за європейські, бо вклали величезний людський капітал у створення досконалих систем.

Ні, вони стали кращими за декаду до монобанка — бо був вільний вхід на банківський ринок, котрий дозволив конкуренцію. А конкуренція призвела до покращення послуг.

Якщо джун-фаундер за 3 місяці «напромптив» систему, когнітивна складність якої на 39% вища за норму, цей стартап помре не від конкуренції, а від власної ваги.

Перепишуть ще за 3 місяці. Бо 100 KLoC це не 10 MLoC. І бо вони розуміють, що роблять — а в легасі вже ніхто нічого не розуміє (ОраклДБ).

І 39% — то є фігня, вибачте. Котра ніяк не перевершить різницю на порядки в розмірі кодової бази.

Він не зможе змінити бізнес-логіку, бо ніхто не розуміє, як працює те, що нагенерував ШІ.

Зможе, бо на рівні 100 KLoC це робиться методом наукового тика — бо там ще недостатньо костилів, котрі відусюди вивалюються.

Китайські нонейми з’явилися лише тоді, коли технологія стала комодіті (товаром широкого вжитку). Але софт — це не товар, це живий організм.

Так, і старий організм має звільнити місце для нових, більш гнучких та різноманітних.

Економія 10% на старті, яка призводить до росту TCO на 100% через рік — це найшвидший шлях до спалювання інвесторських грошей.

На старті ШІ прискорює розробку концепта не на 10%, а в 10 разів. Одна людина може зробити те, на що раніше потрібна була команда. Відповідно, збільшується кількість стартаперів, бо треба набагато менше грошей, щоб спробувати ідею. Без інвесторів.

Але якщо на зміну «олігархам з кисневими масками» прийдуть стартапи, що дихають «токсичним смогом» ШІ-коду, вони просто загинуть швидше.

Давайте зачекаємо й побачимо, чи опинимось в Дорохедоро!

О, ви дивилися «Дорохедоро»? Моя повага! Це аніме — ідеальна метафора для нашої дискусії: світ, де все зшите «магією» (ШІ), панує хаос, і ніхто до кінця не розуміє, як це працює, поки в когось замість голови не з’явиться морда ящірки. Чекаю на другий сезон не менше за вас. 😉
Але повернемося до нашого «грибного світу» IT-інженерії:
1. Про екосистеми та Монобанк
Ви кажете про конкуренцію, але ринок — це не вакуум. Монобанк заходив у дуже специфічне вікно можливостей в Україні. Порівнювати це з ЄС складно, бо там справа не тільки в «старому коді», а в соціальному легасі.
• В Німеччині цифровізація банків — це не просто переписати код, це питання того, що робити з поштою (Postbank), яка десятиліттями виконує функції хаба.
• Це питання жорстких регуляцій (Compliance), які не дають «свіжим» гравцям просто «напромптити» банк за вихідні.
2. Про «перепишемо за 3 місяці»
Це звучить логічно для 100 KLoC, але є одна пастка: Cognitive Debt (когнітивний борг).
• Коли ви переписуєте «людський» код, ви зазвичай розумієте наміри (intent) автора.
• Коли ви намагаєтеся переписати 100 KLoC коду, який був згенерований ШІ без рев’ю, ви стикаєтеся з «чорною скринькою».
Метод «наукового тика» працює, поки система тривіальна. Але ШІ генерує ці 100 тисяч рядків з такою щільністю прихованих зв’язків, що стартап може витратити ці 3 місяці просто на те, щоб зрозуміти, чому при видаленні «непотрібного» коментаря падає база. Це і є Субпрайм: ви виглядаєте багатим на фічі, але фактично ви — банкрут за часом.
3. Про прискорення в 10 разів
Тут ми погоджуємося. ШІ — бог прототипування. Він ідеально підходить для того, щоб «викинути ідею на ринок». Але проблема в тому, що в сучасному IT прототип занадто часто стає продуктом.
• Якщо ви виросли в 10 разів швидше за конкурентів, але ваш фундамент — це «токсичний смог» (як ви самі влучно сказали), то будь-який серйозний півот або масштабування перетворить ваш стартап на некероване чудовисько.
Ми справді в стані «Дорохедоро». Магії (ШІ) стало забагато, вона дешева і доступна, але ми все ще не навчилися контролювати побічні ефекти. Мій посил не в тому, щоб заборонити магію, а в тому, щоб не стати її жертвою через ілюзію того, що «малий розмір» врятує від поганої якості.
Денисе, як ви вважаєте, де та межа, коли «швидкий і брудний» код стартапу стає його смертним вироком? На якому KLoC магія закінчується?

О, ви дивилися "Дорохедоро«?

Ні, може, після війни.

Ви кажете про конкуренцію, але ринок — це не вакуум. Монобанк заходив у дуже специфічне вікно можливостей в Україні.

Я казав про те, що ще в 2010 банкінг в Україні був дуже зручним. Без Монобанка — лише завдяки конкуренції. Власне, я й досі не розумію, чому ви саме його наводите як приклад, коли існують десятки нормальних банків.

Порівнювати це з ЄС складно, бо там справа не тільки в «старому коді», а в соціальному легасі.

Так, руйнація ентерпрайзів руйнує соціальне легасі!

Це питання жорстких регуляцій (Compliance), які не дають «свіжим» гравцям просто «напромптити» банк за вихідні.

Так, руйнація ентерпрайзів руйнує регуляції, котрі зашкоджали новим гравцям заходити на ринок!

Коли ви намагаєтеся переписати 100 KLoC коду, який був згенерований ШІ без рев’ю, ви стикаєтеся з "чорною скринькою«.

А отут є реквайрменти до системи в цілому! Реквайрменти до ентерпрайза вже ніхто не розуміє. Гірше того, бояться порушити взаємодію з іншими системами, котрі налаштовані на bug compatibility. А в стартапі команда знає, що вони роблять — і можуть спокійно це написати з нуля ще раз. Власне, Фаулєр так і рекомендує робити martinfowler.com/...​rificialArchitecture.html

будь-який серйозний півот або масштабування перетворить ваш стартап на некероване чудовисько.

Просто призведе до переписування з нуля за чергові 3 місяці однією людиною.

Денисе, як ви вважаєте, де та межа, коли «швидкий і брудний» код стартапу стає його смертним вироком? На якому KLoC магія закінчується?

Залежить від модульності та документованості інтерфейсів.

Так само, як і з монолітом проти мікросервісів. Бо коли є інтерфейси — можна переписувати кожен шматок незалежно.

Так само, як і з командною проти ковбойської розробки. Бо коли є інтерфейси — то вас вже не конче хвилює бас фактор.

Справедливо. Схоже, ми зійшлися на головному: модульність та чіткі інтерфейси — це єдина надійна «вакцина» проти ШІ-хаосу. Якщо ви свідомо будуєте Sacrificial Architecture і готові вчасно натиснути кнопку «катапультування», ШІ справді стає вашим реактивним двигуном.
Але тут я маю принципову незгоду: руйнування екосистеми через хаос рідко відкриває ринок — частіше воно його просто спалює.
Приклад: згадайте ту саму фінансову кризу 2008-го. Коли гіганти почали падати через «токсичні активи», це не дало шансу локальним кредитним спілкам розквітнути. Навпаки — обвалилася ліквідність для всіх. Малий бізнес, який був «здоровим», просто не зміг взяти кредити навіть на зарплати й випарувався першим.
В ІТ екосистемі все так само: якщо фундамент (інфраструктурні компанії, великі оупенсорс-контриб’ютори) потоне в ШІ-смітті, стартапам просто не буде на чому будувати свій «свіжий» софт. Замість «Дорохедоро» ми отримаємо цифрову пустелю, де ціна довіри до будь-якого коду стане загороджувальною.
Тому я все ж таки за інженерну гігієну та «щеплення», а не за сподівання на те, що ліс згорить і на попелі виросте щось краще. Дякую за таку глибоку дискусію — саме в таких суперечках і народжуються нові стандарти виживання в епоху ШІ.

якщо фундамент (інфраструктурні компанії, великі оупенсорс-контриб’ютори) потоне в ШІ-смітті, стартапам просто не буде на чому будувати свій «свіжий» софт.

Збудують на старому опенсорс фундаменті — код від часу не портиться. В банківських терміналах досі Віндовс ХР.

Збудують на старому опенсорс фундаменті

Хто збудує?

В статті немає глави про вже існуючи дослідження як ШІ призводить до вигорання працівників, одночасно з їх деградацією.
У прогнозах Гартнер здається, вказується що корпорації через, рік два, прийдуть до петеатестації персоналу без ШІ.

На усяких реддітах і лінкедах все більшає історій, про піпець як виросше навантаження на тех лідів — бо звичайним програмістам пох, таску ж закрив отим ПР від ШІ, керівництву теж пох — «крокуємо до x10!», і техлід все ж пробує якось рев’ювати і боротися з навалою тех боргу.

То хто швиденько збудує, вайбкодери?

На старті ШІ прискорює розробку концепта не на 10%, а в 10 разів.

А далі що з цим концептом робити, окрім як викинути?

Показати інвесторам, щоб дали гроші.

І далі що? Вайбкодери вже не вміють писати, вони лишень правити код ШІшки можуть. Викинуть один концепт, ШІшка наваяє інший, такої ж гівняної якості.

Далі, коли є гроші, можна найняти команду.
А без грошей від інвестора нема нічого — жодного «далі».
А без прототипу нема грошей, бо нічого показати.

На старті ШІ прискорює розробку концепта не на 10%, а в 10 разів.

Не факт, що в 10. І знову треба MVP. Інвестора починає цікавити проєкт, лише коли він приносить хоча б щось. Давати гроші на те, щоб переписати проєкт з нуля, який так само незрозуміло чи потрібен...

Інвестора починає цікавити проєкт, лише коли він приносить хоча б щось.

Твітер та Телеграм довго були в мінусі — але мали велику аудиторію.

Економія 10% на старті, яка призводить до росту TCO на 100% через рік — це найшвидший шлях до спалювання інвесторських грошей.

переважна більшість стартапів не доживе до того росту ТСО на 100%

А чому вартість підтримки ПЗ малого бізнесу має злетіти, якщо в них:
— менше технічного боргу
— не критичний софт

що такє — некритичний софт?
штраф від попадкової, за порушення законодавства, бо система трошкі не так порахувала з це критичний, чи не критичний софт?

ви про 1С — чули?
і як, це некритичний софт, що наш бізнес не може від неї відмовитись?
та не тільки дрібний.
Якщо подивитися тендери на Прозоро, то навіть Держ компанія Дія нещодавно відкрила тендер на BAS

Якщо кодова база достатньо отруїться, то гіганти зупиняться, а стартапи підуть далі.

куди вони підуть далі, ті стартапи?
Де ви, герої, коли напишете щось що замінить некритичну 1С...

а як жили без 1С?
ну було на фокспро 100500 систем, і тільки одна маштабувалася

а як жили без 1С?

погано жили.

ну було на фокспро 100500 систем

було. сам писав.

але зараз це нереально.
тупо не вистачить стільки бухгалетрів найняти, щоб повернутися до такої кількості ручної праці.

в кінці кінців Гетьманців настільки спростить бухоблік, що вистачить

в темах по 1С я це писав не раз.
Гетманцев не зможе спростити бухоблік.
Це набагато колективніша і довга робота, аніж — Цар прийшов і сказав — буду так!

як вірус Петя, чи вирублення Київстара на два тижні, так і відмова від 1С в один момент не приведе до якогось кінця світу чи бухгалтерії, знайдуться інші рішення або підходи, ось і все, а Цар міг би і наказав, одним наказом більше

це все балаканина невігласів та ідеалістів.

а наказом — зайдіть на Прозоро, виберіть фільтр BAS, та подивіться тендери, і організації яки ті тендери відкрили.

а базікання про альтернативи — то для лохів.

Andriy Bezgubenko (erp.ua) влучно написав:

Про велику китайську стіну і 1С! (я люблю складні виклики)...
Нещодавно я бачив оцінки, що на 1С/BAS працюють приблизно 2,2 млн підприємств в Україні (малий, середній, великий бізнес та ФОПи), з яких 1,3 млн активно користуються системою, а решта — лише формально, мікропідприємства, які можуть не використовувати її для бухгалтерії. Часто в 1с засовували елементи автоматизації процесів, які кращше робити в інших системах, але знайомий програміст вмів лише в 1с.
Ми зараз багато говоримо про відмову від 1С/BAS (навіть заборону!!!). Щоб перевести одну компанію з 1С на нову систему, мінімально потрібні 2 спеціалісти (консультант+програміст) та щонайменше 3 місяці роботи. Це дуже мінімалістичні дані.
В Україні є кілька великих інтеграторів ERP систем із командами 200+ співробітників, а також три десятки невеликих компаній із командами по 5–6 спеціалістів. У сумі на ринку нараховується близько 688 спеціалістів, які реально можуть працювати на стороні клієнта над переходом з 1С/BAS (у зв’язці аналітик + спеціаліст з кастомізації). За поточних умов ці 688 спеціалістів можуть разом перевести приблизно 1 376 компаній на рік. Фактично це означає, що для переходу 1,3 млн компаній з 1С/BAS вручну, наявними ресурсами ринку, знадобиться близько 944 років.

Ну... ситуація в ІТ все ж таки унікальна і відрізняється від кризи 2008 року. Поруч з ентерпрайзом завжди є Open Source... Його завжди можна форкнути, якщо «офіційна» версія піде кудись не туди через ШІ чи поганий менеджмент. Ентерпрайз це частіше про сапорт і гарантії, а не монополію на сам код. Тому не факт, що все посиплеться за сценарієм фінансових ринків. Моя оцінка в тому, що ми проходимо точку біфуркації, тому гадати що там вийде в результаті марна справа.

завжди є Open Source...

якій частенько фінансується ентерпрайзом через фонди, пожертви.
ком’юніті якого — програмісти у ентерпайзі, які сидять на зарплатах.

Його завжди можна форкнути

і потім — сапортити самим?
ШІ звісно допоможе, але ж — якщо не слідкувати, то він з того форка швидко зробить гуано. і що далі?

Я багато бачив в своїй практиці форк + свої патчі. Раз на рік сінк, а то й просто забити доки там щось не з’явиться корисне, а часто воно там не з’являється. Чому б й не супортити самостійно?
Знову, форк скоріше взяти версію, до того як вона це не зіпсувалася. Ну і... я не думаю, що в більшості випадків так треба саме останню брати. Unreal може є сенс, а от якась ліба... багато бачив, що як вона клонувалася як підмодуль на початку проєкту, так і не оновлювалася ніколи. Навіть після твого патчу, який контрибутився.

харчової нитки.

це теж щось лонгітьюдне з Борду?

у реальних Enterprise-системах

от тут імхо і прірва між можливостями інструменту і задачами
на ентрепайзі постійно виникає щось по-своєму унікальне, контекстно-залежне
ми собі радимо за рахунок категорійності мислення і рівнів абстракцій, «вбудованих» в наш інструмент в голові, статистичний же кранчінг тут не порадить собі і тому, що в ньому цього нема і тому, що і натаскати його нема на чому з-за унікальності і складності контекстів задач

У нас 26-ий рік несеться з такою швидкістю,

— це гарна метафора того що дія AI зараз випереджає думку людини. Єдине вирішення як я думаю — це виключити людину з цього процесу взагалі. AI сам себе генерує, сам тікети робить, сам їх тестує, сам релізиться. До цього усе йде. Але досі не розумію де тепер у цьому світі який «несеться» місце людині? Пил протирати на серверних стійках?

дія AI зараз випереджає думку людини

по контексту виглядає відносно тільки програмістів було, і не всіх а певної субкатегорії

AI сам себе генерує, сам тікети робить, сам їх тестує, сам релізиться. До цього усе йде.

до деградації

До цього усе йде.

А потім Artificial Idiot допускає примітивну помилку та створює вразливість в коді, яку ніхто потім не може виправити, бо ніхто не розуміє отого всього лайна, що нагенерувано. Мільйони пристроїв заражені, погані хлопці відкривають шампанське, спеціалісти з безпеки також, бо дедалі вони будуть мати все більше та більше роботи.

Профіт, кров, гімно та цукор... :)

я прочитав «по діагоналі» і так само по «діагоналі» я згоден.... але проблема що люди та людство взагальному діє іраціонально навіть у дуже раціональних (технічно точних) областях.
тому людство, і ІТ інженерія та індустрія «середньо статистично» будуть проходити через це (роками), наче це не можна було уявити і передбачити, та прорахувати....

тобто знову «голос одинака в пустелі»

Ви абсолютно праві щодо ірраціональності. Навіть у точних науках ми часто ігноруємо цифри, поки вони не починають «бити по руках». Але я б не сказав, що це «голос одинака». Якщо вийти за межі бульбашки хайпу, ця точка зору стає мейнстрімом серед тих, хто оперує великими системами. Дослідження (GitClear, METR) лише підтверджують те, що інженери вже відчули «на кінчиках пальців».
Щодо доцільності таких публікацій — я дивлюсь на це крізь призму теорії систем. Наша екосистема — це не статична конструкція, якою керує лише Big Tech, а динамічне середовище. У ньому домінування наративів визначає вектор розвитку.
Якщо інженерна спільнота мовчить, ми отримуємо «нормалізацію пасивності». Це розв’язує руки вендорам для ще агресивнішого впровадження «сирих» рішень. Публічна критика та аналітика — це критично важливий «сенсор» у цій системі. Навіть якщо він не спрацьовує ідеально, його участь створює той самий баланс, який рятує індустрію від повного інженерного банкрутства. Якщо ми перестанемо формувати власний наратив — «середньостатистичне» погіршення настане значно швидше.

Якщо ми перестанемо формувати власний наратив — «середньостатистичне» погіршення настане значно швидше.

Можливо, саме це потрібно, щоб проблема не стала хронічною

А давайте уточнимо «систему координат»: а що саме ви вважаєте головною проблемою в цьому контексті?
Бо для мене Problem Statement виглядає наступним чином: ми маємо масовий продаж абсолютно сирого продукту під гучними лозунгами «ефективності», хоча всі наявні дані свідчать про зворотне. Ми не отримуємо реального приросту швидкості делівері, натомість отримуємо стрімку деградацію кодових баз.
Тобто ми купуємо «ліки», які не лікують, а мають важкі побічні ефекти, про які вендор воліє мовчати.
Ваша теза про ірраціональність стосується саме цього «акту віри» менеджменту в маркетинг всупереч цифрам? Чи ви бачите проблему в чомусь іншому?

що саме ви вважаєте головною проблемою в цьому контексті?

Як описано у ваших документах, використання технології, котра приносить шкоду замість користі. Як вірус в людини.

І от можна або перехворіти одну ніч з високою температурою, або два місяці кашляти.

Згоден з вашою метафорою, але хіба не краще взагалі не хворіти? Профілактика або вчасне щеплення зазвичай коштують набагато дешевше, ніж реанімація або навіть «одна ніч з високою температурою».

Ви ж самі написали, що для щеплення вже пізно — вразливого коду вже нагенеровано, і вже навіть видно симптоми.

Нагенерували і генеруємо зі збільшенням швидкості. Про це я писав. А от що вже пізно — не писав. Про це є більше в репо. Насправді ми рухаємось зі збільшенням ймовірності до сценаріїв 2 кризових які описані в репо. Але це не незворотня траєкторія на мій погляд. Виміряти і довести я це не можу бо це занадто глобальне питання з величезною кількістю змінних більшу частину яких навіть не видно. Може ми на порозі кризових сценаріїв і вони реалізуються завтра. А може через рік — ніхто не знає. Я ж сподіваюсь на те що хайп припиниться, ринок протверезіє і цього взагалі не відбудеться

Репо вже почитав.
Якщо код вже нагенерований (а він вже нагенерований), то ніхто не зможе видалити півтора роки розробки з кодової бази. Відповідно, ми вже в майбутньому, котре вилазить і вилазитиме роками багами та сповільненням змін.

Так, забруднене — але це не значить що це стало критичним і не можна нічого зробити. Криза реалізована це коли ТСО вже почне суттєво зʼїдати бюджет інновацій. Тобто — шкода завдана і продовжує завдаватися. Але пацієнт то ще живий і я не стверджую що він мрець сьогодні. А стверджую що якщо продовжить пити отруту — то помре

Криза реалізована це коли ТСО вже почне суттєво зʼїдати бюджет інновацій.

Він з’їдатиме бюджет інновацій там, де буде багато тех боргу. А його буде багато там, де є багато негнучкого коду.

А там, де коду мало, і він постійно змінюється, тех борг суттєво не збільшиться — бо весь код молодий, бо бізнес-логіка весь час оновлюється.

Виглядає логічно, але в цьому аргументі криється головна пастка ШІ-ери: «молодість» коду більше не є синонімом його «здоров’я».
Раніше техборг накопичувався роками через зміну вимог чи застарівання технологій. Сьогодні він виникає за мілісекунди в момент натискання клавіші Tab. І ось чому «швидка зміна бізнес-логіки» не рятує малий бізнес:
1. Вроджені вади: Якщо ШІ згенерував структурно заплутаний код (+39% когнітивної складності), він стає токсичним активом у ту ж мить. Неважливо, що йому лише година — він вже потребує більше ментальних зусиль для рев’ю та дебагу. Це «дитина з хворобами старої людини».
2. Code Churn замість інновацій: Те, що ви описуєте як «постійне оновлення», дані GitClear фіксують як бесплідну плинність коду. Якщо ви щодня переписуєте «молодий» код, бо він був «правдоподібно хибним», ви не рухаєтесь вперед. Ви просто витрачаєте 90% палива на прогрів атмосфери (TCO), замість того, щоб будувати продукт.
3. Вузьке місце — мозок: У малих командах ресурс сеньйора — це єдиний реальний капітал. Якщо він змушений рев’юїти на 131% більше обсягу, бо «код молодий і постійно змінюється», він вигорить швидше, ніж у великій корпорації.
Отже, «молодий» ШІ-код — це часто ілюзія чистоти. Насправді це високошвидкісний конвеєр з виробництва технічного сміття, яке стає непідтримуваним за тижні, а не за роки. В цьому і полягає підступність «Субпрайму»: активи виглядають свіжими, але за фактом — це сміттєві облігації.

Вроджені вади: Якщо ШІ згенерував структурно заплутаний код (+39% когнітивної складності), він стає токсичним активом у ту ж мить. Неважливо, що йому лише година — він вже потребує більше ментальних зусиль для рев’ю та дебагу. Це "дитина з хворобами старої людини«.

Так, і ця дитина доживе до 10 років. А якщо такі вади внести старшій людині, котрій вже 40 — то вона помре. Стартапам вади не зашкодять — їм нема що втрачати!

Те, що ви описуєте як «постійне оновлення», дані GitClear фіксують як бесплідну плинність коду.

Я описую молодість та малий розмір коду в стартапах порівняно з ентерпрайзом — навіть незалежно від ШІ. Якщо у вас код жив без ШІ 2 місяці, а з ШІ житиме 2 тижні — це несуттєва зміна!

У малих командах ресурс сеньйора — це єдиний реальний капітал. Якщо він змушений рев’юїти на 131% більше обсягу

А в стартапах рев’ю нафіг не треба — бо воно і розробку тормозить, і грошей коштує!

Ви зараз озвучили «маніфест кавбой-кодингу», який дуже популярний у долині, але часто стає причиною того, що 90% стартапів помирають, навіть не доживши до першого серйозного півоту.
Давайте розберемо вашу позицію з точки зору Delivery Management:
1. Про «рев’ю нафіг не треба»
Це найнебезпечніший міф. Рев’ю — це не про «гальмування», це про Sync (синхронізацію контексту).
Якщо у вас команда з 3 людей і ніхто не рев’юїть код, згенерований ШІ, то через місяць у вас у репозиторії три різні «чорні скриньки», логіку яких не розуміє навіть сам автор (бо він її не писав, а просто заакцептив).
• Наслідок: Будь-яка спроба одного розробника зайти в код іншого перетворюється на археологічну експедицію. Швидкість команди падає в нуль саме тоді, коли треба бігти найшвидше.
2. Про «дитина доживе до 10 років»
Проблема не в тому, скільки вона проживе, а в тому, скільки ресурсів вона споживатиме.
У стартапа обмежений runway (запас грошей). Якщо через «вроджені вади» ШІ-коду кожна наступна фіча коштує в 3 рази дорожче і займає в 3 рази більше часу на дебаг, стартап просто спалить гроші інвесторів, так і не досягнувши Product-Market Fit.
Це і є Субпрайм-криза: ви взяли «швидкий кредит» у ШІ під шалені відсотки техборгу, і тепер весь ваш час іде на виплату відсотків (фікс багів), а не на розвиток бізнесу.
3. Про «2 тижні vs 2 місяці»
Тут ви ігноруєте Value Stream. Плинність коду (churn) — це марна праця. Якщо ви переписуєте код кожні 2 тижні, ви працюєте «вхолосту».
• Приклад: Поки ви тричі переписуєте один і той самий модуль через галюцинації ШІ, ваш конкурент (який використовує ШІ як точний інструмент під контролем сеньйора) один раз будує надійний фундамент і йде далі.
Висновок: Стартап — це не про «відсутність правил», це про виняткову точність виконання при обмежених ресурсах. ШІ без рев’ю та архітектурного нагляду — це не прискорювач, це генератор випадкових чисел у вашому бізнес-пайплайні.
Ви кажете, що стартапам нема чого втрачати. Але вони втрачають найцінніше — Runway та Time-to-Market. А ШІ-сміття з’їдає і те, і інше з неймовірною швидкістю.

• Наслідок: Будь-яка спроба одного розробника зайти в код іншого перетворюється на археологічну експедицію. Швидкість команди падає в нуль саме тоді, коли треба бігти найшвидше.

Це у вас міфи з Тім Тополоджіс, котрі суперечать реальним дослідженням, опублікованим в Peopleware та Organizational Patterns of Agile Software Development. Якщо маєте кілька складних субдоменів, максимальна швидкість досягається, коли кожним з них займається окрема людина, а не в команді універсалів. Відповідно, ніхто з них не може рев’ювити іншого — бо й своєї складності вистачає. І так, ми так 6.5 років писали продукт.

У стартапа обмежений runway (запас грошей). Якщо через «вроджені вади» ШІ-коду кожна наступна фіча коштує в 3 рази дорожче і займає в 3 рази більше часу на дебаг, стартап просто спалить гроші інвесторів, так і не досягнувши Product-Market Fit.

Стартапу спочатку треба перевірити концепт, ще до інвесторів. На це йдуть особисті заощадження. Ви порівнюєте дитину з генетичними вадами та презерватив.

ви взяли «швидкий кредит» у ШІ під шалені відсотки техборгу, і тепер весь ваш час іде на виплату відсотків

А інакше ви просто не маєте фінансів на старт!

Плинність коду (churn) — це марна праця. Якщо ви переписуєте код кожні 2 тижні, ви працюєте "вхолосту".

Ні, це швидкість розробки нових фіч, котрі можуть закриватися по кілька на день goomics.net/374

Ви згадали Peopleware та Organizational Patterns! Це класика, яку я глибоко поважаю. Але є один критичний нюанс: ці праці були написані в епоху, коли код був «ручної роботи».
Коли ДеМарко та Лістер писали про «стан потоку» та індивідуальну відповідальність, вони мали на увазі систему, де людина усвідомлює кожен рядок. В епоху ШІ ми маємо іншу математику: 1 рядок людського коду != 100 рядкам ШІ-коду.
Давайте пройдемося по ваших тезах з точки зору системної динаміки:
1. Про «сілоси» (складні субдомени) та Peopleware
Ви кажете, що максимальна швидкість досягається в ізоляції. Це правда для написання. Але Peopleware також наголошує на важливості «спільноти» та «conceptual integrity».
Якщо один розробник нагенерував за допомогою ШІ «чорну скриньку» на 50 KLoC, яку він сам ледь розуміє, а потім він (не дай боже) йде з проекту — ваш субдомен перетворюється на Dead Code. В епоху ШІ ризик «автобусного фактора» (Bus Factor) злітає до небес саме через те, що ніхто не рев’юїв цей «магічний» обсяг.
2. Про «презерватив» та одноразовий код
Метафора жорстка, але влучна. Проблема в тому, що в IT-бізнесі «тимчасові рішення» мають звичку ставати вічними.
• Якщо ви використовуєте ШІ, щоб за власні кошти швидко перевірити ідею — це геніально.
• Але «Субпрайм-криза» починається тоді, коли цей «прототип-презерватив» намагаються натягнути на реальний Enterprise-контракт.
Коли приходить перший великий клієнт і вимагає Security Compliance, Scalability та стабільності, стартап розуміє, що він побудував замок з піску. І грошей на перепис уже немає, бо треба доставляти фічі, обіцяні інвесторам.
3. Про «швидкий кредит»
Ви кажете: «А інакше немає фінансів на старт!». Це і є логіка кредитної пастки.
Так, ви отримали «кеш» (код) сьогодні. Але якщо ставка — це 39% когнітивної складності, то ви — інженерний банкрут ще до того, як вийдете в нуль. Ви не зможете найняти людей, щоб масштабуватися, бо ніхто не захоче лізти в це «Дорохедоро» без рев’ю та документації.
4. Про Churn та Goomics
Комікс про «швидкість» — це смішно, але GitClear показує іншу сторону: якщо ви переписуєте код кожні 2 тижні, ви не «біжите», ви буксуєте.
Енергія системи витрачається на переробку (Rework) замість створення нової цінності. Для стартапу з обмеженим Runway — це смертельний гріх.
Резюме: Я не проти ШІ як інструменту для прототипів. Я проти ілюзії, що цей шлях безкоштовний.
Ми справді в світі Dorohedoro: магія ШІ дозволяє вам швидко виростити додаткові голови, але чи зможете ви ними керувати, коли прийде час будувати реальний бізнес, а не просто «PoC на колінці»?
Денисе, ви кажете, що так писали продукт 6.5 років. Але чи була тоді інтенсивність генерації коду такою, як зараз з Клодом чи Курсором? Мені здається, ми порівнюємо «швидку ходьбу» з «вільним падінням».

Якщо один розробник нагенерував за допомогою ШІ «чорну скриньку» на 50 KLoC, яку він сам ледь розуміє, а потім він (не дай боже) йде з проекту — ваш субдомен перетворюється на Dead Code.

Так! І цей субдомен має бути за добре документованим (в ідеалі — ще й покритим тестами) інтерфейсом, щоб його можна було переписати цілком з нуля. Власне, як і переписують під час розділення моноліту — але там, нажаль, нема інтерфейсів, тому процес розтягається на роки. А коли будь-який шматок можна відносно легко переписати, то бас фактор втрачає потужність.

Коли приходить перший великий клієнт і вимагає Security Compliance, Scalability та стабільності, стартап розуміє, що він побудував замок з піску. І грошей на перепис уже немає, бо треба доставляти фічі, обіцяні інвесторам.

А якщо не використовувати ШІ — то нема того, що можна було б показати отим інвесторам, щоб залучити оті їх гроші, котрі потім могли б закінчитися, коли б прийшов ентерпрайз контракт.

39% когнітивної складності

Це різниця між 50 KLoC та 70 KLoC. Несуттєво.

якщо ви переписуєте код кожні 2 тижні, ви не «біжите», ви буксуєте. Енергія системи витрачається на переробку (Rework) замість створення нової цінності.

Я робив проект з нуля до виходу на ринок, додавання купи фіч, і розробки нового типу пристрою. І я знаю, скільки разів переписується код в грінфілд RnD.

Але чи була тоді інтенсивність генерації коду такою, як зараз з Клодом чи Курсором?

Я не встиг ними покористуватись.

Денисе, бачу, що ми обоє за «інженерний дарвінізм», просто ви за швидку мутацію, а я за виживання всієї популяції.
Мушу погодитися з вашим досвідом у Greenfield: там справді панує логіка «спробував — викинув — переписав». Це ідеальне середовище для ШІ. Але я маю принципове зауваження щодо математики складності, бо тут ми ризикуємо потрапити в лінійну пастку.
Чому 39% складності != 39% рядків коду (LOC)
Я вважаю, що прирівнювати зростання когнітивної складності до лінійного зростання обсягу (50 KLoC vs 70 KLoC) технічно некоректно. Ось чому:
• Нелінійність сприйняття: Когнітивна складність — це «вартість усвідомлення» взаємозв’язків. Якщо функція стала на 39% складнішою структурно (цикломатична складність, вкладеність, розгалуження логіки), то час на її розуміння та ймовірність помилки при модифікації зростають експоненціально, а не лінійно.
• Ефект «щільнішого туману»: Це не просто «більше тексту», це більше вузлів у графі залежностей. Згідно з законом Брукса та іншими метриками складності, додавання нових зв’язків у систему здорожує її підтримку набагато сильніше, ніж додавання просто нових модулів.
• Масштаб «археології»: Коли сеньйор заходить у код, він шукає не «де написано», а «чому це зроблено саме так». 39% зайвої складності в ШІ-коді — це 39% втраченого наміру (intent), який доводиться відновлювати вручну.
Примирювальний висновок
Ви абсолютно праві: модульність та інтерфейси — це наш порятунок. Якщо ми вміємо ізолювати «магічне сміття» за чистим контрактом, то ми контролюємо ситуацію.
Проблема лише в тому, що ШІ сьогодні продають менеджменту не як інструмент для «тимчасових презервативів» у RnD, а як «срібну кулю» для швидкої побудови Enterprise-фундаментів. І саме там ці 39% нелінійної складності перетворюються на ту саму «пухлину», яка з’їдає бюджет інновацій.
Дякую за дискусію, це був чудовий батл філософій! Можливо, після війни справді обговоримо це за келихом чогось міцнішого під другий сезон «Дорохедоро».

котра приносить шкоду замість користі. Як вірус в людини.

не все так однозначно

До речі, можете спробувати публікнути, наприклад, на Медіумі в ITNEXT. Вони мають певне покриття, і Гугл новини можуть підхопити статтю.

Дякую. Подивлюсь. Я на медіум публікував доволі багато статей але в TowardsAI.

Гарна стаття. Долучайтеся до чатіку t.me/swarchua

Для тих, хто не подужав лонгрід — стислий чек-лист нашого технічного дефолту:
Ми не прискорили розробку. Ми просто навчилися з експоненціальною швидкістю забивати кодові бази токсичним технічним боргом. Ось сухі цифри «ШІ-ефективності» за останні 3 роки.

Ми «оплатили»:
• 🚀 +131% — вибухове зростання обсягу сирого коду. Ми буквально топимо проекти в синтаксисі.
• 📉 <10% — рівень перевикористання (reuse) коду. Він обвалився з 25%, бо ШІ не будує архітектуру — він просто копіпастить (дублювання зросло в 10 разів).
• 🤯 +39% — зростання когнітивної складності коду. Розібратися в машинному рішенні тепер на третину важче, ніж у людському.
• 🚽 −19% — падіння продуктивності сеньйорів. Ви більше не творці, ви — високооплачувані асенізатори, що розгрібають «галюцинації» за ШІ та джунами.
• ⚠️ +18% — ріст критичних попереджень статичного аналізу. Код виглядає «чистим», але він системно брудний.

І цим ми «купили»:
• 🐢 ~10% — реальний системний приріст швидкості на виході системи(про такі ж цифри говорить керівництво Гугл). Все інше — ілюзія та маркетинговий шум.

Головний висновок: ШІ-асистенти прибрали «клапан контролю потоку». Тепер ми вливаємо пожежний шланг низькоякісного коду в садовий шланг людського рев’ю.

Ми купуємо ілюзію швидкості сьогодні ціною повного інженерного банкрутства завтра. Ми будуємо «одноразове ПЗ», яке деградує швидше, ніж ми встигаємо його усвідомити.

ШІ подужав резюмувати, і от в цьому може бути його користь

В локальних ізольованих задачах вона точно є.

А вам не приходила думка, що розробка ПЗ взагалі то також ділитися на окремі ізольовані задачі? При чому якщо ставити LLM окремі правильно розділені задачі, не потрібна навіть найновіша найдорожча модель, або абстрактна ідеальна AGI модель з майбутнього.

Проблема не в «сценаріях», а в розриві сприйняття
Думка про те, що декомпозиція розробки на атомарні задачі зробить ШІ ідеальним виконавцем, виглядає логічно лише на папері. Індустріальна статистика та реальний досвід команд показують зворотне: це не вирішує проблему системної цілісності.
Ми маємо справу з глибоким розривом між інженерною реальністю та очікуваннями бізнесу:
1. Полярність поглядів
• Для інженера: ШІ-асистент — це потужний, але токсичний інструмент. Він потребує надвисокої концентрації, ретельного рев’ю та постійної валідації. Це не «автопілот», це «підсилювач ризику».
• Для бізнесу (інвестори, борди, менеджмент): Це «Plug-and-Play» технологія. В їхніх очах це просто нова версія IDE, яка має автоматично «різати кости» та прискорювати делівері в рази.
2. Конфлікт естімейтів
Коли інженерна команда просить більше часу на ретельне проектування або попереджає про ризики ШІ-автоматизації, вона часто стикається з жорсткою реакцією. Бізнес, «нагодований» маркетингом вендорів, щиро не розуміє: «Чому естімейти ростуть, якщо у вас є „чарівна кнопка“?»
3. Стаття як точка синхронізації
Проблема навіть не в тому, що інженери не вміють «правильно промптити». Проблема в тому, що у нас немає спільної мови з менеджментом.
Цей матеріал потрібен як інструмент для корекції очікувань. Ми маємо пояснити радам директорів те, що вже бачать очі інженерів: ШІ вимагає не скорочення штату, а зміни операційної моделі. Замість сліпої віри в «магію» нам потрібна професійна валідація та жорсткий контроль.

Насправді якщо задачі правильно декомпозовані, в контексті агента є всі необхідні дані для задачі (сама таска, сторі до якої вона відноситься, стандарти статичного аналізу команди, etc), а зайвого нічого не має, то LLM працює надзвичайно ефективно.
Звісно, дещо підвищуються вимоги до якості описаних задач, оскільки розробник який був на мітингах має контекст і за допомогою нього може правильно зробити погано описану задачу, але говорити, що агенти не підвищують продуктивність — це не зовсім правильно.
Агентам типу клод коду и кодексу трохи більше року, практика ефективного використання в середньому по індустрії ще не слабкому рівні, а самі агенти кожен місяць суттево оновлюються, тому не дивно що в принципі можуть бути розробники які працюють з ним гірше, ніж самі, але це питання практики (як особистої так і загальною по індустрії)
Навіть якщо LLM перестануть вдосконалювитись, або будуть вдосконалюватись дуже повільно, достатньо буде просто розвитку інструментів і навичок, щоб кількість якісного коду написанного одним програмістом значно зросла.

Агентам типу клод коду и кодексу трохи більше року

на самом деле даже меньше, Claude Code появился в конце февраля прошлого года. прогресс за год неимоверный, как в интеллекте моделей, так и в развитии агентного подхода.

Тобто, ми хочемо повернутися до класичної V-моделі, де кожен рівень деталізовано описаний у відповідних документах? В цій моделі передбачаються навіть специфікації на
функції в коді.

Я зараз без натяків та розгортання теми (хоча це цікаво). Спочатку хочеться зрозуміти, чи саме так уявляється собі вся ця необхідна для ефективної роботи «ШІ» документація?

саме так, ШІ вимагає до суворого waterfall. Різниця — швидка генерація коду дозволяє отримувати швидко фідбек. Тому краще пригадати RUP :)

Але все інше — сам так. Дуже, дуже ретельна документація треба. І не просто з функціями у коді, а з — прикладами, псевдокодом. Тоді GenAI добрий код генерить.
GenAI погано розуміється на абстрактних описах.
Приклади йому тра, тоді — молодець. Можна і посилання на інші сорци у проекті, які можна брати за взірець код/дизайн стайла проекту. Теж добре «злизує» стиль.
Тому й — як тільки з’являється тех борг — ШІ його бере за зразок, і чворить ще більший. Щось тіпа як в теорії розбитих вікон.

Відповідальний програміст застогнав би, бачачи який код треба розширювати, почав би — ой, треба спочатку порефакторити, а для ШІ — любий код — приклад для його повторення.

Аджайл — це точно не для ШІ.

Якщо в тасках треба зробити якийсь опис — це вже автоматично не Agile?

Якщо вам треба пояснювати різницю між «аджайлом» і «ватерфолом» — то воно вам точно не треба

Дуже радий за вас що ви тут все розумієте

Це не повернення до V моделі.
В Agile тасках «по правильному» також прийнято писати контекст, опис, acceptance criteria і можливі developer notes, а в деяких сторях може бути Sequence діаграма. Цього достатньо у більшості випадків для того щоб сгенерувати правильний код.
Я розумію що не завжди у реальних проектах, що типу Agile це використовується, не всі працюють «по правильному», я сам працював у проектах де весь опис таски це її назва, але те що в тасках є опис — це не перетворює методологію на waterfall.

Ми не маємо спиратися на конкретні випадки, бо вони можуть бути не системними. Дійсно, аджайл допускає документацію, але не вимагає її. А V-модель як раз вимагає детальну документацію, ще й на кожному з рівнів.

Пригадуючи аджайл маніфест:

Communication over documentation

Як ми вже з’ясували, over зовсім не скасовує документацію, але чітко вказує на те, що гнучка модель дозволяє швидше прийти до (проміжного) результату, використовуючи таку людську властивість, як комунікація.

Як тільки у нас у всіх випадках стає «documentation over communication » (по факту), то справедливо виникає підозра, що це вже не аджайл.

Подивимося й на інші наріжні камені аджайлу:

Individuals and interactions over processes and tools

, що знову тягне в «людськість», як перевагу. Заміна відділу розробників на ШІ-агентів, якими диригують 1-2 архітекторів руйнує цей принцип, бо ШІ-агенти зовсім не вміють отримувати ту вигоду від communication та interactions, яку передбачає аджайл. Чому? Бо вони не individuals.

Ще один принцип:

Responding to change over following a plan

, який можна обговорювати, бо може здатися, що швидкість «ШІ» дає швидкість для responding to change.Втім, на разі це сумнівно, адже ми вже з’ясували, що для гарної роботи «ШІ» потрібно саме following a plan, що буде досягатися через такі речі, як вичерпна документація. Суть було в тому, щоб не ламати вже напрацьоване за планом, не відкидати, коли потрібна зміна. Як будемо досягати цього?

Отже, є проблема в тому, щоб будувати такий аджайл з «ШІ» просто тому, що це вже геть не схоже на аджайл.

Нормально описана таска та acceptable — це не

documentation over communication

, якщо посеред спрінту ПО підійшов та сказав що він не правильно зрозумів, що хоче замовник і треба трохи інакше зробити таску, а вам треба відповідно змінити в описі таски 1-2 строки відповідно до уточненних вимог — це теж не documentation over communication.
Навіть якщо ПО прийшов і сказав що він взагалі не зрозумів замовника і треба всю стору заново декомпозити, то це теж не

documentation over communication

, оскільки розробникам в будь якому разі треба зібратись (можливо в меншому складі для швидкості), провести цей самий

communication

і переробити таски (що треба було б і так зробити у більшості випадках для інших девів).
Крім цього, якщо ви вважаете що якусь конкретну таску ви можете зробити швидше, бо ви конкретно знаете де можна вставити 1-5 строчок очевидних строчок коду для її виконання, замість опису таски/зміни — це теж ок, використання агентів це не заборона на мануальне програмування.

Ніхто не говорить про буквальну заміну всіх розробників 1-2 архітекторами (Прийнаймні прямо зараз), питання в тому що навіть якщо опустити LLM хайп, то при правильному налаштуванні контексту з уже існуючими методологіями агенти можуть реально робити нормально описані задачі, перетворювати таски в 5SP на таски в 3SP і тд.
Не треба впадати в крайнощі, якщо для автоматизації значної кількості написання коду треба трохи підвищити дисципліну при описі задач — це не значить що ми знову у waterfall.

Нещодавна вліз в обговорення молодих типових піемів, то прийшлось завершити, бо вони як та риба — нічого не знають про воду в якій живуть.

Для них все аджайл, і любі методики — аджайл.
А ватерфол — то якийсь макароний монстр с прадавніх манускриптів.

А потім ми дивуємось чого на проектах х-ня якась твориться.
коли менеджмент не розуміється на ваховій сфері, то диво що взагалі що проекти якось робляться.

І якщо ШІ прийде, то не програмісти, а отакі пиеми стануть зайві

Проблема у тому, що ці задачі не ізольовані. Ок, припустимо задачу на співдесіді, треба розгорнути список у пам’яті. LLM відразу виплюне код. Мені треба буде як мінімум намалювати елементи, стрілочки, якось побудувати контекст в мозку і тоді я вже напишу код.

Але якщо брати типовий проєкт, то проблема у тому, що коли ти змінюєш, тобі треба проаналізувати на що ці зміни повпливають. У тебе я пам’ять що відбувалося раніше, які були баги, яка специфіка, які приховані залежності, чому тут не спрацює типове рішення, ...

Якщо у вас спрінт, він розділений на описану сторі, а сторі поділена на окремі задачі, то взагалі-то задачі ізольовані. Якщо сама сторя така, що впливає на інші фічі, то це обговорюється під час планування. Тобто з дещо LLM підвищується вимоги до правильної декомпозиції та опису задач, щоб LLM робила саме те що потрібно, а не підставляла свої assumptions замість реальних вимог, але окремі задачі LLM робити може і це навіть скептики визнають. При чому саму декомпозицію і опис задач можна також робити за допомогою LLM, хоча за більшою участю людини.

Щоб розписати задачу для LLM так детально, щоб вона врахувала всі сайд-ефекти та легасі, то це вже не декомпозиція, це і є програмування, тільки англійською мовою. Проблема в тому, що природна мова не така точна, як код, і занадто багатозначна. Тому виходить подвійна робота: спочатку ти витрачаєш купу часу, щоб описати контекст (складніше, ніж написати код), а потім ще більше часу, щоб перевірити, чи правильно машина зрозуміла твої неоднозначні слова.

а сторі поділена на окремі задачі, то взагалі-то задачі ізольовані.

WAT?

При чому якщо ставити LLM окремі правильно розділені задачі, не потрібна навіть найновіша найдорожча модель, або абстрактна ідеальна AGI модель з майбутнього.

якщо ставити окремі правильно розділені задачі, то не потрібна навіть модель

Як я ще кажу:
Коли так ставити завдання і так розписувати все — то й студентів можна наймати, замість мідлів з 5+ досвіду

Підписатись на коментарі