Чому ШІ — поганий програміст
Чергове дослідження, яке гайпуючі оминуть увагою:
Свіже дослідження та пов’язаний із ним бенчмарк показують, наскільки добре агенти справляються не просто з написанням коду, а з його розширенням у зв’язку зі зміною бізнес-вимог.
Коротше кажучи, все як у житті.
Для того, щоб оцінити якість результату, у бенчмарку дивляться на два показники — кількість зайвого чи дубльованого коду та дещо під назвою structural erosion (структурна ерозія), що можна приблизно уявити як надмірну складність рішення.
І все досить погано. У 80% випадків складність зростає, у 90% випадків збільшується кількість зайвого коду.
Що ще цікаво — у коді, написаному людиною, ці метрики з часом залишаються на одному рівні, а в агентському — погіршуються від ітерації до ітерації.
SlopCodeBench: Benchmarking How Coding Agents Degrade Over Long-Horizon Iterative Tasks
P.S.
Оскільки я використовую ШІ з
- висновки дослідження повністю збігаються з моїм досвідом використання ШІ в розробці;
- не у «вайбкодингу», а у професійній розробці.
Цю слабкість GenAI я називаю протягом цих років:
відсутність абстрактного мислення.
І у останніх моделей його теж не з’явилося.
87 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарівyoutu.be/JKRnrJpdqAM?t=561
якось невдобно вийшло
Тут AI недочого, тут усі проблеми класичного слабо регульваного капіталізму вийшли на перший план.
Сучасний ІТ дуже монополізований. Наприклад 90% чіпів по сучасним тех процессам 7 та менше НМ випускає лише TSMC. 70% десктопів та лептов під керуванням MS Windows. META контролює 70% світового ринку соціальніх сітів і 26.8% світової цифрової реклами і т.д. і т.п.
Хап цикли і призводять дл того, що із робітник для системи вартує менше, ніж в справді є. Втрати експертизи будуть коштувати грощі, та при монополії — вони є.
Зараз навіть цікавіша історія.
Коли ШІ досягне рівня — зрозуміти вже написаний код та вміти його переписати —
почнеться рух 95% вже колись-кимось написаного застарілого ПЗ. Не рефакторинг. Переписування. Тому що його переписати на нову архітектуру тепер значно легше.
До ШІ ери всі девелопери задовільнялись 5% пирога, там де писали нове або дописували.
Зараз ШІ частвоко зменшує ці 5%, але одночасно відчиняє інші 95% ринку легасі коду.
Роботи стає більше і це повністю корелює, наскільки ШІ стає розумнішим.
код додатків й ос стане неактуальним. як явище
Це мені нагадало сцену з Термінатора 2.
Де на парковці досконалий «рідкий» термінатор намагався наздогнати застарілу модель термінатора який їхав на авто. Тобто, «рідкий» термінтатор звісно швидко бігав, але не настільки швидко, щоб догнати старе авто. Значення інструмента та рантайму спеціалізованого виконання нікуди не дінуться.
щоб... — що(у випадку що вище)?
For the product to work.
The functionality of the product is it’s source code. Not the history of AI prompts made by the vibecoder. AI prompts are just events put to the engine — generative AI. The do not repeatedly produce the same state even if the history of prompts is replicated. And if something goes wrong, it has to be fixed in source code, not in prompts history.
не принижуйте поняття
I am not understating anything.
Generative AI in terms of software development is classified as code completion/code generating tool.
There have been a lot of frameworks back then which relied on code generation. This is just more general one. This didn’t make the coding obsolete.
man hört was man hören will©
одні мамкині поліглоти, а як глянеш огляд зепе на ДОУ, то обняти і плакати
)))
Цей рівень і називається — AGI.
А зараз, зустрічав дослідження, що GenAI навіть код розуміє послідовно:
Те що на початку сорца краще, що в кінці — гірше.
Для цього треба навичка мислити — абстрактно.
Бачити не рядочки коду, а як я кажу ще до епохи ШІ:
Бачии не креслення у 2D — а той 3D об’єкт що вони відображають. Щоб подивитись на той 3D об’єкт під різними кутами.
GenAI цього не може. Тому й стільки дискусій і тюнінга ШІ агентів, harness — щоб якось приборкати відсутність такого вміння. Тому й з коробки — взагалі фігню якусь робить :)
А вміння бачити 3D сутності у коді — і відрізняє досвідченного програміста від початківця.
І дивишся на код від GenAI, «ех, ти молодець звісно, але — не бачиш ти, про ЩО ти написав...»
Ші інструмент для людини, але не замінник людини принаймні ще років на 10.
в широком смысле — да, но какие-то узкие профессии уже заменил. транскрибаторов, перевод заполненных бумажных форм в цифровой вид и тд. раньше это реально все делали люди.
Думаю, все змінилося значно сильніше ніж здається. Простий приклад — психолог і ШІ. Всі мої клієнти так чи інакше розповідають що консультуються з того чи іншого приводу з ШІ по питанням психології. Це означає що зайвий раз люди не звернуться до психолога.
Далі — переклади. Раніше, щоб написати офіційного листа в Польщі, треба було звертатися або до носія або до перекладача. Зараз — ШІ.
Юристи. Будучі іммігрантом доволі часто є потреба подавати ті самі доки по легалізації, всякі скарги і т.п. Раніше за це все біг би до юриста. Зараз — ШІ.
Репетитори. Зараз вчу польську з допомогою ШІ. Я маю книжку по граматиці, є вправи. Пишу — ШІ пояснює.
Адміністрація сайта — раніше треба було шукати знайомого щоб він щось там глянув чи пофіксив за недорого. Зараз — ШІ.
Таким чином всі ці професії не померли, але ШІ у кожної з них відібрав якусь частку пирога. І як би юристи, програмісти, репетитори не казали, що живу людину ШІ не замініть, і це правда, але буде відбуватися скорочення.
якшо моделі вийдуть на плато то точно)
Ці дослідження треба інтерпретувати так:
Дефолтний ШІ з дефолтним тулінгом і дефолтними інструкціями на рандомному проекті оверінжінірить більше, ніж досвідчений розробник, який провів на тому проекті пів свого життя.
Але ж такого в реальному житті не буває. У тебе скіли, тулзи, які заточені на конкретний проект, з правилами і інструкціями які заведені в цьому проекті, з хуками і ревью циклами. Ти кастомізуєш все під своє бачення ідеального коду, і агенти, слідують цим інструкціям при правильному сетапі. Інше діло що нудно цей сетап тюнити, інколи простіше просто руками код допилити ніж шукати де і які інструкції прописати.
Для такого твердження треба ще довести, що такий тюнінг можливий в принципі для широкого спектру застосувань.
А це нікому ще не відомо, більш-менш стійка статистика буде років через пʼять, не раніше.
з лінкеду свіже:
Vatsal Shah
Co-Founder & CTO @ Speak AI
2025: 90% of the code is written by AI.
2026: 100% of the code is written by AI.
2027: 10% of the code is written by AI, and senior engineers are paid 10x more to clean up the mess.
Honestly, I can see this happening.
Взагалі, лінкед цікаве дзеркало.
Пару років тому усякі CEO писали що все, програмісти скоро стануть не потрібні!
CTO приблизно теж. І тільки у коментах принципал інженери обережно — нуууу, не зовсім так.
Останні місяці на фоні — покращення моделей і ШІ агентів
постів як навів — більшає.
А отих ура!!! від CEO — значно поменшало.
ну і дослідження про те ж
A recent NBER survey of executives in the U.S., U.K., Germany and Australia found that while AI use is widespread in corporations, 89% of leaders report no impact of AI on their company’s labor productivity in the past three years.
Gallup “State of the Global Workplace 2026”
www.gallup.com/...the-global-workplace.aspx
Думаю, на складних проєктах і є головна проблема: надто довго навчати, якщо взагалі можливо. А простих проєктів у них майже нема.
ссилку?
А можна кілька посилань на такі заяви? Раз всі СЕО таке писали, це не має бути проблемою нагуглити
Такого ніхто не писав. Перестануть писати код руками? Писали. Що будуть звільняти програмістів і що деякі професії зникнуть? Писали. А так щоб всіх програмістів звільнять і код ШІ буде писати — не писали, тільки ШІ дисиденти видумували ці байки і журналісти.
І на ці дослідження посилається той, хто сам вайбкодить весь час:
Що ж ти руками не пишеш якщо вайбкодинг тебе не прискорює то?
Проблема не в АІшці, в процесах компаній, чим більше ентерпрайз, бюрократії і менеджерів, тим менший вихлоп. Ну і рівень використання різний, може бути антропік який фігачить фічі кожен день, а може бути якийсь банк де тьоткам в бухгалтерії ліцензію копайлет за 10 баксів купили. І ті і ті ШІ використовують, но є нюанс.
Щоб було 10х треба щоб попит перевищував пропозицію в ті х10 разів.
Глянувши на ринок США і рівень безробіття серед ІТ, швидше буде навпаки.
Та і вже так є останній рік-два
да, да, даешь установку «хули ты пишешь как школьник, который вчера выучил ctrl-c ctrl-v? пиши сразу как синьор с двадцатилетним опытом!»
и опа! сразу выдается идеальный код!
зы. периодически claude-opus не может с первого раза корректно отрефакторить класс на пять строчек. безусловно, это все из-за того, что ты не засрал ему контекст мегабайтами своих супер инструкций, соглашений, хуков и прочего мусора.
Помимо известных, дискутируемых проблем и тонкостей использования ИИ есть еще одна, которую как-то упускают
крайне тяжело поделится опытом. У каждого проекта столько уникальностей — что чей-то успех в примении вообще ничего не значит, потому что неприменим никак, и требуются свои наработки, совсем другие.
То есть по ИИ невозможно сформировать бест практис. На сейчас конечно.
Даже гайды от Open AI и Антропик только на первый взгляд дело говорят. Для старта можно.
Но чуть серьезней — сами их авторы не знают, как толково вкрутить ИИ в организацию, проект, разработку.
И получается нелепая ситуация регулярно — у одних работает! а у других совсем ничего кроме мороки и плясок с бубном. И по традиции первые считают что вторые тупят.
И успешным скорее просто повезло, чем они собственным умищем постигли как использовать ИИ.
А частіше інший варіант — вони постійно в своїй роботі робили тривіальні речі (які зараз дійсно LLM роблять досить добре), але в силу недостатньої обізнаності впевнені, що робили якийсь rocket science.
Угу, про рокет сайнс розказує iOS Developer, лол.
Я би по іншому сказав, чомусь кожен рахує що він робить якийсь рокет сайнс а всі навколо нього — якесь говно. По факту, рокет сайнс це1-2% задач. Все інше це тривіальні речі. Тому, чому ви дивуєтесь що АІшка це оптимізує?
Що по вашому взагалі таке рокет сайнс? Ви можете навести приклади? Високонагружені бекенди, супер ефективні кеші, процесинги, алгоритми, ML? Для АІшки це не набагато складніше ніж умовний рест сервіс і інженери які цим займаються так само вайбкодять агентами. Той же Картати, який займається академічними речами, очолював автопілот Тесли, робить інші різного роду хардні речі все своє життя, вайбкодить 90% часу. Чи це не достатньо рокет сайнс?
Чи це код посадочного модуля на місяць? Там по слухам такий же говнокод такої ж якості як і в звичайному софті. Працюючий, но говнокод.
Чи це вузькоспеціалізований софт на якихось старих мовах чи спеціалізованих мовах? Так, тут ЛЛМки не сильно допоможуть так як недостатньо даних для навчання і низький пріоритет таких даних, але я би не назвав це рокет саєнс.
If you have a multi-million lines of code product which consists of dozens of repositories and tenths of thousands files — good luck for AI to figure out what’s going wrong there, especially if this software interacts with many specific hardware configurations where hell-knows-what is happening in some scenarios.
It can only help to analyze the gigabytes of logs to quicker figure out where things gone wrong. But still, the old-good grep does exactly this just fine.
Це ти типу серйозно? Це середняковий проект, у нас масштаби в рази, я би навіть сказав на порядок більші. Плюс пів мільйона тікетів в джирі які ми самі проіндексували. Про логи взагалі мовчу, але ми їх ще поки не прикрутили. Дуже складний фінансовий домен, що навіть тьотки які працюють 5+ років багато чого не знають і в документацію лізуть чи девелоперів питають як воно там в коді працює.
І навіть без логів, наші агенти розрулють нетрівіальні кастомер кейси з саксес рейтом 80%. І це ми ще толком не тюнили.
Саме так. Агенти грепом творять чудеса і за секунди, максимум хвилини знаходять в гігабайтах коду те, що девелопер шукав би годину-дві мінімум.
Це ж ти здається всім притикав, що люди не тюнять тулзи тому виходить шлак?
Я тюню машини, у людей (не у всіх, у ШІ скептиків на яких я посилаюсь) — самокати, максимум велосипеди. Їм спочатку ще треба машину зробити.
Ті, у кого машини, їм нічого об’ясняти не треба, вони і так все знають і розуміють.
Just Maths. Very complicated, but still maths. All the logic is inside the code. The code doesn’t interact with remote black boxes which have their own codebase and unpredictable behavior. That is absolutely predictable system, no matter how big it is.
Perfect for AI which can iterate through it.
Unfortunately, not all the software works like this. Some software interacts with the devices from real world with unpredictable behavior.
і Ви кажіть © (тм)
то в скільки раз скоротили вас піся того як АІ порішав півмільйона тікетів з Джири?
Тобто в системі де 500 тис тікетів, та скоріш за все надцять мільйонів рядків коду, забули прикрутити логи. То це вам gpt нарешті порекомендуав додати логи ? 😅
Я думаю це просто погане формулювання. Вони не логи забули прикрутити як такі, а тулінг щоб агенти що розгрібають сапорт реквести могли ці логи бачити у притомному вигляді.
Логи є, до ШІ ще їх не прикрутили. Він і без логів норм справляється.
Доречі твоя цифра в 500к тікетів на джирі мені нагадало близький колапс в опенсорц. Там теж мільйони тікетів ніхто не може розгрести, а ШІ лише бомбардує слоп фіксами без розуміння всієї картини.
А ще чув цікаву думку, що якщо навіть і був би надпотужний ШІ, його не будуть релізити. Бо кожен мамкін хакер за його допомогою зможе знайти вразливості, які «спали» в ПЗ десятиріччями. Все теж саме стосується фондових ринків і тд.
Тобто в найближчі роки ШІ навмисно будуть робити, щоб лише жрав добре токени.
Так то ж не активні тікети, а тікети за 10+ років існування системи, кожен тікет несе якусь частину інформації про систему, про прийняті рішення, reasoning шкіряних мішків. Це все варте набагато більше ніж документація. Ну вот агенти там активно риються в пошуках історії, по крупинкам збирають інформацію про той чи інший функціонал, що в купі з документацією і актуальним кодом достатньо для вирішення 90% нових тікетів навіть без логів.
віллі вонка мем жпг
Якщо в тебе надто обмежений світогляд, щоб уявити складні задачі на мобільних пристроях, то це тільки твоя проблема. До того ж, ти читати не вмієш, я ніде не казав, що я займаюсь rocket science. Як і не казав протилежного. Мій коментар взагалі не апелював до мого досвіду як розробника.
А ще ти взагалі довбаний анонім. І твої фантазії про чарівний AI, що вирішує усі проблеми, нікому не цікаві без підтверджень. Бла-бла-бла по 100500 повідомлень на день кожен дурень може робити.
дело не в этом. уже просто набили оскомину утверждения программеров, что дескать, они ежедневно решают проблемы колоссальной сложности, которые только им под силу, никакая LLM не справится. камон! мы тут все не первый день в профессии. 99% проектов в любом домене с технологической точки зрения совершенно тривиальны и повторимы. и 80% задач в таких проектах на настоящий день (17.04.2026) поддаются автоматизации с помощью агентов либо полностью, либо частично.
если для тебя твои задачи на мобильных устройствах — сложные, ну это говорит только о твоей квалификации и все. пару лет назад еще можно было апеллировать к тому, что LLM плохо справляются с генерацией кода, но сейчас — это уже чистой воды skill issue. мне поэтому смешно читать такие тейки, как у тебя или у Дьяченко, который отмечается в каждой ветке с рассказом, как он класс из 5 строк сгенерить не может. либо вы научитесь, либо не сможете найти следующую работу.
код то він генерить, вопрос в качєстві
На цю тему краще поговорити через пару років. Бо є ймовірність що відбудеться дещо протилежне й з пошуком наступної роботи більші проблеми будуть як раз у євангелістів які «припинили писати код руками». Бо це зараз вони виїжджають на скілах, що набули за попередні роки, але скіл який не використовується постійно, деградує (а умовні 20% задач які без людини не вирішити нікуди не дінуться). Але це не точно :)
Втрачається лише скіл написання коду руками. Ось як раніше народ не міг на папері код писати після років в кодингу в ІДЕ, ось те саме відбувається з вайкбодингом — вроді код розумієш, а сам написати не можеш. Але АІшний автокомпліт і тут виручає.
Що не втрачається:
— читання і розуміння написаного коду, навпаки покращується так як ти бачиш більше різноманітного коду за день а не сидиш в одному класі цілий день видрачуєш якусь функцію
— розуміння архітектури, інструментарія і екосистеми, також покращуєш так як ти попросту більше розробляєш проектів і модулів різного типу, з використанням різних платформ, а не сидиш рік на одному
Все вірно, тільки навпаки :)
Код подивитись — це не кінцо подивитись. Ти зараз бачиш в коді патерни погані та корисні, у тебе зараз тригериться інтуіція («стоп, а це точно вірно?» чи «опа, а тут можуть бути дракони») тільки й виключно тому, що ти свого часу витратив десятки тисяч годин на колупання в цьому руками.
Перестанеш писати й дебажити руками — ти звісно не втратиш здатності читати код й _загалом_ розуміти що там відбувається, але твої ревью будуть все більш більш shallow. Спочатку ти перестанеш бачити тонкі нюанси (ну типу цей код на сі виглядає простим і зрозумілим, але оте UB яке ти вже не бачиш насправді перетворє його в сміття), а пізніше й нормальну архітектуру від рахітектури відрізнити не будеш в стані.
Але не буду тебе переконувати — сам побачиш.
Я подивився на динаміку знань за рік. Не розумію чому ця динаміка вдруг має розвернутися в іншому напрямку.
Ось в чому ти правий це в shallow ревью кода. Але не тому, що розучився, а тому, що час не хочу тратити. У мене ШІ основне ревью робить (кілька промтів, кілька агентів, а не просто /review). Я лише дивлюся наскільки важливі рекомендації і дивлюсь на загальну картину, на дизайн, інтерфейси, де і які зміни, і пробігаюсь очима на очевидні косяки в імплементації.
Шкода тільки що до 20% так справа і не дійде, розгрібаючи ті 80%...
Ще один неспроможний вірно прочитати одне коротке повідомлення. Це на вас так активне використання LLM впливає?
С генерацією кода часто (не завжди) справляються добре. Десь на рівні джун+/мідл-. З підказками по умовно стандартним ворнінгам/помилкам також інколи дуже економить час, коли ти раніше з цим не стикався або стикався рідко.
А от з вирішенням задач все ще усе погано. Навіть по тих же стандартних помилках якщо не виправляти самому на базі рекомендацій від LLM, а дати агенту виправляти — якість дуже сильно падає.
вот. про это я и говорю, почему-то нашим программерам свойственно сильно преувеличивать свою ценность и недооценивать современные технологии. закостенелость мышления какая-то, что ли. я лично воспринимаю это просто как форму естественного отбора.
речь идет про абсолютно не уникальные вещи, вообще не project specific
речь идет о вещих, которые вообще релевантны в большинстве ЯП, типа
не пиши методы на три экрана
никаких «магических цифр»
не пиши циклы на пять уровней вложенности
и так далее
именно о том топик :)
методы борьбы, научения ИИ есть, но, как выше писал — у вас могут оказаться бесполезными, и нужно вникать именно в вашу специфику.
а с коробки — slop сode и будет.
что вайбкодеры и генерят сейчас в бешеных количествах.
Ну вот бачиш, я сонетом вирішую складні задачі з кратним ростом ефективності використовуючи опус лише в 5% випадках. А ти не можеш функцію на 5 строчок відрефакторити опусом. І у кого тут проблеми з промт/контекст/agent інжінірінгом?
Повністю згоден. Зробив сетап з 32 агентів. Кожен агент відповідав лише за друкування однієї літери. Всі разом надрукували мені «Война і мір» тільки краще. Все завдяки тому, що чітко вказав в скілах що агент друкує лише одну літеру.
Дякую, дуже дякую !
а що з мавпами не вийшло?
Бери вище, мізки Больцмана.
Ну якщо це ваше розуміння ефективності то флаг в руки. Ефективність коду дід так само мабуть міряє — чим більше строк кода і абстракцій тим краще.
Ну це мабуть дуже ефективно і продуктивно коли агенти після написання коду будуть перевіряти купу всього. Чому б відразу код нормально не писати?
а от тому що
Немає у GenAI абстрактного мислення.
в мене особисто крутяться ідєї, як спробувати налаштувати ШІ систему — імітувати його, і писати відразу правільно, а не потім палити токени на виправлення.
Та не тільки в мене звісно, і не такі як в мене.
Але поки не попробував, може маячня.
І нечасто зустрічається і у інших.
А розвиток йде — бульдозером:
Нехай ШІ говнокодить! Будемо думати як зробити щоб інші моделі те рев’ювали, відправляли на доопрацювання, на рефакторинг і так декілька разів!
чули про x10 інженерів?
То ж правда. Тільки не про інжеренів. А про ШІ агентів, які витрачають x10 токенів, бо абстрактно думати не вміють.
Поки токени у кодінг планах дотаційні — то навіть і вайбкодери роблять щось працююче, у такий спосіб розробки.
не получится, что даешь то и получаешь, а иллюзию разумности создает рандомный сид. если скачать любую модель локально и в конфиге запретить рандомить, то сразу становится видна ущербность модели
надо пробовать.
дело ж в том что полное мышление возможно и не понадобится.
Вот возьмем современные линтеры. Если смотреть на то что они могут из моей юности, 90ых — так это ж чудо какое-то.
А они совсем не ИИ. просто эвристики.
Тому що відразу, нормально, руками це тиждень роботи. Агентами такої же якості код — день-два. Просто працюючий код не надрачуючи на якість і заведені в компанії/проекті/особисті стандарти — година-дві.
Звісно не одним промптом і не однією сесією
Звісно маючи певний досвід і якийсь налаштований воркфлоу щоб одні і ті ж промпти не писати знову і знову.
Звісно допилюючи щось руками.
Бонус: поки агент щось робить, ти вільний.
Чувак, тобі не смішно зі своїх метрик?
Ну реально, навіть якщо цеглу кладуть, різниця х2 між різними виконавцями в межах норми. Коли кажуть про розробку ПЗ, то там взагалі різниця в х10 це норм. Досвід, інструменти, готові рішення. Все різне.
Як цими всратими цифрами взагалі можна когось переконати що твій приріст продуктивності не в межах статистичної похибки ?
Дивлюсь на останні графіки, тех знову набирає людей шо скажені. Повернулись до цифр до війни.
Дєд, я же за себе говорю а не за тебе. Мені якось видніше де і яка у мене продуктивність. Я же не говорю що у всіх так. У всіх різні скіли і навики використання агентського кодингу.
Ти головне прийми таблетки і попрактикуйся, всі спочатку туплять і здається що руками було б швидше. Но це проходить через2-4 тижні, якщо не повний жопорук.
То ти скажи, в яких метриках хоч виросла твоя продуктивність. Ну наприклад, стала в два рази більше зарплата, тому що став в два рази більше перформити.
Якщо ти став генерувати більше слопу за який додатково ніхто не платить, тиж розумієш ... що в очах великих дядів твоя продуктивність лишилась на тому самому рівні якою і була, за вирахуванням що маляті тепер треба купляюти токени.
а я знаю ответ, у него в рабочем дне теперь больше времени «оно компилируется», и как будто бы кажется что вот эти дырки это чистая выгода ведь можно заниматься чем угодно, ну как чем угодно.... кофе сделать, котиков лайкнуть, почту проверить, про слоп твиттер почитать, на доу писануть. и как будто бы все верно, кроме того что это не продуктивность выросла, а прокрастинация
несколько недель работы в таком формате и проект можно просто выкидывать в мусорку.
потому что с ним уже ничего не может сделать агент: одну фичу добавляет и три старых при этом ломаются.
и потому, что этот код уже не сможет причухать никакой человек — он с ума сойдет, его читая.
ну, не за пару недель, но за пару месяцев да, проект превратится в говно, в сравнении с которым «индусский код» идеал качества.
об этом сейчас много где и дискутируется. серьезно вкручивать ИИ в разработку стали ведь где-то с лета прошлого года. И пошли первые звоночки.
а так, встречал цифру — годик, полтора — и мы еще с теплотой вспомним многолетние легаси кодовые базы до эпохи ИИ.
вкрутить на самом деле можно. И есть смысл.
Но оно ж как всегда, как и раньше — какой менеджмент даст время на проектирование и рефакторинг? «Гоните в прод, побыстрее, давай, давай!!»
Ну народ клод кодом сейчас массово и гонит.
Думаю, що юзер кейс: забацати MVP задешево з допомогою AI, отримати перших клієнтів, а далі набрати звичайних розробників.
1. Тебе ніхто не заставляє в такому стані комітити код
2. В багатьох випадках це acceptable, залежить від проекту, модуля, скопа. Ну допустимо у тебе 100500 парсерів чи адаптерів до різних форматів. Кожен ізольований в окремому файлі чи папці. Тобі не похєр як він там парсить і яка архітектура того парсера? Скільки ти раз будеш туди залазити? Я краще напишу 100 парсерів і 100 тестів до кожного парсера і піду далі, ніж буду видрачувати 1 парсер до ідеальної архітектури.
Вроді здоровий дядько, а таке враження що досвіду 0, скрізь дієш по методичці і книжкам замість того щоб використовувати здоровий глузд.
ну так ты же хочешь получить 3x скорость
ну как бэ идеальный случай: правильная архитектура, есть хорошо продуманный интерфейс парсера, есть пять, нужно дописать еще один.
но потом оказывается, что интерфейс чуть не подходит под новый формат. болванчик интерфейс расширяет (неудачным образом), потом под эти изменения меняет все пять существующих решений.
тесты на новый парсер пишет криво. бесконечный копи-паст позитивных кейсов, из проблемых кейсов покрыта от силы десятая часть.
а потом еще оказывается, что парсер этот стоит на untrusted потоке данных и ошибки в нем это прямая дорога к критическим уязвимостям в системе...
а так — да. ***к-хуяк и в продакшен.
Я отримую 2-3х швидкість з нормальним кодом.
А якщо просто робочий не дивлячись на якість, там всі 10х.
Я же вроді написав це в оригінальному коментарі, но ви все-одно своє додумали.
Іменно. Якщо у вашому проекті немає місця для АІшки, якщо АІшка безбожно тупить і не можна без присмотра ні на хвилину її залишити, тут одне з двох:
1. Не вмієте в ШІ інжиніринг
2. У вас спагеті говнокода
Тому що так не робиться. Якщо бачиш що інтерфейс не підходить, берез парочку нових форматів які не влазять, просиш АІшку їх проаналізувати, просиш проаналізувати теперішні інтерфейси і імплементації, і разом бренйштормите як би мінімально ці інтерфейси розширити або змінити. Потім розширяєте. І якщо треба змінити, я би подивився на вас як би ви руками без ШІ сотню існуючих інтеграції адаптували і тести переписували.
Ніхто із ШІ євангелістів не говорить що ШІ ідеальний і безпроблемний. Просто треба знати його ліміти, можливості, і те в яких задачах як використовувати.
так это ж прямо мои слова )
зп теж 2-3х, а часом 10х?
Лол.
ну можете ще посміятись — більшу частину коду на Джаві, я теж не писав.
а писав автокопліт. десь у році ще 2014ому.
та й далі, більшу частину кода генерував автокопліт у IDE.
а ви як, мабуть великий фанат голого Vi?
Сергію, та прекратить вже на особистий рахунок усе сприймати.
Лол у контексті:
ШІ — начебто поганий програмист, але його скилів достатньо, щоб з осені 2025 року вже не писати код взагалі.
Чесно, мені нравиться стан потоку, коли я пишу код.
Я полюбляю свою професію і ті емоції що вона мені дарить.
Вважайте мене старомодним.
ну да, я код не пишу з 90их.
клавіатура пише.
ви точно — програміст?
бо ви схоже ніц не знаєте у чому суть роботи — програміста.
а як типовий невіглас вважаєте що по клаві княпати?
1й пашол
www.youtube.com/watch?v=HAlnMXyvDUQ
нащо нам цей кацап?
Я думаю, більше проєктів було закрито або якось «зашейплено», що тільки окремі користувачі помітили, що щось погіршилось. Sora був тільки найпомітнішим.
Because AI is not a developer))
It’s an automated code-generating and code-analyzing tool
не тільки програміст, це ще 70 років тому в Голівуді обіграли в комедії
www.youtube.com/watch?v=Fsoaa6R_0lw
«абстрактне» зайве (бритва .Оккама)
Абстрактне значно знижує енергоспоживання, або обмеженість потужності.
Що для людського мозку, що для датацентру.
GenAI зжирає токенів стільки, як не більше, коли фіксає баг, для коду, який сам же нагавнякав.
Якщо йому допомогти зразу структурувати код, і тд — то він значно менше витратить токенів.
Так що відсутність абстрактного мислення можна вимірювати у грошах.
А у людей — в дурній роботі, бо не подумав спочатку.
А якщо замість нього написати код, то взагалі не витратить.
тобто ви код пишите олівцем у зошиті, чи як?
клаві не довіряєте замість вас писати?
чи пройшли цей етап, і довіряєте, але не довіряєте IDE з автокомплітом, і пишите код у нотепаді принципово?
Взагалі я про те, що структурування — це значна частка роботи IT-інженера.
Якщо ви виконкуєте цю частину работи замість ШІ, то звісно ШІ витратить меньш токенів.
Проте.
Я повернувася до розробки олівцем у зошіті, так.
Я малюю системи, зв’язки між модулями і блоками.
І я знов почав получати кайф від професії.
перечитайте заголовок топіку.
перечитайте топік.