Нє, я в такі тоталізатори не граю, тикати пальцем в небо яка модель в кінці якого місяця буде в топі якогось бенчмарка.
Я за себе не переживаю, я піду після того як попруть ШІ дисидентів.
Єдине про що шкодую що не можу ситуацію використати, всі самі смачні ШІ компанії приватні і недоступні рітейлу типу мене, залишаються лише гіганти типу гугла і мети де апсайду не так вже й багато. А опенаі, антропік, з тих пір як я за них топив, виросли в 10 раз. Вот і виходить незручна ситуація, що виявився правий, но бенефетів від цього багато не отримав.
www.citriniresearch.com/p/2028gic
Всім кабздец
У мене логіка що ризики і втрати допустимі якщо переваги їх перекривають.
Тим більше допустимо, де ризики мають пряму кореляцію з кривизною рук користувача, де він шкодить лише собі.
По вашому вони пул реквести роблять тому що можуть, а не тому що треба? Мазохісти?
Якщо дотримуватися здорового глузду, то тут одне з двох:
1. Інженери дійсно стали більше задач виконувати
2. Якийсь end to end ШІ цикл налаштували, де ШІ генерує пулл реквести достатньо гарні для мержа (може вони невеликі, но початок покладений)
Ну тобто якщо один літак із тисячі падає, то всі мають пішки ходити? Чи як це працює в вашому світі?
Чи давай згадаємо скільки даних витрачалися через косяки людей. Чи ето другоє?
Плюс в даному випадку це збіг кількох обставин — глюка ШІ, кривості АРІ команди павершела, шкіряного мішка який дає автоматичний, повний доступ до критичних даних і запускає ШІ без сендбокса.
Я ж кидав вже приклад, проста задачка, згенерувати JOLT трансформацію для простого JSON’а.
Це штучна задачка, яка до того ж легко вирішується мільйоном способів, но ти навмисне загнав агентів в вузькі рамки якоїсь ноунейм бібліотеки (JOLT).
В любому випадку, вирішується елементарно і просто. Якщо JOLT для тебе важливий і це основа твого проекту, то просто пишеш скіл для JOLT з прикладами типових трансформацій. Як пишеться скіл? Да тим же самим клодом (під клодом я маю на увазі клод код звісно), кажеш погуглити документацію для JOLT і зробити на її основі скіл. Можна context7 MCP сервер підключити, якщо бібліотека хоч трохи відома, вона там має бути.
Це базові знання агентського інжінірінга, які я накидав за 5 хв, які з легкістю справляється з твоєю задачкю. А ти навіть до цього етапу не дійшов і підняв лапки, і при цьому рахуєш себе професіоналом в агентській інженерії.
Мого досвіду достатньо, щоб переконатися, що жоден агент не зможе мені ефективно допомагати на даному етапі розвитку AI через брак вхідних даних, на яких модель можна було натренувати, та рівня похибки у векторах, які будуть робити результат гіршим за очікуваний.
Вот, черговий раз доказ що ти дупля не відстрілюєш різниці між агентом і ЛЛМкою. Агентський стек для цього існує щоб підсунути моделі недостающі знання, в твоєму випадку це знання про JOLT які підсовуються через скіли і context7 MCP сервер. Це базові речі agent and context engineering.
Мені не треба буде це робити, за мене це зробить бізнес, який втратить черговий мільйон від помилки самовпевненого розробника, який не спромігся прочитати навайбкожене.
Поки я бачу як летять акції IBM на 10% за день (тому що агенти змогли в кобол) і акції секьюрних компаній (тому що агенти успішно ловлять баги і дири)
Я не говорю що вони в принципі не існують. Я говорю в контексті ШІ, що неможливо виміряти. Все дуже залежить від інструментів які використовуються, досвід роботи з інструментами, мотивація. Ти можеш робити роботу швидше, но зарекордити той самий час, просто читати реддіт замість того, щоб брати наступну таску.
Всі доступні «дослідження» рахують якусь середню температуру по лікарні, прирівнюють людину яка написала кілька десятків промтів і у якого агенти паралельно рутину роблять (яких одиниці в любій компанії), до людини у якої промти в стилі «зроби мені ААА без помилок», до людини яка взагалі ШІ не використовує, максимум безкоштовний чатгпт замість гугла (і таких більшість в компанії).
Ну да, машини ламаються, літаки падають, особливо в кривих руках при недбалому використанні і обслуговуванню. Одні і ті ж літаки в якійсь Уганді падають щороку, а в Австралії — раз в 30 років.
В чому новина? В тому що ШІ глючить? Ну так для цього і треба пів року щоб зрозуміти обмеження, прокачати чуйку, написати промпти, створити воркфлоу.
Той факт що для тебе агент і ллм це те саме і дає такий самий результат говорить лише про те, що ти плаваєш на поверхності і взагалі не занурювався в агентський інжінірінг.
Тому пиши як є: мого досвіду з агентами поки недостатньо для побудови воркфлоу для ефективного вирішення моїх інженерих задач.
І не намагайся переконати тих, хто вже це зробив, потратив на це пів року і отримує дивіденди, що вони довбні. Це як доказувати велосипедистам що їзда на двох колесах неможлива і треба мінімум 3, бо ти спробував і коліна розбив.
— та було ж купа досліджень що ШІ говно і не працює, ніякого бусту продуктивності і лише щкодить
— посилання на ці дослідження будь ласка
— во (посилання на ліве дослідження)
— ви самі то хоч саме дослідження читали? Там нічого із заявленого немає, і прийшли до зовсім іншого висновку
— ці ЩІ евангелісти продовжують ігнорувати факти і цифри
— як факти і цифри? Приведи їх
— ще й обзивають довбнями всіх, хто не згоден з їх думкою
— так посилання на дослідження будуть? Факти, цифри?
— ви нікчемні, всеодно будете їх відкидати
Ви зараз підміняєте метрики.
Це єдині тверді метрики які доступні і на які можна спертися. Коли людина заявляє що ШІ евангелісти ігнорують цифри і факти, я хочу побачити про які цифри і факти річ. Но вони в упор не хочуть їх приводити так як їх немає а ті що є, їм не зручні, доводиться оправдуватися що «мільйони мух не можуть помилятися»
Тут або два Шпака пишуть, або у тебе роздвоєння особистостей. В одній гілці критикуєш ШІ і розказуєш що користі немає і буст продуктивності бачать лише ШІ евангелісти в своїх рожевих снах. В іншій пишеш що сам постійно використлвуєш (мазохіст?) і що ШІ має невеликі недоліки.
Це з якими цифрами і якими фактами? З якою швидкістю росте кількість юзерів агентів? З якою швидкістю ростуть підписки і ревеню ллм провайдерів? Так вони не на твоїй стороні.
Приведи конкретні цифри і факти. Тільки не треба тих «досліджень» що джуни з чатгпт 4о на одній задачі 30 хв не показали особливого приросту швидкодії. Не ганьбися, перевіряй на що посилаєшся і сам почитай, а не цитуй когось «булись же десь дослідження»
Ніколи не казав, що ШІ — погане. Має недоліки — так. Але погане — ніколи.
Да буквально годину назад:
Оптимізація лайна не робить продукт цукеркою.
Вот читаю ці потуги, і не розумію як це працює. Це якби чувак з маскою для снорклінга розказував дайверам що акваланг це те саме що і маска і взагалі для дайвінгу ні сноркл ні акваланг не працює. Я би ще зрозумів якби це розказував професійний фрі дайвер, якому тільки маску дай (хоча він такої хєрні молотити не буде), но коли це робить сноркліст в рятівному желеті який до того ж ще маску задом наперед надів... яку ціль він переслідує?
Тут 90% мають інший досвід чи не поділяє мою думку, но «довбнями» я називаю лише кілька чоловік. Не задумувався чому? Щось в твоїй теорії не сходиться.
Не говорячи вже що довбнями я нікого не називав і на особистості не переходив, просто прямо вказував на безграмотність.
Весь той тулсет, що імплементований в так званих агентах, зроблений для того, щоб універсальну та непередбачувану річ зробити більш утилітарною та корисною.
Мінуси? Якщо це працює і робить ЛЛМку на порядок кориснішою, які мінуси? Саме на порядок, не в рази а десяток разів. Як це можна називати тим самим? Тільки безграмотна людина, яка не розуміє матчастини може казати «та то те саме». А потім ще обурюється коли поправляють.
Зможете пояснити?
Вже мільйон раз пояснювали. Взагалі поняття контексту в сучасному агентському воркфлоу де стейт і пам’ять зберігається в файлах і де активно юзаються сабагенти з чистим контекстом — дуже розпливчисте.
Не треба класти свої слова мені в рот. Я довбнями рахую лише тих, хто називає мене довбнем, бо їх досвід з безкоштовним чатгпт після кількох сесій гірший, ніж у мене з агентами, яких я пів року налаштовував.
Тобто Віталій не тільки в ШІ сфері поверхнево плаває но і в інвест сфері.
Гугловські бонди йдуть з купоном 6.125%. Не треба чекати 100 років щоб вернути гроші, достатньо 15. Через 100 років ROI буде порядку 600% + тіло.
Іншими словами, такі бонди купують ті, кому треба гарантовані 6% річних — фонди, пасивні, консервативні інвестори. Можна 40 річні бонди купити, но там дохідність 5%.
Не говорячи вже про те, що бонди торгуються, як акції, можеш в будь-який момент вийти і забрати тіло.