Мій досвід каже, що більшість логічних багів це непрорахований варіант. Тому аналогія з шахами мені здається дуже вдалою. Якщо у нас код це перекладання з JSON в базу, то там варіантів майже немає та помилятися ніде.
Дозвольте мені декілька уточнень/спостережень.
Я не пам’ятаю, щоб хтось змагався з ШІ. Моє оригінальне повідомлення — це тільки хайлайт про імовірність помилок, невизначеність відповідальності та доцільність використання ШІ в окремих рамках.
Як інструмент і кодинг-ассистент — так, LLM цілком ок, якщо перед цим є дизайн, план і рамки. І тут ми, здається, повністю згодні.
Але саме в цьому й різниця, про яку я намагався сказати у відповіді.
тестирование/аналогия с шахматами мало имеет общего с использованием кодинг ассистента. мы тут не соревнуемся кто тактику найдет. мы используем ассистента для работы
точно также я не понимаю примера с задачей «напиши мне движок».
Чемпіонат із шахів серед LLM на Kaggle якраз дає відповідь на це питання. Весь цей контекст і розуміння закінчуються там, де треба реально рахувати варіанти: вона робить нормальний код, але може не побачити тактику. Наприклад, та ж багатопотоковість.
Мені трохи дивно чути таке питання від людини, роль якої
как раз про вот эту блабла стратегическую не кашу
Я не маю короткої відповіді, але спробую пояснити, як зможу.
пользуйся агентами с ризонингом
І навіть вони помиляються з певною вірогідністю.
да даже one shot с первого раза дает хороший код.
З певною вірігодністю.
З 6-го
а я тебе писал совет: не используй one-shot, пользуйся агентами с ризонингом. да даже one shot с первого раза дает хороший код.
просто очевидно же, что нет цели получить результат, есть цель — найти причину.
ну т.е. ты 7 раз нажимал на кнопку Retry, пока не получил ответ, годный, чтобы притащить на форум и выстроить на нем цепочку утверждений?
З 6-го, я помилився, але тут було не про це. Вчора мені вдалось отримати цей варіант коду з першого разу.
«цікаву» відповідь я отримав з 7-го разу
ну т.е. ты 7 раз нажимал на кнопку Retry, пока не получил ответ, годный, чтобы притащить на форум и выстроить на нем цепочку утверждений?
и что это, как не attitude?
Коментарі