«Я мушу переглянути свою думку про ШІ»: як Claude Opus 4.6 розв’язав задачу Дональда Кнута

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Дональд Кнут, американський комп’ютерний науковець та легендарний автор «Мистецтва програмування», днями опублікував статтю під назвою «Claude’s Cycles». В ній Дональд розказує, як модель Claude Opus 4.6 допомогла йому вирішити відкриту математичну проблему, над якою він сидів кілька тижнів. Кнут навіть зізнався, що йому доведеться переглянути свої погляди на генеративний ШІ після цього.

Що за задача

Якщо коротко, то Кнут писав новий матеріал про направлені гамільтонові цикли.

Примітка: гамільтонів цикл — це простий цикл у графі (як орієнтованому, так і неорієнтованому), який проходить через кожну його вершину рівно один раз і повертається до початкової вершини. Граф, що містить такий цикл, називається гамільтоновим.

Задача полягала в тому, щоб знайти загальний розклад дуг специфічного орграфа (з m3 вершинами) на три спрямовані гамільтонові цикли для всіх значень m > 2. Для m = 3 Кнут проблему розв’язав сам, але далі справа застопорилася.

Його колега, Філіп Стапперс, вирішив згодувати цю задачу Клоду, використавши точне початкове формулювання від Кнута. І ось тут починається найцікавіше — те, як саме вибудовувався процес інженерної роботи з ШІ.

Як ШІ працював

Філіп вирішив не просто закинути промт. Він налаштував цілий пайплайн для Клода, змушуючи його писати скрипти і жорстко контролюючи кожен його крок. Стапперс прямо заборонив Клоду починати нове дослідження без детального документування попереднього, давши йому таку настанову:

«Після КОЖНОГО запуску exploreXX.py НЕГАЙНО оновлюй цей файл [plan.md], перш ніж робити будь-що інше. Жодних винятків. Не починай наступне дослідження, поки попереднє не буде задокументовано тут».

Під таким тиском Клод реально почав перебирати алгоритмічні підходи. Спочатку він спробував пошук у глибину, але швидко зрозумів, що простір пошуку занадто величезний (627), і без хорошого відсікання це працює надто повільно. Потім перейшов до імітації відпалу. Модель знаходила локальні рішення, але сама ж дійшла адекватного висновку, що імітація відпалу може знайти рішення, але не може дати загальної конструкції. І лише на 31-й ітерації Клод, проаналізувавши попередні спроби, знайшов закономірності в координатах і видав робочий код на Python, який успішно розв’язав задачу для непарних чисел (m=3, 5, 7, 9, 11). Цей код потім без проблем конвертували у компактний алгоритм на C.

Але, як потім Філіп зізнався Кнуту, процес був далеко не таким простим, як могло здатися на перший погляд. Клод постійно падав з випадковими помилками, після чого сесію доводилося рестартувати. Через ці падіння ШІ періодично губив результати попередніх пошуків. Також кожні 2-3 тестові запуски Філіпу доводилося нагадувати Клоду, що той взагалі-то має документувати свій прогрес, бо модель постійно про це забувала.

Але вишенька на торті була в кінці. Коли Філіп попросив Клода продовжити роботу і розв’язати ту саму задачу для парних значень m (після тріумфу з непарними), ШІ просто зламався.

«Через деякий час він, здавалося, застряг. Зрештою, він навіть не зміг більше правильно писати та запускати дослідницькі програми, дуже дивно. Тому я зупинив пошук», — розповів Філіп.

З оригіналом статті можете ознайомитися тут: www-cs-faculty.stanford.edu/...​/papers/claude-cycles.pdf

Читайте також: «Довайбкодилися»: Claude Opus 4.6 написав код із багом, який призвів до збитків у $1.76 мільйона

👍ПодобаєтьсяСподобалось16
До обраногоВ обраному2
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

🤖 «Я мушу переглянути свою думку про ШІ»: автор статті на DOU зізнався, що теж користувався ШІ.

Автор матеріалу про те, як Claude Opus 4.6 допоміг Дональду Кнуту розв’язати математичну задачу, несподівано оприлюднив нову інформацію.
Виявляється, що під час роботи над своїм переказом він... теж звертався до генеративного ШІ.

За словами автора, це не було ні експериментом, ні провокацією — просто «логічним продовженням історії».

🧩 «Я подумав: якщо Кнут може, то чому я ні»
У своєму зверненні автор пояснив, що ідея використати ШІ виникла абсолютно природно:

«Я сидів над текстом, намагався стисло, але зрозуміло викласти думки Кнута. І в якийсь момент зловив себе на тому, що роблю те саме, що й він: дивлюся на задачу, думаю, як її структурувати, і розумію, що ШІ може допомогти.

І я такий: ну... логічно ж. Якщо Кнут може переглянути свої погляди на ШІ, то я теж можу».

Автор наголосив, що не перекладав текст дослівно і не копіював формулювання — він використовував модель як асистента, який допомагав:

структурувати матеріал

перевіряти логіку викладу

скорочувати надто довгі фрагменти

і нагадувати, що «цей абзац можна написати менш нудно»

🛠️ «Я працював із ШІ майже так само, як Філіп працював із Клодом»
Автор детально описав свій процес:

«Я відкрив оригінальний текст Кнута, відкрив редактор, відкрив ШІ — і почалося.

Я просив модель запропонувати структуру, потім казав: „ні, це занадто академічно“, потім: „ні, це занадто пафосно“, потім: „ні, це занадто схоже на блог про продуктивність“.

Декілька разів модель зависала, один раз переплутала гамільтонові цикли з евклідовими, а в одному місці раптом почала пояснювати, що таке графи, ніби я вперше бачу слово „вершина“.

Але загалом це було корисно. Я б сказав — навіть терапевтично».

За його словами, ШІ допоміг не стільки з текстом, скільки з мисленням про текст.

📄 «Я не приховую цього — навпаки, мені здається це чесно»
Автор підкреслив, що вирішив розповісти про використання ШІ не через тиск чи підозри, а тому що це «частина історії»:

«Було б дивно писати статтю про те, як ШІ допоміг Кнуту, і при цьому робити вигляд, що я сам працюю виключно гусячим пером при свічці.

Я не бачу в цьому нічого поганого. Це інструмент. Він не пише за мене — він допомагає мені писати краще.

І якщо вже ми живемо в епоху, де ШІ може знайти закономірність у графі з
𝑚
3
вершинами, то, мабуть, він може допомогти й мені знайти нормальний заголовок».

🧠 «Мій висновок простий: ШІ — це не магія, а співпраця»
У фіналі автор підсумував:

«Я не став розумнішим від того, що використав ШІ. Але я став продуктивнішим.

І якщо моя стаття вийшла зрозумілішою, структурованішою і менш нудною — то це перемога.

Кнут переглянув свої погляди на ШІ. Я — теж. І, чесно кажучи, це було неминуче».

🏁 Епілог
Таким чином, історія отримала несподіване продовження:
стаття про те, як ШІ допоміг людині, була написана за участі ШІ, який допоміг людині написати статтю про те, як ШІ допоміг людині.

Кнут би оцінив таку рекурсію.

Вважаю, буде справедливим, якщо жодна людина б не читала цієї статті. Натомість статтю має проаналізувати мовна модель та дати свій висновок своїй людині.

Але є запитання. Ми точно хочемо жити у такому світі?

Це все фігня, я відкрив іншу можливість — ШІ чудово генерує python-аналізатори сигналів. Спеціалізовані, от що тобі треба від сигналу — кажеш йому і він за тебе все проаналізує, статистику покаже, всі таймінги порахує. Круть нереальна! :-D

...не в шашки, а в шахматы, и не выиграл, а проиграл

це цікавіше чим те як переїхати в село

В заголовку та початку статті зовсім інший акцент, ніж ближче до кінця, де виводиться ціла низка недоліків, які не можна упускати. Висновок має бути гібридним. Так, мовні моделі (як і комп’ютер, взагалі) можуть бути корисними в різних галузях. Але вони не стабільні і та передбачувані, тому це зовсім не «інтелект» та порівняння з людиною на разі далеко до істини, як ракетам SpaceX до центру галактики.

Це значить, що треба менше захвату та більше критичного погляду, і саме тоді від мовних моделей можна отримувати адекватну користь.

Але вони не стабільні і та передбачувані, тому це зовсім не «інтелект» та порівняння з людиною на разі далеко до істини, як ракетам SpaceX до центру галактики.

А люди прям стабільні і передбачувані. Я би навпаки сказав що він занадто добре імітує людей, і це один з найбільших мінусів.

А люди прям стабільні і передбачувані

ставлю доллар что в ближайшее время ты не переметнешься ши-диссиденты

Я би навпаки сказав що він занадто добре імітує людей

ты абсолютно прав ©

Взагалі-то в результаті ШІ під керуванням досвідченої людини розв’язала задачу, яку один із найвидатніших алгоритмістів сучасності не розв’язав і за тижні.

У фразі «ШІ... розв’язав задачу...» більшість бачить ознаки автономності та такого інтелекту, який має людина (яка як раз діє автономно). Але це зовсім не так, що легко зрозуміти, прочитавши оригінальний допис.

Це не перша стаття, де описується подібне, і в кожному випадку люди дають моделі дуже багато попередніх висновків та гіпотез, що уже були зроблені людьми, що стає основою для успішної роботи «ШІ». Це дуже важливий фактор, бо тут, як мінімум було б правильно казати «ШІ допоміг розв’язати задачу», що вже зміщує фокус сприйняття того, чим є «ШІ».

Також нагадаю, що абсолютно те саме вже відбувається десятиріччями, достатньо лише всі новини зараз читати, замінюючи «ШІ» на «комп’ютер». Адже за допомогою комп’ютера людство вже давно розв’язує задачі, на які до цього витрачалися б інколи роки. Чому ми перестали бути у захваті від комп’ютера? А від електрики? Чому новини про «ШІ» читаються так, наче до появи «ШІ» ми існували в палеоліті та не мали ніякої сучасної цивілізації?

Таке враження, що купа людей наче прокинулися нещодавно і не мають ніяких знань про досягнення людства, у порівняння з якими «ШІ» вже не виглядатиме настільки фантастично, як його часто хочуть бачити сьогодні.

Це все фігня. Він може порахувати кількість літер r в слові strawberry? Не може? Ну тоді нахй не нужон ваш AI

Він може порахувати кількість літер r в слові strawberry?

Вже давно може

Мені здається на dou краще додавати «(сарказм)» ;)

Тоді прийдеться навести результати опитування — скільки а[р] у слові стробəрі -
опитування проведеного серед айтішників чи АІшників)

Дуже прикольно спостерігати за новинами по типу «ШІ написав компілятор до С» або ж як ця.

звісно, маючи здоровенні датасети (скоріш за все маючи якійсь первинні розв’язки задачі), то й ШІ теж розв’яже таку задачу. pattern recognition — ні не чули.

як то модно зара казати, черговий АІ слоп.

ви бачили, що то був за компілятор?) Очевидно, що далі заголовків ніхто не читає

Так, трохи подивився, праймні працюючий.

ну, мабуть, вже пофіксили, але на момент публікацій статей він по-перше, не працював, а по-друге — був просто обгорткою, яка всередині викликала GCC. І так, ще й цей компілятор був написаний під вже існуючий набір тестів для інших компіляторів. Коротше, не зараховуємо

Яку ціль переслідує ця новина? Вам платять за рекламу Claude/OpenAI/etc? Чи ви знаєте що таке «гамільтонові цикли»? Чи ця стаття дала мені зрозуміння що таке «гамільтонові цикли»? Ні.
Будь ласка, DOU припиніть репостити увесь Твіттер та Реддіт як намагання нагнати хайпу та клікбейту.

Яку ціль переслідує ця новина?

Це цікава (на мою думку) новина, якою я вирішив поділитися зі спільнотою. Саме тому цей пост і тут.

Вам платять за рекламу Claude/OpenAI/etc?

Було б дуже файно. Якщо можете, то передайте їм мій контакт та реквізити. Оплату приймаю лише в американських гривнях.

Чи ви знаєте що таке «гамільтонові цикли»?

На жаль (чи на щастя), мені доводилося безліч разів на другому курсі стикатися з ними.

Чи ця стаття дала мені зрозуміння що таке «гамільтонові цикли»? Ні.

Додав у текст примітку про те, що таке гамільтонові цикли. Сподіваюся добре розписав

Цікава стаття. Про самого Кнута. Та ще й про його роботу з ШІ, як з інструментом для практичних математичних досліджень. Лайк без сумнівів. А з приміткою стало ще краще.

Ця «стаття» — копіпаст на 5 параграфів новини з Реддіт/Твіттер, який сам по собі немає ніякої цінності. У вас 460 таких «статей» які у більшості про клікбейт і більшість із них у 3-4 параграфи.
Це зріз за серпень 2025:
— OpenAI може передавати ваші розмови поліції
— Покоління Z не хоче працювати full remote
— «Зламані роботи замість людей»: що каже «хрещений батько ШІ» про майбутнє війни
— Meta втрачає топ-інженерів і дослідників у підрозділі суперінтелекту
— Які інструменти на роботі вас дратують найбільше?
— Oracle проводить масові скорочення
— «Це просто сміття!»: Лінус Торвальдс розкритикував код, запропонований інженером Google
Ви множите шум та клікбейт. Для таких «новин» є соцмережі. Круто що ви вивчали «гамільтонові цикли», але тепер можливо час вивчити що таке журналістика?

Ви множите шум та клікбейт. Для таких «новин» є соцмережі. Круто що ви вивчали «гамільтонові цикли», але тепер можливо час вивчити що таке журналістика?

Добро пожаловать в украинскую журналистику. 50% желтизны, 50% джинсы, каплю подмахивания властям и получаем любое украинское СМИ, ДОУ не исключение.

Но коли це про те, що щось десь зламалося з натяком на ШІ, такі як ти там в коментарях тут як тут і обсасоють новину, замість того щоб жовтизну шукати. Да що там шукати, ще більше жовтизни додають додумуючи своє.

Гамільтонів цикл це такий шлях в графі, який відвідує кожну вершину один раз. Типовий приклад це обійти шахову дошку конем без повторів. Тут вершини графа це 64 клітинки, клітинки зʼєднані ребрами, якщо кінь може стрибнути з однієї на іншу.

Задача полягала у тому, що були якісь графи, і треба було алгоритм, який приймає параметри графу, та будує такий якийсь цикл.

Судячи з усього, таких циклів в тому типі графів багато, але побудувати загальний алгоритм не виходило.

Claude вирішив цю задачу: він набудував багато таких циклів для різних графів, та сумів найти закономірність в купі даних, читай структуру циклів, які були у всіх графах.

Підписатись на коментарі