«Здатність до самокритики»: У Claude додали інструмент «think»
У Claude додали новий інструмент «think». Він дещо відрізняється від уже наявної здібності «думати».
«Думаючі» моделі як о3, Deepseek-R1 та Claude з «extended thinking» ретельно аналізують питання, розробляють план відповіді, і тільки після підготовчих робіт починають відповідати користувачу.
Інструмент «think» використовується вже під час генерації відповіді. Тобто Claude може зупинитися й оцінити, чи є в нього вся необхідна інформація для подальших дій.
Це особливо корисно для довгих логічних ланцюгів із викликами інструментів або багатокрокових діалогів із користувачем. Тобто, він призначений для комплексних задач.
Також це підходить для задач, коли необхідна інформація не записана у параметри моделі, і їй потрібно діставати її із «зовнішнього середовища». Подвійна перевірка у таких кейсах також актуальна, при чому модель фокусується не на усій відповіді загалом, а саме на свіжій отриманій інформації.
«Інструмент „think“ більш ефективний, коли Claude потрібно використовувати складні інструменти, ретельно аналізувати їхні результати у довгих ланцюгах, працювати в середовищах із жорсткими правилами або приймати послідовні рішення, де кожен наступний крок залежить від попереднього, а помилки можуть бути критичними», — йдеться у повідомленні.
У особливо складних задачах необхідна оптимізація запиту для моделі, а саме:
- Перерахувати правила до запиту;
- Зробити перевірку, чи зібрана вся необхідна інформація;
- Проаналізувати отримані результати, провести «ретроспективу».
Саме з оптимізованим запитом модель показує найкращий результат, перевершуючи навіть режим із здатністю до мислення. Причиною для цього стала здібність зупинятися та аналізувати виправлення помилок: «а чи дійсно мої дії призвели до необхідного результату?»
Читайте: Anthropic випустили гібридну модель, яка думає «за потреби»
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів