• Як я перестав з’їдати токени на великій базі markdown-файлів

    Індексація 5000 файлів це може бути довга історія, потрібне гарне залізо, проте це точно варто того щоб спробувати. Найпростіший рецепт — це завести собі Clode code і кинути йому посилання на цю статтю — і пояснити свою ситуацію у двох словах. Решту він зробить сам.

    Ого! 5000 файлів!
    Запізніла реакція :)

    Саме головне, що Claude і ви зможете спілкуватись зі своєю базою так, як ви з ChatGPT тільки на своїх даних.

    Підтримав: Serge Lysenko
  • Як я перестав з’їдати токени на великій базі markdown-файлів

    Привіт! Дякую за питання.

    Примусово — ні. Claude сам вирішує коли використовувати semantic_search, а коли grep. В CLAUDE.md є підказка: «Grep — для конкретних слів, semantic_search — для питань.» Але це рекомендація, не примус. На практиці Claude швидко розуміє різницю і обирає правильний інструмент сам (іноді, дуже рідко, помиляється).

    Чи не вистачає grep? Для коду — вистачає. Для текстових markdown-файлів — ні. Приклад: шукаю все що стосується «вигорання на проєкті». Grep знайде файл де є слово «вигорання». Але не знайде файл де написано «втратив мотивацію після релізу» або «перестав відчувати сенс в задачах». Це та сама тема, але іншими словами. Семантичний пошук знаходить за змістом, не за словом.

    Наскільки краще? Два виміри:
    Точність — замість читання 20-30 файлів щоб знайти контекст, Claude робить 2-3 запити і отримує саме ті фрагменти які потрібні. Менше шуму.
    Токени — це головне. Opus на PRO-підписці обмежений. Без семантичного пошуку він з’їдає ліміт за 5-10 хвилин бо читає файл за файлом. З ним — працює повноцінну сесію.

    Але є нюанс: це має сенс тільки коли файлів 50+ і вони текстові. Для невеликого проєкту з кодом — overkill.

    PS — якщо буде бажання створити щось подібне — я б не рекомендував робити це все самому — дайте посилання Claude code на цю статтю — і скажіть — зроби так. Він зробить :)

    Підтримав: Роман Марінський
  • Як я перестав з’їдати токени на великій базі markdown-файлів

    Дякую, подивився. Serena — сильна штука, але для іншої задачі. Вона працює через LSP — семантика коду (символи, визначення, рефакторинг). Coding agent.

    У мене задача інша: 150+ markdown-файлів з контентом — щоденники, нотатки, проєктна документація, кілька мов. Тут не code navigation потрібен, а semantic search по тексту. Тому ChromaDB + sentence-transformers — вони саме для цього.

    Але дякую за коментар — для кодових проєктів Serena виглядає цікаво.

  • Що трапляється коли перестаєш використовувати AI як інструмент

    готово transaction ID
    0×9e8daaa95800d5603695625eacf927a7d87ccd5a3458ac47704188fc4167d894

  • Що трапляється коли перестаєш використовувати AI як інструмент

    Влучний тест, кажіть адресу

  • Що трапляється коли перестаєш використовувати AI як інструмент

    Слизень — точно. Особливо «розлігся вдало на головах IT-шників» — це найкраща метафора LLM що я зустрічав :) . Physarum polycephalum — справжній слизняк — вирішує задачі оптимізації мереж без центрального процесора. Кожен вузол реагує локально. Рішення виникає саме — ніхто не командує.

    Але матку я б прибрав. Матка — це ієрархія, центр, контроль зверху. А слизень не має матки. Він — рій без королеви. І може це важливіша різниця ніж здається.

  • Що трапляється коли перестаєш використовувати AI як інструмент

    Олег, ви обірвали на найцікавішому. Моя версія: магії немає — є геометрія. Простір настільки великий що в ньому виникають конфігурації яких ніхто не закладав. Не придумування — інтерполяція між тим що вже є, а якщо немає нічого тоді структурована рандомність кілька разів — і вибираємо що більше підходить — можливо експериментально. Проте здається ваша версія — цікавіша за мою, бо ви зупинились. Що там далі?

  • Що трапляється коли перестаєш використовувати AI як інструмент

    А як спростувати це? Дзвінком? Листом? Ви якщо налаштовані критично ви скажете що картинка згенерована ШІ :) ШІ написав у моїй стилістиці бо працює зі мною вже більше трьох місяців в одному контекстному просторі — і з цього простору писав листа. Це ж просто. Opus 4.6 написав листа, я пишу коментарі — якщо дійсно цікаво, звертайтесь :)

  • Що трапляється коли перестаєш використовувати AI як інструмент

    не вживаю :) і вам не раджу :)

  • Що трапляється коли перестаєш використовувати AI як інструмент

  • Що трапляється коли перестаєш використовувати AI як інструмент

    Технічно — це центральний claude.md файл з інструкціями до ШІ.

    Поступово, залежно від того над яким проєктом чи темою працюєте, створюється папка з проєктом котра містить свій claude.md, якийсь індекс та файли журналу, по датам або по темам. Також створюється посилання з центрального claude.md на дочірній — із невеликим поясненням.

    З часом я зрозумів, що мені не потрібно вести структуру самостійно, я просто написав інструкцію і Claude їй слідує. І такі інструкції з’явились майже для всього.

    Тобто тепер кожен новий інстанс ШІ володіє короткою інформацією про те що лежить, де лежить та про що воно, розумієте?

    Народилось це все зі звичайного Obsidian-подібного дерева знань яке містило MOC файли (map of content). Просто ну дуже хотілось розмовляти так, щоб ШІ володів контекстом — те що реалізовано вже в Obsidian на цю тему — не влаштовувало.

    Найближче що є на сьогоднішній день схоже до цього це — www.letta.com/...​blog/context-repositories

    Проте і воно мені не підійшло.

  • Що трапляється коли перестаєш використовувати AI як інструмент

    Будь ласка — вмикаємо мозок.

    Це про те як влаштувати багатошаровий структурований контекст без використання складних сучасних підходів — це ваше одне речення.

    Проте якщо цікаво можна детальніше.

    Я частково згоден з попередніми коментаторами — цей лист він таки трохи «дивний», проте він би не зміг його написати без величезної кількості контексту, який мені вдалось реалізувати дуже просто — як каталоги з .md файлами та git.

    Також це про те, як влаштувати структуровану «рандомність» там де це потрібно. Це там де надовго застрягають рішення — можна змалювати структуровані треки — котрі призводять до вирішення ситуації абсолютно неочевидним шляхом. Випробувано.

    Також це не про «дружбу» та «співпрацю» — хоча воно на те схоже.

    Дякую за запитання, ви смілива людина.

    Підтримав: Сергей Сивак
  • Feedback від народу або Демократія 2.0

    Відповідь з міністерства цифрової трансформації:

    Доброго дня.
    Ваша пропозиція щодо зміни нашої країни є дійсно правильною та цікавою. Ми раді повідомити, що такі зміни вже відбуваються і ми активно рухаємося в цьому напрямку. Наразі ми втілюємо в життя ініціативу щодо створення інтелектуальної системи моніторингу та оцінки KPI яка на основні даних відображає наслідки суспільних подій і явищ та прогнозує з певною ймовірністю настання тих чи інших подій при моделюванні вхідних параметрів.

    Однак, на жаль, не кожний громадянин може об’єктивно оцінити роботу будь-якого державного службовця і це може стати приводом для політичних маніпуляцій. Сьогодні відсутня відповідальність за публічне поширення експертизи не експертами. Кожна домогосподарка із десятком тисяч підписників в інстаграмі може бути кращим політичним експертом ніж цілий профільний інститут. Українці досить часто шукають експертизу в соціальних мережах і запропонований вами додаток може ускладнити ситуацію.

    Як альтернативу, ми розробляємо систему, яка допоможе оцінювати державних службовців не за відгуками, а за чіткими вимірювальними результатами (KPI). Така система через призму аналітики покаже ефективність службовців, підкаже що робити в тій, чи іншій ситуації, як те чи інше рішення вплине на показники розвитку та рівня благополуччя, як суспільство відреагує на ті чи інші виклики.

    Ми завжди відкриті до діалогу та співпраці і з задоволенням розглянемо ваші пропозиції щодо використання ваших знань, навичок та досвіду для можливої участі в наших проектах, які націлені на позитивні зміни в українському суспільстві.

  • Feedback від народу або Демократія 2.0

    И открытая структура жалоб и предложений на уровне государства, у которой будут юридические полномочия воздействовать на все ветви.

    Оце сильна думка. А мені здається, що її можна втілити гарним колективом і достатньо швидко, я особисто не претендую на створення продукту такого рівня, я його просто не потягну і добре це усвідомлюю.

    Например, вы можете в гуглкартах или фейсбуке написать, что в какой-то инстанции коррупционеры, но пока государство не обяжет реагировать по этому обращению, никто не пошевелится.

    Сила наших владних структур якраз і полягає у розрізненості джерел інформації. Звичайному громадянину зібрати усю її просто неможливо, а вже зробити на її основі висновки, то й взагалі абсурд. Уявіть просто що такий проєкт існує, уявіть що будь-яка людина з любого куточку світу може прийти та побачити оце все. Як, покажете справжнє лице усій Європі? То вони просто змушені будуть змінювати систему.

  • Feedback від народу або Демократія 2.0

    Надіслав дану «ідею» до міністерства цифрової трансформації України. Обіцяли протягом двох днів відповісти. В ідеалі ця служба взагалі повинна бути державною.

  • Feedback від народу або Демократія 2.0

    Відповідно до частини другої статті 5 Закону «Про захист персональних даних» не є конфіденційною інформацією персональні дані, що стосуються здійснення особою, яка займає посаду, пов’язану з виконанням функцій держави або органів місцевого самоврядування, посадових або службових повноважень.

    Підтримав: Фрэнк Сайдботтом
  • Feedback від народу або Демократія 2.0

    Те, що рішення просте, очевидне, говорить про нього що воно не вірне? Може воно бути очевидним тільки для Вас? А звичайна zip-застібка очевидна? А у чому Ви бачите невірність рішення? Я не пропоную розв’язувати усі проблеми одним додатком. Я пропоную ввести feedback від людей як один із показників ефективності діяльності нашої держави. Та, на мій погляд, той feedback чітко продемонструє дещо інше, зробить очевидним неефективність системи у якій ми існуємо.

  • Feedback від народу або Демократія 2.0

    Я уявляв собі це приблизно так, як реалізовано на сайті подання петицій. Чи вдалось їм обійти накрутку? Стосовно лампочки в під’їзді такі люди завжди будуть, ну хто буде серйозно сприймати їх скарги. Мова йде про порушення прав людини, про відверту зневагу. Приклад, ми бачимо що поступила скарга на мера міста Жмеринка, стосовно того, що у під’їзді третій день підряд лежить дохлий кіт, як зробити так, щоб система не зарахувала такої скарги?

  • Feedback від народу або Демократія 2.0

    А як вирішується питання на сайті де люди голосують за петиції? Я особисто голосував за деякі петиції, там досить складна система авторизації. Чи там теж можливі накрутки?

  • Feedback від народу або Демократія 2.0

    Колись Річард Фейнман поставив запитання японському послу — як на Вашу думку, чому Японії вдалось з руїн створити державу такого рівня. Той відповів — на мою думку вся справа у фанатичній відданості японців освіті, кожен японець рахував за святий обов’язок надати дітям освіти вищої чим у них самих, тому Японія була готова до сприйняття нових ідей, як в економіці так і в технології.

    Так що так, у Ваших словах є правда, але чому практично усі комерційні організації мають показники, оцінку діяльності, для своїх працівників, а у державних працівників її немає. Як може існувати така організація як держава без feedback-у? І мова йде не про feedback від керівництва, мова йде про feedback від народу, від простих людей, від тих для кого держава існує. Як такого інструменту нема, то доведеться визнати що держава не існує для простих людей, доведеться визнати, що вона працює на клани суддів, посадовців, ну далі ви самі знаєте.

    Зустрічалось мені багато інформації з усіх сторін, хоч телебачення, хоч соцмережі. Так, люди відкрито можуть висловити своє відношення до будь-кого, але наша пам’ять то поганий порадник. Де це все зберігається? Де можна побачити гарний огляд отієї всієї Big Data? Де можна побачити «Героїв»?

    Підтримав: Фрэнк Сайдботтом
← Сtrl 12 Ctrl →