YouTube-саммарі як бібліотека знань: що я додав у бота за два тижні
Минулого тижня я готувався додавати повнотекстовий пошук у свій Telegram-бот, закинув у нього годинне відео про Elasticsearch і прочитав структурований конспект за 5 хвилин замість години перегляду. А коли пізніше сів за код — не міг швидко знайти, у якому саме з переглянутих роликів я бачив необхідні інструкції і фішки. Зекономив годину перегляду — і витратив час на пошук. Так і зрозумів, що бот вирішує лише половину проблеми.
Це продовження історії з минулої статті на DOU про @YTSummarAI_bot. З першої статті вас прийшло близько 100 і це дало стимул рухатись далі. За ці два тижні зроблено багато — головна зміна виросла з власної проблеми, тому і починаю з неї.
Elasticsearch як приклад
Із того годинного відео в моєму конспекті залишились ключові речі. Чому default-скоринг кращий за просте keyword-matching. Що ES має жити як secondary store поруч із Postgres з async-синхронізацією, не як primary store — і ще не забути про language detection per document, бо в мене мікс української і англійської. І що він заточений під read-heavy сценарій — у мене якраз так. Окрема порада, що вилетіла відразу: «aim for simple solutions» — не тягни ES, якщо вистачає LIKE-у.
А потім — стоп. А як я це через тиждень знайду?
У стрічці Telegram-чату цей конспект загубиться між «Design a Video Recommendation System», обговоренням Postgres MVCC і «Bot Detection | ML System Design». Через десять днів я не пам’ятатиму ні назви доповіді, ні автора — тільки що «там було щось класне про BM25-скоринг».
Тобто час на перегляді я зекономив, а час на повернення до інсайту — ні. «Переглянути пізніше» фактично просто переїхало з YouTube у Telegram.
Щось типу того, коли в браузерних закладках уже сотні сайтів і ти точно щось туди зберігав потрібне, але що саме і коли — невідомо? Це воно. Тільки в Telegram-чаті ще гірше — немає ні папок, ні тегів. Лінійна стрічка повідомлень.
Бібліотека замість стрічки
Найочевидніше рішення — теги. Користувач сам ставить теги на саммарі прямо у формі підсумку.
У меню WebApp з’явилась нова вкладка Теги з двома виглядами: хмара тегів (всі теги юзера, відсортовані за назвою) і відео по тегу (натиснув тег — побачив усі саммарі з ним у хронологічному порядку).

Технічно все просто — окрема таблиця з унікальним ключем per-user, per-video, per-tag-name. UI — прості inline-теги над WebApp-формою саммарі: натиснув Enter, тег додався; хрестик — видалився. Також додав автодоповнення з попередніх.
Це просто, але ефект на моє власне бачення дуже великий. Я перестав ставитись до бота як до «інструменту швидкого читання YouTube». Він став персональною бібліотекою знань. Я не споживаю — я накопичую. Я не «дивлюсь відео» — я будую базу. І ця база інтуїтивно структурується самим процесом тегування, без зайвої роботи в окремому застосунку.
До речі, той конспект Elasticsearch deep dive. Тегнув його elasticsearch, system-design, search. Коли буду впроваджувати — за один клік маю всі релевантні підсумки і не треба передивлятись годинне відео.
Що ще додав за два тижні
Окрім бібліотеки з тегами, дві штуки, що теж впливають на щоденне використання:
- Нотифікація «саммарі готовий» у чат. Раніше: відкрив WebApp, побачив спінер, закрив, забув. Тепер коли AI завершує — бот шле повідомлення в чат, навіть якщо WebApp уже закрита. Маленька зміна, але помітна.
- Публічні share-сторінки. Кожен саммарі кожного користувача тепер можна перетворити на публічну сторінку зі структурованим URL, sitemap і JSON-LD для Google. Внизу сторінки — перелінковка по схожих тегах. Я надсилаю друзям, коли потрібно поділитись — це теж повноцінний use-case бота, і паралельно потенційний канал органічного трафіку через Google. Приклад такої сторінки.
Деякі цифри з минулої статті
Усе вище — про моє особисте використання. Ось що показала аудиторія першої статті за два тижні.
За перші три дні після публікації прийшло 79 нових юзерів — основна хвиля. 56 з них зайшли в бот, не зрозуміли куди тиснути — і пропали. Решта 43 спробували раз-два-три, спалили welcome-бонус 9 ⭐ — і теж пропали. Один залишився й оплатив пакет на 100 зірок. За наступні 11 днів — ще ~20 окремих юзерів з
Як на мене це нормально для pet-проекту з вільного часу. Клієнтська воронка тече у зрозумілих місцях: між «зайшов у бот» і «зробив перший саммарі» та між «спробував безкоштовно» і «купив зірок». Але один сигнал у цих числах найважливіший — той 1 платник. Про нього окремо.
Перша оплата — і чому далі підписка
Тут найважливіша частина історії. Pay-per-use на 3 ⭐ за саммарі я зробив свідомо. Не тому що ця модель найкраща — а тому що це найдешевший спосіб перевірити, чи хтось взагалі готовий платити за продукт.
Це класична логіка раннього стартапу: не починай з підписки, рекурентних оплат, складних білінгових систем. Збудуй найпростіший платний touch-point, запусти, спостерігай. Якщо знайдеться хоч один платник — у тебе є сигнал, що продукт коштує своїх грошей. Якщо ні — економиш місяці на тому, що могло не злетіти. Дешева перевірка важливішої гіпотези — «чи готовий хтось платити».
У моєму випадку це 9 ⭐ welcome bonus + 3 ⭐ за саммарі. Без формальних підписок, без webhook-ів, без Paddle. Просто Telegram Stars, які бот уміє приймати з коробки.
Результат — 1 платник з ~100 юзерів. На перший погляд скромно. Але важливо те, що цей 1 платник існує. Він проголосував гаманцем, що бот для нього вартий своїх грошей. Це підтвердження ключових гіпотез: проблема реальна, продукт корисний, аудиторія готова платити. Перша оплата — найдорожча і найважливіша.
Тепер логічний наступний крок — підписка. Pay-per-use не масштабується: кожен юзер заново вирішує «чи варто» перед кожним підсумком. Підписка масштабується — заплатив раз, користуєшся весь місяць без сумнівів. До того ж Telegram Stars як валюта додає cognitive load: скільки коштують 100 зірок, скільки це саммарі, чи варто. Підписка через звичну картку — нуль cognitive load.
Куди дивлюсь далі
Кілька паралельних напрямків. Один уже в активній розробці, кілька — на найближчі тижні, ще пара — на горизонті.
Авто-теги через AI. Зараз тегую руками — для мене це звичка, але новачку зайвий ритуал. Хочу, щоб саммарі поверталось одразу з
Підписка через Paddle. Це найбільша запланована зміна. Прибираю Telegram Stars як основну монетизацію і запускаю Free + Unlimited. Платежі через Paddle, бо вони Merchant of Record — беруть на себе податки і регулювання в усіх юрисдикціях, мені залишається тільки писати код. Зараз я проходжу реєстрацію як individual seller з України з виплатами через Wise. Це окремий квест: KYC, verification, технічна інтеграція з webhook-ами. Як завершу — поділюсь досвідом у наступній статті: і про реєстрацію Paddle для українського фіз-особи, і про технічну інтеграцію. Якщо хтось проходив схожий шлях — буду радий порадам зараз.
Повнотекстовий пошук у бібліотеці. Уже взявся: дослідницька частина зроблена (про той Elasticsearch deep dive — на початку статті), наступний крок — реальна імплементація. Хочу мати пошук за фразою з тексту саммарі на додачу до тегів.
Чат з відео. Це я ставив як план ще у місяць тому. Поки що не зробив, але тримаю в голові. Логіка: зараз ти отримуєш саммарі і все, взаємодія завершилась. А хотів з самого початку, щоб можна було запитати «що автор сказав про ризики?», «поясни цей момент детальніше», «дай цитату з відео про X». Розмова з контентом, не просто конспект. Зараз це виглядає як природне продовження бібліотеки — коли повертаєшся до старого підсумку через тиждень, часто хочеш заглибитись, а не перечитати.
Дякую, що дочитали. Бот тут: @YTSummarAI_bot. Через місяць ще одну статтю напишу — або про Paddle-квест, або про пошук на Elastic і інші покращення.
14 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарівДякую, цікава стаття. Я користуюся
Recallwww.recall.it?token=JGkASJGN де додали можливість підключитися до бази відео через MCP,також там є чат і граф знаннь. Паралельно, відео скидаю в Hermes agent який робить summary та додає до personal KB Wiki.ну тут хоч платний юзер є) вже прогрес) клас
питання, як відбувається побудова саммарі і навіщо воно вам взагалі?
тобто, я підписаний на досить багато каналів і зазвичай мені важливий не висновок а конкретні «фрази» або «формулювання», можливо навіть діаграма яка була у відео. Бо більшість класних відео де дійсно розжовують якусь тему мають якісні зображення. Я майже на 100% впевнений, що оригінальне мовлення\думка автора буде спотворена в саммарі.
далі, саммарі АІ-шок зазвичай все не те. Тобто якщо АІ-шка натренована робити самарі як я собі роблю — це круто. Якщо АІшка робить саммарі як гугл-пошук, то це просто сміття яке створює вид «знання» і «бази».
в такій базі 0 цінності бо це все можна знайти за2-3 кліка у гуглі. Якщо ми не плануємо жити у світі без інтернету, то воно все там буде.
ну але) удачі з розвитком бізнесу
є два типи відео — технічні перетворюються на інструкції, загальні/новинні на короткий зріз інформації. І це радше не бізнес, а перший публічний спосіб чимось поділитись і спробувати деякі штуки у pet-проекті всередині на чомусь живому)
цей проект пройшов довгий шлях: ручна обробка, скрипти, n8n і в решті решт повноцінний код-проект. У мене дійсно є потреба в ньому.
Дякую за коментар)
Думаю, настав час semantic / natural language search. Нещодавно реалізовував — і це вже easy-peasy у порівнянні з тим, як це виглядало кілька років тому.
Дякую за коментар! В моєму проекті планую ще й мультиканальний промптинг)))
Не зрозумів, навіщо цей бот взагалі?
Я закидую посилання на YT відео в Gemіni і пишу щому: «зроби саммари ось цього відео» — за декілька секунд читаю текст з посиланнями на відповідні частини відео.
В самому YouTube теж є схожа функція:
res.cloudinary.com/.../xrt50uldsugmzl9bogha.jpg
можливо автор має скажімо пару дюжин підписок, але не має часу / бажання відсортовувати або шукати в них актуальну для себе тему? І в такому разі (можливо) отримує перелік саммері з тегами, по яким вибирає що слухати?
Можливо. В мене інший флоу.
Дякую за підтримку) Продублюю відповідь вище
Кінцевий результат — мульти канальні промпти на основі накопиченої якісної, відфільтрованої та категоризованої інформації по власним вподобанням. Планую там бути через пів року. Гугл такого не дасть ніколи. Якщо цікаво — прошу починати накопичувати свою бібліотеку знань)
Вас цікавлять якісь мультіканальні промти?) Мене — інформація стисло.
Дякую за коментар!
Це є не у всіх відео чому. Тому от так.
Кінцевий результат — мульти канальні промпти на основі накопиченої якісної, відфільтрованої та категоризованої інформації по власним вподобанням. Планую там бути через пів року. Гугл такого не дасть ніколи. Якщо цікаво — прошу починати накопичувати)