Що читають на DOU: аналітика 1780 технічних статей за 12 років

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Випадково так вийшло, що в мене вийшла аналітика топіків та статей. Що читають айтівці на dou.ua/forums/tags/tech (технічні статті й дайджести на DOU)?

В мене є талановитий друг DevOps, який має дуже великий досвід у своїй справі. Плюс і хардова частина в нього що треба — бо любить і попаяти, і налаштувати інфраструктуру в кубернетесі. Тому я почав мотивувати його написати свою статтю. Але вирішив допомогти йому з темою.

Тож я пішов у GPT.

Початок: коли AI каже «сам розберися»

По-простому не вийшло. Оскільки я PM, то не займаюсь кодингом на професійному рівні, але ми живемо у вік ШІ. Я зметикував, що скоріше за все треба написати скрипт, який би спарсив ці дані. Всі, мабуть, знають, що AI-сервіси так і парсять часто інфу.

Наступний лінивий крок був:

«GPT, спарси мені всі статті з DOU tech форуму»

Версія 5.1, 5.2 не стала швидше думати, як на мене, але це таке собі хобі й поспішати не було потреби. Тому довелось самому скопіювати цей скрипт і запустити. Далі я вже пішов у Cursor.

Я запустив скрипт, наданий мені GPT в Cursor, отримав результат. З 1780 статей кількість переглядів була тільки в 397. Це був вечір п’ятниці, я в цей неповний список додав категорії, які на мою думку були б релевантні. І сформулював перший категоризований список:

  • Backend
  • Frontend
  • Design
  • QA
  • DevOps
  • Product Management
  • Project Management
  • Marketing

Подивився, про що пишуть DevOps і своєму колезі сформував список тем на вибір. Далі, як то кажуть, «The ball is in your court».

Але як виявилось потім, мій список був не релевантним і не зачіпав найтоповіші теми.

Перфекціоніст прокинувся

Далі я пішов в Cursor правити код, оскільки внутрішній перфекціоніст роздирав душу. Я додав також колонку дати в парсер (з самого початку там була ще колонка error).

Тепер цей проєкт став не просто парсингом, а аналітичним інструментом для вимірювання популярності контенту в часі!

Ключові особливості парсера

Обробка двох форматів дат — головний біль:

  • Нові топіки: · 9 грудня, 10:30 14449 (без року);
  • Старі топіки: · 2 липня 2022, 15:00 4122 (з роком).

Надійність:

  • Retry-механізм для HTTP-запитів.
  • Затримки між запитами (0.6-1.4 сек), щоб не забанили.
  • Обробка помилок з логуванням.

Оптимізації:

  • requests.Session для пулу з’єднань.
  • BeautifulSoup з lxml-парсером для швидкості.
  • Збереження унікальних URL через set().

Результат парсингу

1,780 топіків за 12 років (2013-2025) з 100% успішністю:

  • Всі заголовки.
  • Всі кількості переглядів.
  • Всі дати публікації.
  • Без помилок.

Від даних до інсайтів

Ми успішно спарсили всі дані з DOU. Далі послідувало їхнє сортування та детальніша категоризація.

Для визначення статей, які найбільше читають, я вирішив використати два показники:

  1. Загальна кількість переглядів — класика, хто набрав найбільше за весь час.
  2. Індекс актуальності = кількість переглядів / кількість днів з моменту публікації.

Індекс дозволяє справедливо порівнювати топіки різного віку. Стаття, яка набрала 10,000 переглядів за тиждень, очевидно «гарячіша», ніж та, що набрала стільки ж за 5 років.

Також я додав нові категорії та прибрав з таблиці невизначене «Else».

Отже, у нас 1780 статей у 14 категоріях:

Security, DevOps, Backend, Frontend, QA, Design, Data/ML, Networking, Hardware/IoT, Mobile, Product, Project Management, Management, Marketing.

ТОП-5: Абсолютні чемпіони за переглядами

Багато людей люблять топи, тому почнемо:

Заголовок

Категорія

Перегляди

Індекс актуальності

Как DDOSить российскую инфраструктуру с бесплатных виртуалок Azure

Security

131,413

94.07

Як я створив віджет з інформацією, чи є електроенергія та інтернет вдома

DevOps

119,036

103.51

Home Assistant 101. Посібник для початківців

Hardware/IoT

62,178

49.04

Алгоритми та структури даних — від «десь чув» до «ефективно застосовую»

Backend

51,381

44.64

В чем разница между Subject, BehaviorSubject, ReplaySubject и AsyncSubject

Backend

49,204

28.64

Не буду тут пропагувати мову агресора — далі статті з російськими заголовками не будуть брати участь у нашому топі.

Що випливає з цього першого топу?

Наша IT-спільнота швидко мобілізувалась, і я думаю, наробила немало неприємностей для наших сусідів з країни 404. І навіть коли світло згасло в наших оселях — ми швидко налаштовували моніторинг того, коли ж воно до нас повернеться.

В топі також стаття про Home Assistant, яка є частиною великого форуму ентузіастів розумного дому.

Стаття про алгоритми — для всіх: хоч ти Junior PM, хоч Senior Java Developer. Структури даних та алгоритми за три роки набрали більше 50,000 переглядів. Мій рекомендейшн.

На п’ятому місці — короткий розбір різниці між Subject, BehaviorSubject, ReplaySubject та AsyncSubject у RxJS/Rx, з прикладами — коли який тип брати і чим вони відрізняються за поведінкою доставки значень. Найбільше зайде фронтенд-розробникам (Angular/RxJS) і бекендерам/мобайл, які працюють з reactive-streams.

ТОП-5: Україномовні статті за переглядами

Заголовок

Категорія

Перегляди

Індекс актуальності

Як я створив віджет з інформацією, чи є електроенергія та інтернет вдома

DevOps

119,036

103.51

Home Assistant 101. Посібник для початківців

Hardware/IoT

62,178

49.04

Алгоритми та структури даних — від «десь чув» до «ефективно застосовую»

Backend

51,381

44.64

Які є конвенції в REST API та для чого їх дотримуватись

Backend

41,434

26.22

Налаштовуємо ESPHome. Посібник для початківців

Hardware/IoT

29,291

28.72

В список додалось ще дві статті:

Які є конвенції в REST API та для чого їх дотримуватись — розбір найпоширеніших конвенцій у REST API (URI, ресурси-іменники, HTTP-методи, фільтрація через query params, path variables, коди відповідей) і чому їх варто дотримуватись, навіть якщо REST — не «стандарт».

Налаштовуємо ESPHome. Посібник для початківців — покроковий гайд по ESPHome: як працює (YAML — прошивка), типові сценарії (ESP8266/ESP32/RP2040), інтеграція з Home Assistant, та встановлення/прошивка через Home Assistant, Python або Docker.

ТОП-5: Індекс актуальності (що зараз «гаряче»)

Заголовок

Категорія

Перегляди

Індекс

Дата публікації

«Роби що можеш, з тим що маєш, там де ти є» або чому пересічний айтівець потрапляє в армію рідше за інших

Backend*

14,671

815.06

2025-12-09

MCP: як це працює та коли не варто застосовувати

Frontend

1,679

559.67

2025-12-24

Поза межами Python. Шлях до швидкодії, що дихає на C

Backend

1,660

415.00

2025-12-23

Кінець експерименту з Rust у ядрі Linux (успішний)

DevOps

4,820

401.67

2025-12-15

Як ми використовували AWS DMS та Kafka Streams для міграції на мікросервісну архітектуру

DevOps

558

279.00

2025-12-25

* Стаття «Роби що можеш...» формально потрапила в Backend через автоматичну категоризацію, але насправді це соціальна тема про армію та IT-спільноту, а не технічний контент.

Це ті статті, які за короткий час набрали велику кількість переглядів. Про що ж люблять зараз читати найбільше наші айтівці?

«Роби що можеш, з тим що маєш, там де ти є» — автор (офіцер ССО) пояснює, чому «пересічний айтівець» рідше потрапляє в армію, які фактори зупиняють, і ставить питання: чи готова техспільнота допомагати країні у форматі part-time/volunteer без мобілізації.

MCP: як це працює та коли не варто застосовувати — практичний гайд про Model Context Protocol: як він уніфікує підключення AI-застосунків до зовнішніх інструментів/даних, і коли його не варто впроваджувати.

Поза межами Python. Шлях до швидкодії, що дихає на C — про оптимізацію Python «поза інтерпретатором»: векторизація, zero-copy, JIT, Cython і підходи, що наближають швидкодію до C.

Кінець експерименту з Rust у ядрі Linux (успішний) — новина/пояснення, що в Linux офіційно завершили «експеримент» з Rust у ядрі: Rust уже в mainline, використовується в продакшені, але ще є технічні обмеження та роботи попереду.

Як ми використовували AWS DMS та Kafka Streams — кейс міграції з 8+ років моноліту на мікросервіси через CDC на AWS DMS і stream processing на Kafka Streams.

Аналіз по категоріях: черепахи, спринтери та Blade Runner

Якщо робити топи по кожній категорії — ця стаття затягнеться не на одну сторінку. Тому поговоримо в цілому про те, що твориться в категоріях: що читають найбільше, що відразу ловить хайп, а що стає легендарним з часом.

Як «Той, що біжить по лезу» — фільм, який провалився в прокаті, але згодом став легендою.

🐢 Backend — «черепахи, що виграють»

Забирає найбільший шмат уваги. По статистиці ця категорія представлена 589 топіками з 1780 при 2,37 млн переглядів (35,5%).

Попри домінування конкретних мов на ринку, найпопулярніші статті тут — мовно-незалежні. Читачі шукають універсальні знання, які переживуть будь-який хайп. Довгоживучі пояснювалки, які тягнуть перегляди роками.

🏃 Frontend і DevOps — «спринтери»

Вони майже вирівнюються за сумарною увагою (~1.03M і ~1.01M) і частіше дають швидкі сплески за індексом актуальності, коли з’являється новий фреймворк, підхід або практичний гайд.

На відміну від бекенду, тут менше про алгоритми, а більше про інструментарій та «підводні камені». Велика увага приділяється навчальним матеріалам та довідникам українською.

🎬 DevOps ще й найбільш соціально адаптивна категорія

Їхні «хіти» — це пряма відповідь на виклики війни (блекаути) та економію ресурсів.

💊 Security та Hardware/IoT — «Blade Runner-ефект навпаки»

Мають найвищі середні перегляди (~7.2K та ~7.1K) і найвищу «швидкість» (weighted actuality 7.5 та 8.0). Тобто вони не провалюються, щоб стати легендами потім, а відразу вибухають.

У маркетингу є поняття продуктів «Vitamins» (приємно, корисно, але можна жити без цього) та «Painkillers» (коли болить так, що платиш будь-яку ціну).

Security та Hardware/IoT у наших реаліях — це чисті Painkillers.

📊 QA — «стабільний середній клас»

Це «стабільний середній клас» (~755K переглядів, 11.3%). Категорія поводиться напрочуд рівно і рідко «хайпує», але методично накопичує перегляди завдяки ґрунтовним інструкціям та розборам інструментів (Playwright, DevTools, техніки тестування), які роками працюють як довідники для професії.

😴 Mobile та Data/ML — «сплячі гіганти»

Маючи пристойну кількість тем (130 і 106), вони генерують помірний трафік (~327K і ~271K) з відносно низькою «температурою» актуальності (індекси 2.2–2.8). Теми тут специфічні й аудиторія зростає повільніше, без вибухового характеру.

🎨 Про «бутикові ніші»

Design і Networking — справді нішеві. А от Product і Marketing — просто живуть в інших розділах DOU.

Тут маю визнати обмеження аналізу: парсер дивився тільки на /forums/tags/tech/ — технічну стрічку. А продакти й маркетологи на DOU мають свої окремі теги, рубрики, подкасти, PMDay. Там життя вирує — просто поза моєю вибіркою.

Що взагалі можна взяти з цього аналізу

Для людей, які читають з кінця, ось кілька коротких думок після перегляду 1780 статей за 12 років:

1. Пишіть українською — це наша ідентичність. DOU приймає статті тільки українською — і це не просто правило редакції, а вибір спільноти. 73% топових статей уже українською, тренд зростає. Люди свідомо пишуть рідною, відправляючи в забуття мову агресора. Технічний контент українською — це теж фронт.

2. Не гоніться за хайпом, якщо хочете довгострокового результату. Backend «черепахи» довели: мовно-незалежні статті про алгоритми і архітектуру збирають перегляди роками. Стаття про алгоритми з 2022-го досі в топі.

3. Але паралельно — ловіть хвилю. MCP, нові фреймворки, AI-теми дають швидкий ріст, якщо встигнути вчасно. Стаття про MCP за 3 дні набрала індекс актуальності 560. Це як серфінг — треба бути на гребені.

4. Security та IoT — ваші Painkillers. Якщо можете писати про безпеку або розумний дім — аудиторія голодна. Ці ніші мають найвищі середні перегляди на статтю.

Замість висновку

А що з моїм другом DevOps? Він отримав список тем, але стаття ще не написана. Можливо, ця аналітика його надихне. Або когось із вас.

Дані показують: якісний контент українською читають. Ніші є. Аудиторія чекає.

P.S. Якщо хочете сирі дані для власного аналізу — пишіть, поділюся повним файлом з 1780 статтями.

Технічні деталі для ентузіастів:

  • Стек: Python + BeautifulSoup + pandas.
  • Час парсингу: ~2 години на 1780 топіків.
  • Успішність: 100% (0 помилок).
  • Період даних: грудень 2013 — грудень 2025.

Сподобалась стаття? Підписуйтесь на автора, щоб отримувати сповіщення про нові публікації на пошту.

👍ПодобаєтьсяСподобалось11
До обраногоВ обраному1
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Пишіть українською — це наша ідентичність. DOU приймає статті тільки українською — і це не просто правило редакції, а вибір спільноти. 73% топових статей уже українською, тренд зростає. Люди свідомо пишуть рідною, відправляючи в забуття мову агресора.

Причинно-наслідковий звʼязок переплутаний: якщо б не було форсування одної мови, то не було б і тренду. І тут можна згадати не російську, а, в першу чергу, анґлійську. Кожен може радіти таким трендам чи ні, але стверджувати, що є свідомий вибір, некоректно.

ТОП-5: Україномовні статті за переглядами

А як рахуються перегляди? Це кількість відкриття статей хоч раз (тоді Ctrl+F5 інкрементує), відкриття унікальним читачем (тоді приватний режим додасть переглядів), відкриттів за IP (тоді тисяча юзерів за одним NAT IP будуть враховані як один), чи как? (Ці питання були поставлені ще на самій зорі розвитку вебу, і однозначної відповіді нема і не буде.) Звісно, питання не до вас, ви лише берете готові дані, питання до редакції. Але навіть порівнювати за такими критеріями вже сумнівно.
А ось кількість коментарів — яка, на мій розсуд, як раз значно більше показує актуальність, і мала б приймати участь з великою вагою — у вас не враховується.

Індекс дозволяє справедливо порівнювати топіки різного віку. Стаття, яка набрала 10,000 переглядів за тиждень, очевидно «гарячіша», ніж та, що набрала стільки ж за 5 років.

І формула формування фінального індексу не наведена. Була б це наукова стаття, її б таку не прийняли до розгляду.

А як рахуються перегляди?

Це кількість відкриттів статей.

А давайте тепер зробим файний рубрікатор!

Це не складно до речі, DOU вже все зробив по факту, але з тегами кажись перебір, їх треба категоризувати мабуть, потім робити рубрікатор на основі них.

Підписатись на коментарі