Що читають на DOU: аналітика 1780 технічних статей за 12 років
Випадково так вийшло, що в мене вийшла аналітика топіків та статей. Що читають айтівці на dou.ua/forums/tags/tech (технічні статті й дайджести на DOU)?
В мене є талановитий друг DevOps, який має дуже великий досвід у своїй справі. Плюс і хардова частина в нього що треба — бо любить і попаяти, і налаштувати інфраструктуру в кубернетесі. Тому я почав мотивувати його написати свою статтю. Але вирішив допомогти йому з темою.
Тож я пішов у GPT.
Початок: коли AI каже «сам розберися»
По-простому не вийшло. Оскільки я PM, то не займаюсь кодингом на професійному рівні, але ми живемо у вік ШІ. Я зметикував, що скоріше за все треба написати скрипт, який би спарсив ці дані. Всі, мабуть, знають, що AI-сервіси так і парсять часто інфу.
Наступний лінивий крок був:
«GPT, спарси мені всі статті з DOU tech форуму»
Версія 5.1, 5.2 не стала швидше думати, як на мене, але це таке собі хобі й поспішати не було потреби. Тому довелось самому скопіювати цей скрипт і запустити. Далі я вже пішов у Cursor.
Я запустив скрипт, наданий мені GPT в Cursor, отримав результат. З 1780 статей кількість переглядів була тільки в 397. Це був вечір п’ятниці, я в цей неповний список додав категорії, які на мою думку були б релевантні. І сформулював перший категоризований список:
- Backend
- Frontend
- Design
- QA
- DevOps
- Product Management
- Project Management
- Marketing
Подивився, про що пишуть DevOps і своєму колезі сформував список тем на вибір. Далі, як то кажуть, «The ball is in your court».
Але як виявилось потім, мій список був не релевантним і не зачіпав найтоповіші теми.
Перфекціоніст прокинувся
Далі я пішов в Cursor правити код, оскільки внутрішній перфекціоніст роздирав душу. Я додав також колонку дати в парсер (з самого початку там була ще колонка error).
Тепер цей проєкт став не просто парсингом, а аналітичним інструментом для вимірювання популярності контенту в часі!
Ключові особливості парсера
Обробка двох форматів дат — головний біль:
- Нові топіки: · 9 грудня, 10:30 14449 (без року);
- Старі топіки: · 2 липня 2022, 15:00 4122 (з роком).
Надійність:
- Retry-механізм для HTTP-запитів.
- Затримки між запитами
(0.6-1.4 сек), щоб не забанили. - Обробка помилок з логуванням.
Оптимізації:
- requests.Session для пулу з’єднань.
- BeautifulSoup з
lxml-парсером для швидкості. - Збереження унікальних URL через set().
Результат парсингу
1,780 топіків за 12 років
- Всі заголовки.
- Всі кількості переглядів.
- Всі дати публікації.
- Без помилок.
Від даних до інсайтів
Ми успішно спарсили всі дані з DOU. Далі послідувало їхнє сортування та детальніша категоризація.
Для визначення статей, які найбільше читають, я вирішив використати два показники:
- Загальна кількість переглядів — класика, хто набрав найбільше за весь час.
- Індекс актуальності = кількість переглядів / кількість днів з моменту публікації.
Індекс дозволяє справедливо порівнювати топіки різного віку. Стаття, яка набрала 10,000 переглядів за тиждень, очевидно «гарячіша», ніж та, що набрала стільки ж за 5 років.
Також я додав нові категорії та прибрав з таблиці невизначене «Else».
Отже, у нас 1780 статей у 14 категоріях:
Security, DevOps, Backend, Frontend, QA, Design, Data/ML, Networking, Hardware/IoT, Mobile, Product, Project Management, Management, Marketing.
ТОП-5: Абсолютні чемпіони за переглядами
Багато людей люблять топи, тому почнемо:
|
Заголовок |
Категорія |
Перегляди |
Індекс актуальності |
|---|---|---|---|
|
Как DDOSить российскую инфраструктуру с бесплатных виртуалок Azure |
Security |
131,413 |
94.07 |
|
Як я створив віджет з інформацією, чи є електроенергія та інтернет вдома |
DevOps |
119,036 |
103.51 |
|
Hardware/IoT |
62,178 |
49.04 | |
|
Алгоритми та структури даних — від «десь чув» до «ефективно застосовую» |
Backend |
51,381 |
44.64 |
|
В чем разница между Subject, BehaviorSubject, ReplaySubject и AsyncSubject |
Backend |
49,204 |
28.64 |
Не буду тут пропагувати мову агресора — далі статті з російськими заголовками не будуть брати участь у нашому топі.
Що випливає з цього першого топу?
Наша IT-спільнота швидко мобілізувалась, і я думаю, наробила немало неприємностей для наших сусідів з країни 404. І навіть коли світло згасло в наших оселях — ми швидко налаштовували моніторинг того, коли ж воно до нас повернеться.
В топі також стаття про Home Assistant, яка є частиною великого форуму ентузіастів розумного дому.
Стаття про алгоритми — для всіх: хоч ти Junior PM, хоч Senior Java Developer. Структури даних та алгоритми за три роки набрали більше 50,000 переглядів. Мій рекомендейшн.
На п’ятому місці — короткий розбір різниці між Subject, BehaviorSubject, ReplaySubject та AsyncSubject у RxJS/Rx, з прикладами — коли який тип брати і чим вони відрізняються за поведінкою доставки значень. Найбільше зайде фронтенд-розробникам (Angular/RxJS) і бекендерам/мобайл, які працюють з reactive-streams.
ТОП-5: Україномовні статті за переглядами
|
Заголовок |
Категорія |
Перегляди |
Індекс актуальності |
|---|---|---|---|
|
Як я створив віджет з інформацією, чи є електроенергія та інтернет вдома |
DevOps |
119,036 |
103.51 |
|
Hardware/IoT |
62,178 |
49.04 | |
|
Алгоритми та структури даних — від «десь чув» до «ефективно застосовую» |
Backend |
51,381 |
44.64 |
|
Backend |
41,434 |
26.22 | |
|
Hardware/IoT |
29,291 |
28.72 |
В список додалось ще дві статті:
Які є конвенції в REST API та для чого їх дотримуватись — розбір найпоширеніших конвенцій у REST API (URI, ресурси-іменники, HTTP-методи, фільтрація через query params, path variables, коди відповідей) і чому їх варто дотримуватись, навіть якщо REST — не «стандарт».
Налаштовуємо ESPHome. Посібник для початківців — покроковий гайд по ESPHome: як працює (YAML — прошивка), типові сценарії (ESP8266/ESP32/RP2040), інтеграція з Home Assistant, та встановлення/прошивка через Home Assistant, Python або Docker.
ТОП-5: Індекс актуальності (що зараз «гаряче»)
|
Заголовок |
Категорія |
Перегляди |
Індекс |
Дата публікації |
|---|---|---|---|---|
|
Backend* |
14,671 |
815.06 |
| |
|
Frontend |
1,679 |
559.67 |
| |
|
Backend |
1,660 |
415.00 |
| |
|
DevOps |
4,820 |
401.67 |
| |
|
Як ми використовували AWS DMS та Kafka Streams для міграції на мікросервісну архітектуру |
DevOps |
558 |
279.00 |
|
* Стаття «Роби що можеш...» формально потрапила в Backend через автоматичну категоризацію, але насправді це соціальна тема про армію та IT-спільноту, а не технічний контент.
Це ті статті, які за короткий час набрали велику кількість переглядів. Про що ж люблять зараз читати найбільше наші айтівці?
«Роби що можеш, з тим що маєш, там де ти є» — автор (офіцер ССО) пояснює, чому «пересічний айтівець» рідше потрапляє в армію, які фактори зупиняють, і ставить питання: чи готова техспільнота допомагати країні у форматі part-time/volunteer без мобілізації.
MCP: як це працює та коли не варто застосовувати — практичний гайд про Model Context Protocol: як він уніфікує підключення AI-застосунків до зовнішніх інструментів/даних, і коли його не варто впроваджувати.
Поза межами Python. Шлях до швидкодії, що дихає на C — про оптимізацію Python «поза інтерпретатором»: векторизація, zero-copy, JIT, Cython і підходи, що наближають швидкодію до C.
Кінець експерименту з Rust у ядрі Linux (успішний) — новина/пояснення, що в Linux офіційно завершили «експеримент» з Rust у ядрі: Rust уже в mainline, використовується в продакшені, але ще є технічні обмеження та роботи попереду.
Як ми використовували AWS DMS та Kafka Streams — кейс міграції з 8+ років моноліту на мікросервіси через CDC на AWS DMS і stream processing на Kafka Streams.
Аналіз по категоріях: черепахи, спринтери та Blade Runner
Якщо робити топи по кожній категорії — ця стаття затягнеться не на одну сторінку. Тому поговоримо в цілому про те, що твориться в категоріях: що читають найбільше, що відразу ловить хайп, а що стає легендарним з часом.
Як «Той, що біжить по лезу» — фільм, який провалився в прокаті, але згодом став легендою.
🐢 Backend — «черепахи, що виграють»
Забирає найбільший шмат уваги. По статистиці ця категорія представлена 589 топіками з 1780 при 2,37 млн переглядів (35,5%).
Попри домінування конкретних мов на ринку, найпопулярніші статті тут — мовно-незалежні. Читачі шукають універсальні знання, які переживуть будь-який хайп. Довгоживучі пояснювалки, які тягнуть перегляди роками.
🏃 Frontend і DevOps — «спринтери»
Вони майже вирівнюються за сумарною увагою (~1.03M і ~1.01M) і частіше дають швидкі сплески за індексом актуальності, коли з’являється новий фреймворк, підхід або практичний гайд.
На відміну від бекенду, тут менше про алгоритми, а більше про інструментарій та «підводні камені». Велика увага приділяється навчальним матеріалам та довідникам українською.
🎬 DevOps ще й найбільш соціально адаптивна категорія
Їхні «хіти» — це пряма відповідь на виклики війни (блекаути) та економію ресурсів.
💊 Security та Hardware/IoT — «Blade Runner-ефект навпаки»
Мають найвищі середні перегляди (~7.2K та ~7.1K) і найвищу «швидкість» (weighted actuality 7.5 та 8.0). Тобто вони не провалюються, щоб стати легендами потім, а відразу вибухають.
У маркетингу є поняття продуктів «Vitamins» (приємно, корисно, але можна жити без цього) та «Painkillers» (коли болить так, що платиш будь-яку ціну).
Security та Hardware/IoT у наших реаліях — це чисті Painkillers.
📊 QA — «стабільний середній клас»
Це «стабільний середній клас» (~755K переглядів, 11.3%). Категорія поводиться напрочуд рівно і рідко «хайпує», але методично накопичує перегляди завдяки ґрунтовним інструкціям та розборам інструментів (Playwright, DevTools, техніки тестування), які роками працюють як довідники для професії.
😴 Mobile та Data/ML — «сплячі гіганти»
Маючи пристойну кількість тем (130 і 106), вони генерують помірний трафік (~327K і ~271K) з відносно низькою «температурою» актуальності (індекси
🎨 Про «бутикові ніші»
Design і Networking — справді нішеві. А от Product і Marketing — просто живуть в інших розділах DOU.
Тут маю визнати обмеження аналізу: парсер дивився тільки на /forums/tags/tech/ — технічну стрічку. А продакти й маркетологи на DOU мають свої окремі теги, рубрики, подкасти, PMDay. Там життя вирує — просто поза моєю вибіркою.
Що взагалі можна взяти з цього аналізу
Для людей, які читають з кінця, ось кілька коротких думок після перегляду 1780 статей за 12 років:
1. Пишіть українською — це наша ідентичність. DOU приймає статті тільки українською — і це не просто правило редакції, а вибір спільноти. 73% топових статей уже українською, тренд зростає. Люди свідомо пишуть рідною, відправляючи в забуття мову агресора. Технічний контент українською — це теж фронт.
2. Не гоніться за хайпом, якщо хочете довгострокового результату. Backend «черепахи» довели: мовно-незалежні статті про алгоритми і архітектуру збирають перегляди роками. Стаття про алгоритми з
3. Але паралельно — ловіть хвилю. MCP, нові фреймворки, AI-теми дають швидкий ріст, якщо встигнути вчасно. Стаття про MCP за 3 дні набрала індекс актуальності 560. Це як серфінг — треба бути на гребені.
4. Security та IoT — ваші Painkillers. Якщо можете писати про безпеку або розумний дім — аудиторія голодна. Ці ніші мають найвищі середні перегляди на статтю.
Замість висновку
А що з моїм другом DevOps? Він отримав список тем, але стаття ще не написана. Можливо, ця аналітика його надихне. Або когось із вас.
Дані показують: якісний контент українською читають. Ніші є. Аудиторія чекає.
P.S. Якщо хочете сирі дані для власного аналізу — пишіть, поділюся повним файлом з 1780 статтями.
Технічні деталі для ентузіастів:
- Стек: Python + BeautifulSoup + pandas.
- Час парсингу: ~2 години на 1780 топіків.
- Успішність: 100% (0 помилок).
- Період даних: грудень 2013 — грудень 2025.
Сподобалась стаття? Підписуйтесь на автора, щоб отримувати сповіщення про нові публікації на пошту.

4 коментарі
Додати коментар Підписатись на коментаріВідписатись від коментарів