Гаррі Поттер у графіках: як я створив візуалізацію, що отримала номінацію Viz Of The Day

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Ну і привіт :) Мене звати Влад. Я працюю аналітиком даних у компанії Нова Пошта трохи більше ніж півтора року. Сьогодні я хочу розповісти вам, як створив візуалізацію про Гаррі Поттера, яка була номінована на Viz Of The Day на Tableau Public.

Кожного дня на сайті Tableau Public обирають візуалізацію дня. Це може бути як нещодавно опублікована робота, так і та, що вже кілька місяців на сайті. Кожен може проголосувати за будь-яку опубліковану візуалізацію. Податися дуже просто — достатньо лише опублікувати свою роботу й зробити її видимою для користувачів. А далі як піде.

Наприклад, я опублікував свою роботу, а десь через тиждень мене привітала аналітикиня з Нідерландів. Спочатку я не дуже зрозумів, із чим мене вітають, але за кілька хвилин усе стало ясно.

Ідея

Чому Гаррі Поттер? Ну бо тому, що це мій улюблений фільм. У той час, коли велика частина мого робочого часу йде на бізнес-дашборди, я вирішив попрацювати над чимось, що мене надихає. І ось холодного осіннього вечора, коли я вкотре почав передивлятися свій улюблений фільм, я подумав: «Ось це воно!». Мені завжди складно знайти ідею для візуалізації, але коли я її врешті-решт знаходжу, то це відчуття важко з чимось сплутати.

Окей, у мене є ідея. Що далі? На початку я ще не зовсім розумів, що саме хочу розповісти. Я вирішив, що це буде про Гаррі Поттера, але що це означає? У мене не було впевненості в тому, чого я хочу, але я точно знав, чого не хочу.

Я не хотів робити візуалізацію, у якій досліджую щось із самої книги чи фільму, типу кількості унікальних заклинань або співвідношення діалогів між головними персонажами. Це мало бути щось за межами сюжету.

На цьому етапі я вирішив дати собі час на дослідження, щоб зрозуміти, які дані можу знайти в інтернеті. Декілька днів я просто читав статті про франшизу Гаррі Поттера, дивився відео про життєву історію Джоан Роулінг і копирсався в датасетах на Kaggle.

У цей час у мене з’явилося уявлення про те, що Поттер — це не просто книга чи фільм, а повноцінний культурний феномен, який вплинув на життя мільйонів людей по всьому світу. І саме за це я вирішив зачепитися: хотів показати, як книга про маленького чарівника змінила вже сформовані індустрії та життя звичайних людей.

Дані

Збір даних завжди є одним із найскладніших і найважливіших аспектів роботи над візуалізацією. Якщо облажатись на цьому етапі, то вся подальша робота втратить сенс. Коли ви хочете розповісти якусь історію, варто розуміти, що, швидше за все, не буде так, що всі дані акуратно лежать в одному місці й чекають, поки ви їх заберете. Дуже часто доведеться збирати їх по різних куточках інтернету, не кажучи вже про валідацію, чистку та форматування.

Власне, з цим я і стикнувся, коли працював над цією візуалізацією. Мені були доступні сотні ресурсів, із яких я міг узяти інформацію, тому доводилося визначати найбільш надійні або хоча б наближені до таких.

На цьому етапі я вирішив використовувати LLM, а саме Grok та Perplexity. Я був приємно вражений тим, як вони знаходять та агрегують дані, і їхня робота у цьому аспекті мені сподобалась навіть більше, ніж у Gemini чи ChatGPT.

Деякі ресурси я шукав самостійно, а на деякі звернув увагу за рекомендаціями мовних моделей. Тут варто зауважити кілька речей.

По-перше, результати роботи LLM потрібно перевіряти. Бо на біса ми тоді потрібні, шановні аналітики даних :) Під час роботи я не раз помічав: переходиш за посиланням, з якого той самий Grok клянеться, що взяв інформацію, а її там просто немає. Це так звані галюцинації. Якщо ви ще не в курсі, то обов’язково почитайте про це.

По-друге, важливо перевіряти не лише ресурси, а й самі дані. Часом буває, що джерело надійне, і агреговані дані там справді є, але LLM може зробити одну-дві помилки й десь підставити не те число. Тому використовуйте переваги LLM, але пам’ятайте слова дядька Бена: «Велика сила — це велика відповідальність».

На етапі збору та перевірки даних у мене почала вимальовуватись картина того, про що конкретно я хочу розповісти. Я почав формувати розділи своєї історії. І тут у мене з’явилося питання: «Що перше — дані чи історія?». Розповідати історію, яку я хочу, паралельно підганяючи під неї дані? Чи взяти те, що говорять дані, і використати дизайн та оповідь як інструменти для пояснення?

Врешті-решт, ми аналітики даних, а не історій. З іншого боку, дослідження феномену однієї з найпопулярніших книг усіх часів значно відрізняється від моніторингу CTR або CTC. Мені здається, що тут складно залишатись на 100% об’єктивними, але ми можемо принаймні прагнути цієї об’єктивності. Ми можемо бути чесними при роботі з даними, і саме на цьому я вирішив зробити акцент.

Я спробував побудувати кілька візуалізацій у Tableau з наявними даними, і знаєте що? Мені сподобалась та історія, яка вимальовувалась у процесі. Це той випадок, коли дані підтверджували гіпотези та здогадки, що виникали під час дослідження. Втім, варто мати на увазі, що так буває далеко не завжди.

Графіки та діаграми

Я точно знав, що обиратиму прості та звичні типи графіків. Моєю метою було допомогти зрозуміти, а не викликати ще більше питань. Стів Джобс говорив, що «простота — це найвища вишуканість». І ця ідея чудово підходить для візуалізації даних.

Просто — не означає погано чи неякісно. Стовпчикова діаграма чи лінійний графік чудово працюють, коли потрібно донести певну думку. До того ж це візуалізація на тему, яку я обрав сам. Тут значно більше свободи, ніж у корпоративному середовищі, тому у мене було більше опцій, як саме подати класичні типи графіків.

Десь я показував звичну лінійну діаграму без вигадок. Наприклад, тут я демонструю Google-тренди пошуку Гаррі Поттера.

А десь намагався стилізувати її під тему — наприклад, показуючи, як змінювалася відвідуваність парків розваг після відкриття павільйонів, присвячених магічному світу Роулінг.

Знову ж таки, ми не дизайнери, а аналітики даних, і тому важливо розуміти, коли доречно витратити на дизайн більше часу, ніж зазвичай.

Бульбашкова діаграма трохи складніша за лінійну: кількість бульбашок може збити з пантелику. Використовуйте розмір і колір, щоб зробити акцент на головному. У моєму прикладі я показую, де фільми про Гаррі Поттера розташовані у списку 150 найпопулярніших фільмів жанрів фентезі або пригод за період із 2000 по 2024 рік.

Кругова діаграма є доволі контраверсійною у сфері візуалізації даних, проте з дотриманням певних правил вона може бути хорошим інструментом для передачі повідомлення.

Мені здається, що при виборі графіків і діаграм потрібно тримати в голові два питання:

  • Що саме я хочу показати?
  • Для кого я хочу це показати?

Відповіді на них допомагають досягнути потрібного результату.

Дизайн

Вибір кольорів, шрифтів і дизайн загалом завжди зводять мене з розуму. Хоча коли вдається правильно підібрати палітру кольорів, то здається, що хліб Андре Тана не такий уже й тяжкий :) Але якщо серйозно, то справу значно полегшує бачення того, що хочеш отримати в результаті.

Подавай заявку на премію DOU!

Цього разу мені абсолютно випадково спала на думку ідея стилізувати візуалізацію під газету Daily Prophet, яка кілька разів з’являлася у фільмах. Спочатку це здалося маячнею, але потім я захопився цією ідеєю. Знаєте це відчуття, коли ідея спершу здається дивною або навіть божевільною, а потім ви робите на неї ставку? Ось це саме той випадок.

Увесь фон, який ви бачите на візуалізації, я зробив у Figma — дуже крутий інструмент, який дозволяє вийти за межі функціоналу Tableau.

У процесі дизайну я також використовував штучний інтелект — Nano Banana від Google. Наприклад, маленькі силуети чарівників, які я використовую на лінійній діаграмі, були згенеровані за допомогою цієї моделі.

Також я змінив заголовок першої сторінки газети. В оригіналі було написано «He who must not be named returns» — «Той, чиє ім’я ми не називаємо, повертається». Я ж переробив його на «The boy who lived changed the world» — «Хлопчик, який вижив, змінив світ», що більше відповідало темі дослідження. Це дрібниці, але саме такі деталі часто запам’ятовуються.

Трохи вище я сказав, що легше працювати, коли маєш бачення фінального результату. У цьому випадку в мене був певний орієнтир, але не чітке бачення. Багато елементів я перероблював у процесі. Інколи мав кілька частин і комбінував їх, як пазл, доки не складався результат, який мене влаштовував.

Іноді результат буде зовсім іншим, ніж ви уявляли на початку — і це абсолютно нормально. У процесі спроб, помилок і численних ітерацій ви починаєте бачити те, що спершу навіть не спадало на думку.

Підсумок

Ну, якось так :) Тепер ви знаєте, як була створена ця візуалізація. Звісно, я не розповідав усе в найменших деталях — інакше це перетворилось би не на статтю, а на казна-що.

Окрім того, це візуалізація, яку я робив для себе. Якщо говорити про рішення для бізнесу, то багато процесів відрізнятимуться (пам’ятаємо про ті самі «Що саме я хочу показати?» і «Для кого я хочу це показати?»).

І якщо я міг би сказати щось наостанок, то щоб це було? Сам себе питаю і вам відповідаю: робіть щось. Робіть візуалізації у Tableau, Power BI, Looker. Форматуйте у Figma та малюйте в Paint. Будуйте графіки в Excel і Google Sheets.Створюйте візуалізації — красиві та не дуже, маленькі й великі, класичні й контраверсійні. Діліться цим, збирайте фідбек і робіть знову.

Я не можу сказати, куди саме це вас приведе, але точно знаю, що ця точка часто буде абсолютно неочікуваною. І, звісно, не будьте маглами. Усім дякую за прочитання :)

Сподобалась стаття автора? Підписуйтесь на його акаунт вгорі сторінки, щоб отримувати сповіщення про нові публікації на пошту.

👍ПодобаєтьсяСподобалось11
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Класний міні-проект. Але до кінця статті не міг зрозуміти, що саме написано в цьому постері)

Дуже прикольно, дякую, було цікаво почитати і подивитися)

Класна стаття та візуалізація! Сам є фанатом Гаррі Потерра ще з дитинства, тому приємно було читати) Дуже дякую!!

Приєднуюсь, до речі нещодавно сперечались з друзями щодо того, кого більше:
— тих хто подивився Гаррі Поттера
— тих хто подивився Володар Перснів ( ну і Хоббіт, тут про весь цей всесвіт маю на увазі)
Точну статистику не знайшли, але чатгпт сказав, що Гаррі Поттер тут виграє)))

Справедливості заради я Володара Перснів ніколи не дивився))

домашнє завдання на вихідні 😁

Я то дивився, але якшо обирати один всесвіт, то для мене вибір очевидний)

Крута візуалізація вийшла)

До речі, вітаю з дебютом статті на ДОУ))

Підписатись на коментарі