Технічна альтернатива трансляції за мільйони: як зняти футбольний матч однією камерою

Чи цікавились ви, як організована трансляція футболу по телевізору? Візьмемо, наприклад, НСК «Олімпійський». Десяток операторів знімають поле з різних ракурсів та постійно перемикаються між картинками, щоб показати найцікавіше на полі. Професійна відеозйомка важлива, але й коштовна — аматорські та невеликі клуби часто не можуть собі її дозволити. А тепер уявіть, що аналогічну трансляцію можна зробити завдяки одній камері за допомогою технології машинного навчання та комп’ютерного зору (computer-vision). Вона не потребуватиме цілодобового нагляду великої команди, значних ресурсів. Висвітлення сучасних професійних та напівпрофесійних спортивних змагань, а також автоматизований аналіз результативності гри для малих спортивних клубів стали реальністю, завдяки камері Pixellot. Про те, як українські інженери вдосконалюють технологію та працюють з запитами споживачів й бізнесу розповідає у матеріалі Ігор Рогацький, Senior Manager, Engineering, GlobalLogic. Стаття буде корисною як розробникам, що хочуть створювати аналогічні проєкти, так і представникам спортивної сфери.

Фільмування гри завдяки штучному інтелекту

У світі живе майже 8 млрд людей. З них близько трьох сотень мільйонів грають у футбол, а 3.5 мільярда вважають себе фанатами цієї гри. Футбол — чи не найпопулярніший вид спорту, але навіть віддані фанати гри бачать лише частину всіх матчів.

З мільйона спортивних заходів, що проходять у світі щодня, активно висвітлюються лише професійні змагання або ж чемпіонати за участі відомих клубів. А це лише вершина айсберга. Більшість спортивних подій регіонального чи національного рівня лишається в тіні. Командам чи клубам часто не вистачає ресурсів для трансляції змагань, хоча вони й організовані на високому рівні.

Так, проведення одного професійного футбольного матчу в Україні може обходитись організаторам у 200-500 тис. грн — залежно від рівня матчу, категорії стадіону, операційних витрат тощо. При цьому фільмування гри та її трансляція потребують цілої команди операторів, від кількох до десятка камер, а також — суттєвих витрат на логістику, установку та налаштування. А це все — час, фінансові та людські ресурси. Тож, подивитись чемпіонат області, шкіл, рідного університету, району чи регіональної ліги по телевізору чи на YouTube зазвичай неможливо. Як наслідок, родина й шанувальники мають особисто відвідати подію чи прочитати про результати після матчу. А часто вони взагалі можуть не знати про такий захід.

Щоб спортивні події будь-якого масштабу знайшли свого глядача є доступна альтернатива — технологія для автоматичної трансляції спортивних матчів Pixellot. Так, спортивні клуби різного масштабу можуть наживо показувати будь-які змагання, дозволяючи вболівальникам бути частиною гри в прямому ефірі чи в записі, а тренерам й гравцям — проводити роботу над помилками після матчу та просуватись в рейтингових таблицях на перші місця.

Технічним та сервісним вдосконаленням системи автоматичної трансляції спортивних ігор займається українська команда інженерів, яка долучилась до проєкту у 2015 році. Так, більше ніж 50 спеціалістів щодня працюють над адаптацією алгоритмів штучного інтелекту, покращенням якості зображення та оптимізацією мобільного керуванням камерою.

Історія та архітектура Pixellot

Ідея створити Pixellot виникла у 2013 році. Засновники Гал Оз та Мікі Тамір хотіли автоматизувати виробництво відеоконтенту у світі спорту. Вони створили прототип повністю автоматизованої системи відеотрансляції, яка не лише показує гру в режимі реального часу, але й аналізує ситуацію на полі.

Система Pixellot — це кілька камер, які під’єднані до блоку обробки відео — це може бути як комп’ютер поряд, так і у cloud середовище. Камера працює як людське око — бачить все поле, але концентрується в епіцентрі гри. Завдяки алгоритмам штучного інтелекту система в режимі реального часу аналізує відеопотік, розділяє поле на певні сектори, розпізнає активні об’єкти та виводить на екран безпосередньо «активну» ділянку поля, — у форматі звичної трансляції. Так, камера розпізнає та відстежує м’яч, рефері, гравців, визначає межі поля і рухається разом з об’єктами наближаючи чи віддаляючи зображення. І якщо для звичної трансляції необхідна команда операторів, кілька камер та додаткової техніки, то для роботи системи Pixellot достатньо лише встановити камеру у потрібному місці на стадіоні. Надалі безпосередня участь людини вже не потрібна — ініціювати зйомку можна через додаток у смартфоні, а переглядати контент — на відповідній ОТТ-платформі. Інфраструктура налаштована так, що трансляція запускається і закінчується у заздалегідь визначений користувачем час, а, за потреби, він зможе її перервати чи продовжити. Спеціаліст контролює лише її неперервність, технічні моменти та цілісність інсталяції — наприклад, щоб ніхто не пошкодив дроти й не перервав відеопотік.

Щомісяця камера Pixellot генерує понад 90 тис. годин живого контенту, який надалі також використовується для тренування мереж, та, відповідно, для вдосконалення трансляції та аналізу майбутніх ігор.

Камера, що генерує аналітику

З одного боку спорт — одна з найпрогресивніших і стабільно фінансованих галузей. З іншого — клуби та тренери й досі формують аналітику, розбираючи результати гри в ручному чи, в кращому випадку, напівавтоматичному режимі, залучаючи до процесу 10, 20, 50, а то й більше спортивних аналітиків — людей, які передивляються гру та відмічають кожен ігровий момент, як-то удар, фол, небезпечний момент тощо. На нашу думку — це довго та зовсім неефективно.

Система Pixellot допомагає автоматизувати цей процес, та, якщо не повністю прибрати ручну обробку, то максимально її зменшити та, при цьому, досягти високої ефективності та масштабованості. Тільки так тренер зможе отримувати аналітику та розбір гри практично в режимі онлайн. Так, скажімо, бачачи дані по точності ударів, теплові карти, персональну ефективність гравця й моменти атаки, тренер може коригувати малюнок гри ще до завершення матчу!

Стрімке зростання, постійне вдосконалення

Pixellot розвивався швидко. При цьому спочатку камера призначалась переважно для непрофесійної широкої аудиторії, а тому мала бути максимально адаптована під основний запит ринку — якісна картинка з максимальним функціоналом за доступною ціною трансляції.

В доволі короткі терміни команда розробників мала вивести на ринок одразу повноцінний продукт із якісно реалізованими ключовими функціями. Тому в пріоритеті була технологічна якість, а не дизайн чи перестановка кнопок справа наліво. Якщо колесо автомобіля пофарбувати в червоний, він краще не поїде. Тому ми одразу проєктували цілісну систему й покроково доповнювали продукт новими можливостями, щоразу тестуючи камеру на стадіоні та запитуючи фідбек у користувачів.

При цьому ми постійно вдосконалюємо продукт — розробляємо нове покоління камер, покращуємо графіку, додаємо нові функції, інтегруємо інші спортивні сервіси, розробляємо суміжні продукти як-то мобільні додатки для конфігурації камер, платформу для коментаторів та інше. За кілька років команда розробників змогла розробити екосистему для автоматичного розпізнавання та трансляції більш ніж 15 видів спорту на рівні звичного для аудиторії професійного відеопродакшену.

Розвиваючи продукт й самі команди професійно зростають. Наприклад, ми шукаємо як нових членів команди, так і можливості випробувати камеру в реальних умовах, побачити свій продукт «очима оператора» та спробувати себе в новій ролі. У вересні ми протестували розробку на матчі з футзалу IT League у Харкові. Командою інженерів ми поїхали підтримати наших львівських колег на грі та заодно запустили живу трансляцію змагань для фоловерів у соцмережах. Тепер аналізуємо сильні й слабкі сторони камери, щоб далі покращувати якість системи.

Особливості та складнощі роботи над камерою

Розробка такого продукту поєднує в собі величезну кількість додатків, компонентів та технологічних рішень. Це значний набір сервісів різної складності та об’єму, які треба також по-різному моніторити та підтримувати. При цьому сам процес проєктування й вдосконалення може суттєво різнитись.

В основі системи Pixellot лежать алгоритми машинного навчання. На відміну від розробки мобільних додатків, де функціонал змінюється, в основному, згідно з запитами та потребами користувачів, вдосконалення ML-алгоритмів потребує нових інсталяцій. Якщо система справно працювала на одному полі, це не означає, що вона так само добре впорається на іншому. Інсталяція камери та її конфігурація може дещо різнитись для різних локацій — через фізичні параметри поля, потребу виставити баланс кольорів під трансляцію гри ввечері чи у дуже сонячну погоду.

Більшість підводних каменів та моментів, які треба покращувати, пов’язані з алгоритмами машинного навчання, адже штучний інтелект — як дитина. Його потрібно навчати, годувати інформацією, розповідати як треба робити, а як не варто. Це постійний налагоджений процес вдосконалення.

Наша мета як ІТ-екпертів — це максимально автоматизувати процес навчання алгоритму та налагодити обробку нових вхідних даних в максимально короткі терміни. З кожним наступним кроком, з кожною новою інсталяцією система стає все більш адаптованою до наступної гри. В лабораторних умовах вона може працювати ідеально, але поле — це не тестовий майданчик. І чим більше в системи додаткових даних, тим камера більш ефективна за різних умов. Наприклад, ви показуєте системі мобільний телефон і вона його ідентифікує. А потім — показуєте їй шматочок телефона, в іншому кольорі чи змінюєте ракурс. Для вас він так і залишиться телефоном, а технологія може його не розпізнати. Тому, інженер має зібрати сотні тисяч варіантів цього телефона й передбачити різноманітні сценарії, схеми, приклади застосування. Адже, якщо змінюється локація, форма м’яча чи колір ігрового майданчика, система може не зрозуміти, що це також гра.

Проте, навіть сотні тисяч зображень, на яких вчилася мережа, та високий рівень натренованості не гарантують високої точності результатів. Процес розробки таких систем складний і розробники мають креативно підходити до розв’язання задач. Наприклад, вирішити, як розпізнати номер гравця за нестандартних умов на полі. Неординарні рішення — це наш ключ до успіху.

Користувацький досвід — найголовніше

Першочергово система має допомагати аматорам та напівпрофесійним клубам. Тож ми зробили так, що практично кожний спортивний тренер і шкільний вчитель могли проводити високоякісні трансляції. А зараз, вже бачимо, камерою користуються й професійні клуби для фільмування власних ігор та аналізу результатів. При цьому кожен із ринків має полярні потреби — від розміщення логотипу й брендингу до накладення звуків на відео, різного роду монетизацію та використання загалом.

Задовольнити потреби кожного бізнесу допомагає правило «чим простіше, тим краще». Ми прагнемо до того, щоб користуватись системою було легко й швидко. Як приклад, щоб клієнти могли легше розібратись з системою, ми розробили інструкцію користувача. Спочатку це був текстовий документ, який згодом перетворився у функціональний мобільний додаток, що дозволяє налаштувати камеру й керувати нею. Тепер кожен може перейти у застосунок й побачити відеоінструкцію, ілюстрований процес знімання та приклади функціоналу. Таким чином користувачі, які мають справу із системою вперше, можуть легко її встановити та налаштувати.

Розробники на проєкті мають не лише технічні задачі як-то написати код згідно з технічним завданням, але й ведуть діалог з кінцевими споживачами. Так ми не лише розробляємо, але й реалізуємо нові функції. Щоб сформувати досконалішу систему та зробити потрібний ринку продукт. Так, ми часто одягаємо обладунки оператора та поринаємо у світ відеозйомки, спілкуємось з тренерами команд «розбираючи» якусь конкретну гру. Після спілкування з бізнесом і користувачами ми краще розуміємо їхні потреби та можемо пропонувати рішення. Важливо пробувати продукт в дії, щоб не лише розв’язувати проблеми клієнта, які вже виникли, але й передбачити поведінку камери та заздалегідь підготувати альтернативні рішення. Такий симбіоз теорії, практики та спілкування із користувачами допомагає нам регулярно вдосконалювати алгоритми штучного інтелекту, робити управління камерою та аналіз результатів гри зручнішими. Це дає нам глибше розуміння потреб, а, отже, і можливості впливати на функціональність та стратегію розвитку цілого продукту загалом.

Що далі?

Ідеального рішення немає, адже і спорт, і робота з технологіями — це процес. За весь час роботи на проєкті ми багато чого замінили, а ще більше хочемо додати. Як у грі кожного разу можна змінити тактику, покращити техніку володіння м’ячем чи змінити склад команди, так і в розробці — завжди хочеться щось доробити в коді, поліпшити функціональність і зробити роботу з камерою зрозумілішою для кінцевого споживача. Оновлюємо систему ми не за запитом бізнесу, а регулярно — кожні 2-3 тижні.

Розвиток алгоритмів, попит на інтерактивні рішення та зростання ринку спортивних технологій виводять на перший план розробки, центральною фігурою у яких стає машинне навчання. Така тенденція сприяє тому, що на ринку з’являються нові гравці й цікаві рішення. Тому технологічні й економічні перспективи у галузі спортивних розробок мають високий потенціал.

Більше про проєкт Pixellot читайте за посиланням!

Зразок роботи камери можна подивитись у спеціальному відео про виступ футбольної команди GlobalLogic Lviv!

👍НравитсяПонравилось2
В избранноеВ избранном0
LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Это не та система, которая в прошлом году в Шотландии весь матч снимала лысину бокового судьи вместо мяча?)

Дуже цікаво. А є якісь відео роботи системи у відкритому доступі? Хоч із тренувань, хоч із футзалу...

Подписаться на комментарии