Аналітика даних та штучний інтелект у турбулентні часи. Нові можливості для кожного з нас
Одна з найбільших проблем, яка зараз стоїть перед спеціалістами з аналітики даних — це моделювання розповсюдження коронавірусу. Аналітика даних відіграє ключову роль в тому, як ми можемо побороти цю пандемію і жити далі в посткризовому світі.
Моделювання розповсюдження коронавірусу зазвичай роблять за допомогою алгоритму під назвою імітаційне моделювання за методом Монте-Карло. Цей алгоритм загалом досить простий: відбувається генерація випадкових чисел на комп`ютері, за допомогою яких можна моделювати різні події, наприклад пропускну здатність транспортних розв’язок чи станцій метро. Цей метод під час Другої світової війни в рамках Манхеттенського проєкту розробили американські вчені для моделювання атомної реакції. Цей самий метод застосовують для моделювання поширення коронавірусу.
Як вирівняти криву пандемії
Розглянемо чотири варіанти розвитку подій під час пандемії, які можна змоделювати.
- 1 — коли країна чи регіон не впроваджують ніяких заходів;
- 2 — коли діє карантин але немає змоги ізолювати 100% захворілих;
- 3 — коли впроваджуємо соціальне дистанціювання, але 25% людей його порушує;
- 4 — коли впроваджуємо соціальне дистанціювання і тільки кожен восьмий його порушує.
Для прикладу візьмемо місто, у якому мешкає 200 осіб.
Варіант 1 — здорові і хворі люди (генерація випадкових чисел) переміщуються по місту, спілкуються один з одним і розповсюджують вірус. Крива показує, що в такій ситуації всі захворіють та всі одужають (за винятком летальних випадків). Висновок — якщо нічого не робити, то рано чи пізно заразиться кожен.
Варіант 2 — коли запровадили карантин, який обмежує рух та спілкування. Але потім люди порушують його та заражають інших. Крива на графіку буде меншою, ніж в першому варіанті, тобто менше людей хворітимуть одночасно.
Варіант 3 — коли кожна четверта людина порушує соціальну дистанцію, а 75% дотримуються. Крива буде набагато нижчою.
Варіант 4 — коли тільки кожен восьмий порушує соціальну дистанцію, крива буде ще меншою. Це означає, що для того щоб вирівняти криву пандемії, необхідні заходи соціального дистанціювання і щоб якомога більше людей їх дотримувалися.
Також якщо не обмежити поїздки та перельоти, то з часом пандемія дійде до всіх країн та регіонів і заразяться всі люди.
Стратегія стримування
На прикладі ситуації в італійських містах Бергамо та Лоді можемо побачити, як пряма пандемії змінювалась залежно від часу впровадження карантину. Карантин у Бергамо почався аж 8 березня, тоді як в Лоді — 23 лютого. Графік розповсюдження хвороби показує, що в середині березня в Лоді пряма пандемії йшла на вирівнювання, а водночас в Бергамо вона досі стрімко йшла вгору.
Стратегію стримування пандемії під назвою «Етап молотка та танцю» описав у своїй статті американський експерт Томас Пуейо.
Головна ідея — якщо ніяк не протидіяти епідемії, то захворіє все людство, а якщо запровадити тільки карантин без заходів соціального дистанціювання — менше, але все рівно крива йтиме вгору. Тому на Етапі молотка потрібні як карантинні заходи, так і дотримання соціального дистанціювання, які призводять до того, що крива йтиме донизу. Період «танцю» — це тримати кількість заражених приблизно на одному рівні при другій та третіх хвилях захворювання, доки не буде знайдена вакцина чи вірус не мутує до звичайної хвороби. Обмеження на етапі «танцю» — не такі суворі.
Із аналітики та моделювання можемо сказати, що Китай перейшов на етап «танцю». Італія, США, Канада та більшість інших країн ще на етапі «молотка». Щодо України прогнози робити ще досить важко, оскільки кількість проведених тестів недостатня. Тому, щоб моделювати ситуацію в Україні, треба розраховувати непрямими методами. Це досить важко, оскільки ми не знаємо скільки хворих на цей момент.
Канада, як і більшість країн, зараз перебуває на етапі молотка та починає вирівнювати криву пандемії. Якщо це вдасться, то кінця жорсткого карантину в Канаді (як і в США) можна очікувати на початку травня.
Ситуація в Італії — також на етапі «молотка». Етап «танцю» буде, коли певну частину карантинних заходів скасують. Пік в Італії був 26 березня, а тепер країна вирівнює криву пандемії. Звісно, в Італії відбулось те, чого не відбулось в інших країнах — перевантаження системи охорони здоров’я, особливо в деяких регіонах. Коли система охорони здоров’я перевантажена, то відсоток смертності зростає.
У Китаї зараз почалась друга хвиля зараження — фіксують понад 100 нових випадків на день. Але це зовсім інші цифри порівняно з першою хвилею, тому Китаю, схоже, вдається подолати пік другої хвилі пандемії та теж почати вирівнювати криву.
Важливо розуміти, що уряди багатьох країн виявились неготовими до моделювання цієї ситуації за допомогою аналітики даних. Слід зауважити, що даних дійсно недостатньо.
Як зменшити коефіцієнт захворюваності
Коефіцієнт захворюваності коронавірусу становить
Для того, щоб крива пандемії спочатку стала плоскою, а потім пішла вниз, нам треба зменшити коефіцієнт захворюваності коронавірусу до 1 або менше — тоді відбувається зменшення кількості випадків.
Як це зробити:
- тестувати якомога більше людей;
- дотримуватись особистої гігієни;
- визначати осіб, які контактували з хворими, та ізолювати їх;
- запроваджувати обмеження на поїздки, скупчення людей тощо.
Усі ці заходи зменшують коефіцієнт, але завдання — зменшити його не до 0, а до менше ніж 1, бо тоді почнеться спад. В Ухані вдалося зменшити цей коефіцієнт десь до 0,33. Водночас ми не можемо розрахувати, як кожен з обмежувальних заходів вплине на зменшення коефіцієнта зараження, тому більшість країн робить якомога жорсткіші заходи для того, щоб максимально випрямити криву пандемії. Але деякі країни, як Швеція, не впроваджують вкрай жорстких заходів, а деякі, як Білорусь, — взагалі нічого не впроваджують.
Із точки зору аналітики даних, для боротьби з коронавірусом доцільними є такі дослідницькі напрямки:
- Розробка вакцини.
- Дослідження та моделювання кількості доступних ліжок та вентиляторів в лікарнях та як їх можна перерозподілити.
- Моделювання виходу з кризи на основі Монте-Карло методів та тенденцій часових рядів.
- Моделювання симптомів за допомогою NLP та Machine Learning.
- Моделювання ухвалення рішень щодо зняття карантину.
Отже, робота аналітиків та спеціалістів зі штучного інтелекту була і є однією з найпотрібніших у наш час. Навіть у турбулентні часи та періоди кризи вони завжди можуть знайти роботу та у той же час бути корисними суспільству. Саме аналітика у майбутньому може допомогти зберегти людські життя, ресурси країн та скоротити час карантинних обмежень.
Олександр Романко — почесний директор магістратури з бізнесу і менеджменту в сфері штучного інтелекту та аналітики даних в Київській школі економіки, старший науковий співробітник в IBM Canada
6 коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів