Data Scientist в SoftServe
  • Про моделювання поширення COVID-19

    Наведений Вами відеокліп є лише наочною демонстрацією епідеміологічного процесу, який описується SIR-моделью. Різні епідеміологічні моделі описуються системами дифрівнянь, розв’язки яких можуть апроксимуватись логістичними кривими. Саме такий підхід із використанням логістичної кривої і реалізований мною. В чому Ви бачите суперечність ?

  • Про моделювання поширення COVID-19

    Розглянутий мною підхід, зокрема використання логістичної кривої є одним із найбільш широковживаних на даний час для моделювання поширення COVID-19, у моїй статті в репозиторії є відповідні посилання на ресурси де можна знайти опис таких підходів. На чому, крім власного переконання, базуються Ваші, мягко кажучи, іронічні коментарі ?

  • Про моделювання поширення COVID-19

    Для процесу поширення COVID-19 є характерним великий рівень невизначенності та нестаціонарності. Щоб уникнути ефекту ’перенавчання’ (overfitting), такий процес варто описувати простими моделями. Очевидно, що з появою нових даних параметри таких моделей будуть уточнюватись. Тип функцій для моделювання не вгадується експертами, а є обгрунтованим. Такі функції, зокрема, апроксимують розв’язки дифрівнянь, які описують динаміку аналізованого процесу. Свого часу, я був учасником команди, яка отримала перемогу на одному із змагань Kaggle. Ми використовували складні багаторівневі моделі прогнозування на основі машинного навчання (з нашим розв’язком можна ознайомитись тут ). Однак, в даному випадку такі підходи на основі машинного навчання є малоефективними внаслідок суттєвої настаціонарності процесу і порівняно малої кількості даних. Я виклав для вільного використання скріпти, які моделюють процес поширення COVID-19 на основі байесівської регресії і з допомогою них можна знайти уточнюючі прогнози з появою нових даних. Щодо критики, то хотілось би почути думки по викладеному мною матеріалу в рамках заданої тематики, без голослівних тверджень.

    Підтримав: Oleksandr Suvorov
  • Суб’єктивний погляд на Data Science в Україні

    Непевно Ви маєте на увазі мій скрипт Bimbo XGBoost R script LB:0.457

    Підтримав: Dima Sakovich
  • Суб’єктивний погляд на Data Science в Україні

    Фіз.-мат. науки є фундаментальними і включають у себе статистику, мат.аналіз, диф. рівняння, тощо. Ці науки лежать в основі технічних наук, інформаційних технологій, економетрії, кібернетики. Тому кажучи про фіз.-мат. науки я мав на увазі усі напрямки, які із ними пов"язані.

  • Суб’єктивний погляд на Data Science в Україні

    Є області ІТ для яких достатньо курсів по програмуванню. Однак, Data Science тісно пов"язаний із науковим підходом. Наведений вами приклад з УКУ дійсно хороший, там створений прогресивний підхід до навчання. Однак, там ще немає сформованих потужних наукових шкіл. Викладачі, які там викладають сформувались в інших вузах і наукових школах. Важливо для ІТ, зокрема в області Data Science шукати різні форми співпраці із вузами саме у науковій сфері. Щодо оформлення лабораторних робіт то це рутинна робота, але дуже необхідна, вона вчить описувати власні отримані результати :)

    Підтримав: Ольга Ивахненко
  • Суб’єктивний погляд на Data Science в Україні

    Реальні проекти і участь у змаганнях по аналізу даних це різні речі, вони повинні йти паралельно. По реальних проектах Data Scientist не зможе показати свій професійний потенціал, бо серйозні проекти є закриті відповідними договорами. У той же час на змаганнях спеціаліст зможе показати як свій рівень так і отримати новий досвід. Отримати високий рейтинг у змаганнях по аналізу даних досить важко через велику конкуренцію із іншими професіоналами, які також працюють і на реальних проектах. Мотивація професіоналів брати участь у таких змаганнях полягає як в отриманні нового досвіду так і удемонстрації свого професійного рівня для потенційних замовників.