Workshop: Data Science at Readdle — сумісний проект Data Science UA та Readdle, під час якого ми разом з Иван Будников та Борис Таровик розглянемо аспекти роботи Data Scientist’а, життєвий цикл
Учасники воркшопу зможуть побудувати
Участь у воркшопі безкоштовна за попередньою реєстрацією (ви повинні отримати лист з підтвердженням реєстрації на подію).
Спікери події:
Борис Таровик — RnD Engineer, Readdle. Борис навчався в Московському фізико-технічному інституті кафедри молекулярної та хімічної фізики. Працював у Об’єднаному інституті високих температур, де проводив молекулярне динамічне моделювання високоенергетичних процесів.
Іван Будніков — Machine Learning Engineer, Readdle. Навчався на фізичному факультеті Національного університету імені Тараса Шевченка. Іван займається дослідженнями недиференційованих функцій активації нейронних мереж та виявлення таблиць і формул у форматі PDF.
Кому буде цікаво:
— зацікавленим у Data Science, Machine Learning
— студентам математичних та інженерних факультетів
— розробникам/QA
Необхідне програмне забезпечення:
Python3, numpy, sklearn, tensorflow
Програма воркшопу:
1) Introduction
— Data Science, Big Data, Machine Learning — what does it mean?
— Machine Learning vs usual algorithms — what’s the difference?
— Types of ML — supervised, reinforced, unsupervised
2) Knowledge you need to have to become Data Sceintist
— theory vs practice
— useful courses, articles, topics
3) Differences in a work of Data Scientist and Software Developer
— what data scientist’s debug is
— think more often about a code than writing it
4) Data science in product company vs. freelance
— product is always about a quality and customers
— product is always about a quality and customers
— data science is not only neural networks
5) Lifecycle of ML solution development (Ivan)
— Data Mining. Importance of good data. Data sources, data markup.
— Cleaning data. Data augmentation. Training/Validation/Test split.
— Using the
— Result metrics — training, validation and test errors
— Underfitting and overfitting — what is it and how to deal with.
— Final evaluation. Precision, recall, F1-score.
— Network optimisation for release.
— Release. Brief review of future algorithm improvement: centralised after-training, decentralised after-training, combined.
6) Review of simplest ML algorithms
— K-means
— PCA
— LDA
— Linear regression
— Neural networks. What is it, where did it come from. Block notation. Some further improvements:
— convolutional nets
— recurrent nets
— LSTM
7) Practical part 1: creating simplest ML solution for house price estimating, using sklearn/numpy
8) Working examples of neural networks solutions in production
— Readdle
— Prisma
— Google
9) Practical part 2: creating neural network to solve computer vision problem, using tensorflow
10) Sometimes things go wrong
— lessons we’ve learned
— practical recommendation
Участь у воркшопі безкоштовна, заповніть форму та отримайте підтвердження реєстрації до 18 червня.
Кількість місць обмежено/30 учасників.
Реєстрація буде закрита 17 червня о 23:59
1 коментар
Додати коментар Підписатись на коментаріВідписатись від коментарів