Вводный курс по применению глубокого обучения для решения базовых задач компьютерного зрения: классификации изображения, обнаружения объектов, семантической сегментации.
На курсе рассмотрим:
— основы машинного обучения и компьютерного зрения (функции потерь, оптимизация, обработка изображений);
— основы глубокого обучения: нейронные сети, алгоритм обратного распространения ошибки;
— свёрточные нейронные сети;
— attention механизм, трансформеры (в контексте задач компьютерного зрения);
— классические архитектуры нейронных сетей для задачи обнаружения объектов;
— архитектуру U-net для семантической сегментации, GAN, основы процесса формирования изображения, transfer learning и прочие.
● 6 октября 2021, курс длится 3 месяца
● 11 000 грн/мес, 33 000 грн при полной оплате курса, 11 550 грн/мес при оплате частями
● 25 студентов, каждый студент получает регулярный фидбек от куратора группы
Детали и регистрация
Куратор курса
Machine Learning Engineer в Snap.
Инженер в области компьютерного зрения и машинного обучения. Работал над решениями для задач 2D обнаружения и трекинга объектов, оценки 3D параметров объектов в моно и стерео режимах.
Программа курса
1. General course introduction
• Overview of computer vision problems.
• Image processing, data augmentation.
• Learning from data, loss functions, formal definition of the image classification problem.
• Optimization, SGD, SGD with momentum, ADAM, RADAM, RANGER, hyperparameters tuning.
• Neural networks basics, backpropagation algorithm.
2. Backbones: convolutional NN, attention, transformers
• Convolutions, batch normalization.
• Popular convolutional NN backbones — ResNet, MobileNets v1-v3, EfficientNet, FPN.
• Attention, self-attention, visual attention, transformers, visual transformers.
3. Object detection
• Object detection via sliding window, RCNN, Faster RCNN, YOLO, SSD.
• Centered, detection transformer (DETR).
4. Extra
• Semantic segmentation with U-nets, GANs and their applications — generating images, image-to-image translation.
• Basics of image formation: intrinsic camera parameters, distortion, depth from stereo, demosaicing.
• Transfer learning, consistency losses, multitask learning.
• Distillation, quantization.
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів