9 серпня Дмитро Кузьменко, ML Engineer у Infopulse та ML Researcher в University of Toronto, проведе онлайн мітап на тему «Еволюція зорових трансформерів. Від ViT до GC ViT та Next-ViT».
Комп’ютерний зір зазнав великого буму ще на початку
Однією з цікавих та нових архітектур в задачах комп’ютерного зору є Vision Transformers, або ж Зорові Трансформери. Запозичивши й адаптувавши механізм уваги та енкодер-декодер частину архітектури від задач NLP, ця ланка в розвитку моделей змогла досягти великих успіхів як на бенчмарках, так і спокійно могла бути портована на Edge девайси. Про них ми докладніше поговоримо на мітапі.
Проте, в ViT була певна кількість недоліків та було достатньо місця для суттєвих покращень. Тож, ми також поговоримо про найновіші та найпотужніші модифікації цього підходу, детально розберемо червневу статтю від NVIDIA про GC ViT, які покращують attention механізм, розширюючи його на локальний та глобальний контекстуальні рівні та зануримось у зовсім свіжий пейпер від ByteDance про Next-ViT — зорові трансформери наступного покоління, створені для ефективного розгортання в реалістичних industry сценаріях.
Також, порівняємо бенчмарки нових моделей, поговоримо про можливі застосування та подальший розвиток напрямку досліджень.
Мітап корисний для досвідчених інженерів та рісьорчерів комп’ютерного зору, junior спеціалістів та початківців, які хочуть краще розібратись у одній із найновіших архітектур та з її деталями, а також всім, кому цікава тема комп’ютерного зору та технічні деталі сучасних моделей.
Квитки тут: https://bit.ly/3aSaFLI
100% коштів від продажу квитків будуть переведені у благодійний фонд «Твоя Опора» для закупівлі апаратів для дитячої реанімації, де рятують життя дітей, які постраждали внаслідок російської агресії.
До зустрічі!
1 коментар
Додати коментар Підписатись на коментаріВідписатись від коментарів