В четверг состоялась первая встреча AI клуба Grammarly, которую я анонсировал в предыдущей колонке. Ее основной целью было знакомство и определение направления дальнейшего движения. Продлилась встреча 3 часа и по сути состояла из трех частей.

Первая часть состояла из
- Роман Ворушин рассказал про фильтрацию нграм с помощью SVM (слайды)

- Арсен Костенко говорил о применение нейронных сетей для поиска кадров с вшитыми субтитрами в видео-потоке. Он подчеркнул, что нейронные сети очень хорошо подходят для классификации изображений, поскольку саму сеть можно визуализировать и в некотором роде сопостовлять с изображением. Тема нейронных сетей вызвала очень большой интерес и множество вопросов.
- Дмитрий Дзюба из AILEN Lab показал интересные разработки лаборатории: выделение фич в изображениях в виде кривых
2-го порядка, динамиечскую ассоциативныую память на основе нейронных сетей и т.д. (материалы доклада) - Александр Краковецкий рассказал про свой опыт использования алгоритмов для очистки текста (a la readability), а также Named Entity Recognition
После этого в течение получасового перерыва у всех участников, которых собралось около 80 (в общей сложности 110 человек заполнило регистрационную форму), была возможность познакомиться и пообщаться, разбившись на кружки по интересам.
А завершающая, самая длительная часть была посвящена обсуждению того, что делать дальше. Cреди пришедших я для себя выделить 3 основные группы:
- практики NLP (были представители ряда компаний, имеющих коммерческие проекты в этом направлении: кроме Grammarly, это Samsung, Zoral и другие), а также ребята, занимающиеся научной работой в области лингвистики, и даже успешные NLPшники-фрилансеры
- энтузиасты робототехники и AI, среди которых были как минимум трое ребят, способных рассказать и показать результаты своих экспериментов, а также девушка Настя со своим роботом (которая посетовала, что сейчас никто уже не умеет паять)
- интересующиеся темами машинного обучения и ИИ, но не имеющие возможности (пока что) применять ее на практике
Наибольшая заинтересованность была в обзорных лекциях и практических мастер-классах, а также в хакатонах. Из чего я для себя вывел «идеальный» формат дальнейших встреч. Выбирается какая-то не слишком узкая, но и не слишком широкая тема (например: нейронные сети, парсинг, кластеризация,...).
- приглашенный эксперт в этой теме делает обзорный доклад о state of the art
- затем
1-2 человека делают практические доклады c разбором реальных задач, показом и рассказом о коде, анализом основных проблемах, подводных камней и способов их обхода - докладчик(и) формулируют какую-то практическую задачу по теме, а участники встречи берутся за ее решение (с докладчиками в качестве менторов) — такой себе хакатон. Скорее всего для решения этой задачи понадобится больше, чем час-два времени, т.е. на встрече можно будет начать, а продолжить уже в асинхронном режиме после нее
Возможно, такой формат будет редко достижим, но мы попробуем организовать следующую встречу по этому образцу...
В заключение хочу поделиться веселым видео с последнего ТЕДа, которое мы собирались показать на встрече, но на это совсем не хватило времени. Конечно же, про роботов.

21 комментарий