Итоги прохождения курса Data Analysis

В середине октября мы (харьковский клуб ИИ) анонсировали инициативу по совместному прохождению курса Data Analysis в Харькове. Не буду повторяться, почему мы выбрали этот курс — BigData шагает по планете и если вы хотите работать в этой области, то без знаний в матстатистике, Data Analysis и Machine Learning там делать нечего. Прошло 8 недель курса, и этот пост о результатах курса, что у нас получилось и что не получилось.

После анонсов внутри клуба и на разных ресурсах на курс записалось 58 человек, в основном харьковчане, но было также ~15 человек из других городов и даже стран. Все ребята были добавлены в skype-группу для обсуждения курса. После прохождения курса мы провели опрос и получили отзывы 25 участников.

Голая статистика

Записалось в группу — 58 человек
Начали смотреть лекции / посмотрели все 8 недель лекций — 20 / 11 человек
Сделали больше половины квизов — 14 человек
Сделали первое / оба домашних задания — 13 / 8 человек

Мы еще не знаем полноценные результаты курса (кто получил сертификат и какого уровня), но по предварительным подсчетам 7 человек должны получить обычный сертификат (от 100 до 140 баллов из 160), и еще 3 человека — сертификат с отличием (больше 140 баллов). С чем мы их и поздравляем :)

Впечатления от курса

В целом впечатления от курса положительные. Кто-то узнал что-то новое про Data Analysis, кто-то повторил знакомый материал, кто-то разобрался со становящимся мейнстримом в статистике и анализе данных языком R. Материал по большей части понятен и хорошо подан.

Вместе с тем в курсе были и недочеты:

  1. Несмотря на заявленное отсутствие необходимости знаний в статистике в лекциях статистической базе уделялось мало внимания, поэтому приходилось дополнительно разбираться со статистикой.
  2. Задания в квизах нередко выходили за рамки лекционного материала, приходилось копать самостоятельно или ходить на форум курса.
  3. Первое большое задание (а их было 2) давалось раньше, чем были прочитаны лекции, плюс материалов лекций было недостаточно для того, чтобы полноценно справиться с заданием.
  4. Материалы последних 2 недель были недостаточно понятными, что также отметили несколько человек.

Как уже было сказано, домашние задания оказались сложными и требовали серьезных временных затрат, если делать их полноценно. Кроме того, новичкам не хватало понимания, как правильно делать анализ и оформить отчет, а примеров как таковых практически не было. Это тоже подкосило часть группы.

Оффлайн-занятия

Мы посчитали, что кроме онлайн-общения будет полезно также встречаться раз в неделю на выходных, чтобы разобрать непонятное в еженедельных лекциях и домашнее задание (в рамках Honor code). На первое занятие пришло порядка 15 человек и вплоть до 4й недели курса приходило от 10 до 15 человек. На 5й неделе количество немного сократилось, а на 6-8-й неделях по личным причинам отвалилось несколько ключевых людей и, к сожалению, мы перестали собираться, о чем сильно жалеем.

Как оказалось, оффлайн-занятия оказались наиболее продуктивной частью прохождения курса. На встречах всегда можно было найти человека, знакомого со сложной областью или хотя бы разобравшегося в ней. Иногда срабатывал и коллективный разум, когда мы доходили до чего-то самостоятельно общими усилиями.

Что помешало пройти курс

В связи с тем, что активно в курсе поучаствовало не так много человек, как планировало, один из вопросов в опросе был «Что помешало Вам пройти курс до конца?». Самые популярные ответы:

  1. нехватка времени, завалы на работе или в вузе, командировки
  2. семейные обстоятельства, переезд
  3. параллельное прохождение других курсов
  4. недостаточное знание английского языка
  5. Майдан :)

Так как больше половины записавшихся, к сожалению, не ответили на опрос, то наверняка есть и другие причины, которые мы не смогли выяснить.

Выводы

Из нашего первого эксперимента мы вынесли для себя несколько полезных выводов, которыми хотели бы поделиться (вдруг кому-то пригодятся):

  1. Совместное обучение, как и группы совместной борьбы с плохими привычками, неплохо мотивируют людей и помогают им преодолеть сложные ситуации. Можно сказать, что те 15-20 человек, которые по-настоящему нацелились на работу, почти все смогли дойти до самого конца. В случае самостоятельного прохождения результаты наверняка были бы хуже.
  2. Оффлайн-занятия намного эффективнее простого skype-чата. Живое общение пару часов в неделю позволяет намного лучше разобраться в материале и получить ответы на вопросы. На худой случай можно хотя бы организовать онлайновые Hangout-встречи с шарингом экрана.
  3. Для эффективной работы на занятиях должны быть как минимум один ноутбук, проектор и интернет.
  4. Перед занятиями хорошо бы формировать список вопросов на обсуждение, а также находить эксперта или предлагать кому-то разобраться со сложным материалом и рассказать другим. Вопросы возникают всегда, поэтому хорошо иметь под рукой эксперта, который может на них ответить. Нам повезло — у нас было несколько человек, которые разбираются в области или проходили этот курс раньше, поэтому работа шла веселее.
  5. В курсах, где практикуется peer review результатов, очень полезно собирать самые лучшие работы из тех, что проверяли в группе, и анализировать их отдельно. Как самостоятельно, так и на оффлайн-занятиях. Это аналогично совету программистам читать чужой код и учиться на нем.
  6. Организация подобной группы — нелегкое дело, а жизнь вносит свои коррективы. Лучше стартовать подобное с несколькими активными людьми, которые могут подхватить выпавшее знамя в случае проблем. И хотя у нас было несколько организаторов и десяток активных участников, к сожалению, мы не провели все запланированные занятия.

Ну и наконец, одним из неформальных результатов работы группы стали новые знакомства и отличные афтепати. Всегда приятно поговорить с умными и увлеченными людьми, не правда ли? :)

Напоследок хочется поблагодарить всех, кто участвовал в группе, помогал с организацией и делился своим опытом на занятиях и в чате. Отдельную благодарность хочется выразить кафедре Искусственного интеллекта ХНУРЭ и лично завкафедры Рябовой Наталье Владимировне за предоставленную аудиторию, проектор и интернет. Ну, и безусловно, ничего этого бы не могло произойти без Jeff Leek и Coursera :)

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Спасибо за отчет. Познавательно. Не нашел только планов на будущее...)

Планов у клуба довольно много. Следующая встреча в январе, совместное прохождение еще одного курса через несколько месяцев (надо выхохнуть), участие в Kaggle, и даже проведение полноценного хакатона :)

Лично я сейчас активно смотрю в сторону курса class.stanford.edu/...inter2014/about, который стартует в январе. Надеюсь, он прояснит некоторые вопросы, которые не затрагивались в Data Analysis. В общем, посмотрим :)

Коля, тебе вообще ребята отдельный респект высказывали :) Ты был мало того, что одним из экспертов, так еще и здорово помог с организацией.

В который раз я убеждаюсь: если работаешь — за один промежуток времени _полноценно_ можно пройти только один-два курса. Квизы — в принципе простые, там достаточно вникнуть в содержание видеолекций и/или чуть-чуть порыться в документации к пакетам R. А вот для нормального выполнения проектов нужно неслабо перелопатить документацию, книги, вики, стековерфлоу... И всё равно у меня вышло в итоге только 140 баллов, т.к. на первом проекте баллы оказались низковаты.

140 баллов — это очень круто, это сертификат с отличием ;)

Круто! Спасибо за отчет, наверняка кого-то вдохновит записываться на другие курсы.

Очень надеемся на это :) Вообще Coursera, Udacity, EdX, ШАД и прочие — просто молодцы. Даже не знаю, где еще можно было бы черпать знания по анализу данных, Machine Learning, NLP и прочим областям, если бы их не было.

Информации всюду масса — вопрос в отсечении лишнего и выделении главного.

Сейчас — да. А вот 7-8 лет назад я искал информацию по NLP для своего диплома и тогда был большой напряг найти нормальные статьи по этой тематике. Про полноценные курсы речь вообще не шла, к сожалению.

Инфа была, что-то было и ранее, о полноценных курсах понятия не имею, 99% что не было.

Посмотри hexlet.org Силами энтузиастов проект делается (KZ-UA-RU), но выглядит очень интересно.

Спасибо, интересный проект.

Спасибо за помощь :)

Підписатись на коментарі