×Закрыть

Актуальное в Data Science и Python

Здравствуйте, изучаю data science и анализ данных на питоне, прохожу курсы (типа вот этого: courses.edx.org/...​ft DAT210×3T2017/course).

Хотелось бы кроме этого параллельно читать литературу на эту тему. Ищу что-то актуальное и современное на данный момент, как по data science (возможно ML), так и по самому питону.
Буду рад советам что почитать

LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

опять горе-маркетологи генезис... после этих курсов вы кем в Украине работать сможете, в сильпо или укрпочте, может быть, на водафон... по факту, это каждодневные выгрузки таблиц с данными.. задумайтесь, сколько сможете так проработать, а главное за какую цену.

Наконец-то! На DOU появилась статья из комментариев к которой можно почерпнуть что-то,кроме сарказма и упаднических настроений. Спасибо автору.

Починати треба з www.deeplearningbook.org і Вікіпедії :)
Дальше залежно від напрямку який цікавить. Сучасне на даний момент краще вчити по мануалах і блогах.

1. курс от ODS на хабре
habrahabr.ru/company/ods/blog/334960
2. курсы от fast.ai, причем (раз Вы студент) рекомендую сначала пройти Computational Linear Algebra, а потом уже попробовать обе части Deep Learning

Книги очень сильно повторяют друг друга, хорошо отличаются те которые с подготовленными учебными кейсами. Посмотри оглавление каждой и реши какую будет интереснее всего читать
Почти в каждой есть раздел по НЛП, для этой темы лучше отдельные книги (добавил внизу)
1 Babcock J. — Mastering Predictive Analytics with Python — 2016
2 Megan Squire — Mastering Data Mining with Python — Find patterns hidden in your data — 2016
3 Downey A.B. — Think Python. How to Think Like a Computer Scientist, 2nd Edition — 2016
4 Phillips D., Giridhar Ch., Kasampalis S. — Python Master the Art of Design Patterns — 2016
5 Swamynathan M. — Mastering Machine Learning with Python in Six Steps — 2017
6 Ketkar N. — Deep Learning with Python — 2017
7 Massaron L., Boschetti A. — Regression Analysis with Python — 2016
8 David Julian — Designing Machine Learning Systems with Python — 2016
9 Unpingco J. — Python for Probability, Statistics, and Machine Learning — 2016

NLP NLTK
1 Hardeniya N. et al. — Natural Language Processing Python and NLTK — 2016
2 Bengfort B. — Applied Text Analysis with Python. Enabling Language Aware Data Products with Machine Learning — 2016

Ну ось для чого студенту рекомендувати книжки за 20-50 баксів?

Если проблемы с финансами — можно скачать, не перекладывайте с больной головы на здоровую.
Спросили современные книги хороших изданий — их есть у меня, попросили бы бюджетные книги по 200 грн штука (не уверен что такие есть по питону датасаенса вообще, если не примитивный справочник) — предложил бы не тратить на них время а проходить курсы
че вы за ТС расписываетесь?

Если проблемы с финансами — можно скачать,

Хіба можна скачати ці книги за 2016-17 безкоштовно?

думаю на рутрекере есть, там всегда была большая подборка книг по ит

это, а если не бум-бум в математике(подзабыл программу вузовскую), то докуда и что надо вскопать шоб было минимально понятно?

Ну очевидный ответ — подтянуть саму математику, обратите внимания на книгу которую посоветовал Андрей, там сразу все базовые необходимые мат знания указаны —

www.deeplearningbook.org

Некоторые книги специально заточены на минимум математики, из можно ковырять сразу, например (да, не много таких именно по МЛ)

2 Megan Squire — Mastering Data Mining with Python — Find patterns hidden in your data — 2016

понятно, что подтянуть математику, но конкретно что надо(матан, дифуры, линейная алгебра итд)? может есть какой-то список для отсталых?

вот ведь ленивый, матрицы маст хев, графы тоже
www.deeplearningbook.org/contents/prob.html
www.deeplearningbook.org/...​tents/linear_algebra.html
www.deeplearningbook.org/contents/numerical.html

2 Linear Algebra
3 Probability and Information Theory
4 Numerical Computation

Scalars, Vectors, Matrices and Tensors
Multiplying Matrices and Vectors
Identity and Inverse Matrices
Linear Dependence and Span
Norms

Починати треба в такому порядку:
1) лінійна алгебра
2) статистика
3) матан
4) теорія ймовірності
5) чисельне моделювання

В универе на это 3 года уходит.

по факту в вузе оно все сильно растянуто и сюда еще прибавляются всякие «нужные» предметы итдитп. эту программу можно неспешно прогнать за месяцев 6-7

Ну-ну. Лекции и практические. Да ужать чуть можно, выкинув Истории КПСС.
Но даже в таком темпе, как в совке или сейчас в ВУЗах большинство не догоняет и 10% того, что дают на этих предметах.
Но это нормально, для аустсорс программазма ничего этого не надо.

Более того, для машине лёрннинга и дата сайенса в постсовке тоже не нужно этих знаний. Скачал тензорфлов, засунул ему какую базу, пусть считает. Менеджеры заказчика разведут. (мне ЕПАМ именно такую работу предлагал, но я лох и не умею разводить и не люблю).

собственно базовый CS(да и думаю вообще специализация CS) и не подразумевает, что тебе надо это все максимально хорошо понимать как студентам примата или мех-мата. все давно уже написано, только дергай апишки и имей небольшое представление как оно работает. я собственно «учился» в трех вузах и могу смело сказать, что эти лекции не стоят гроша и их можно спокойно скипать т.к. это начитка из книги, а практика абсолютно не сложная, как по мне. так что 6-7 месяцев это нормально для такой программы.

CS как раз требует.
Вот только на постсовке он не требуется.
Посему, если хочешь вайтивдатасаентистов на просторах постсовка, то тебе хватит умения заюзать тензорфлов и подобное и немного питона.

я не собираюсь сейчас никуда входить, просто подтягиваю программу и немного расширяю кругозор. там дальше уже будет видно — дергать апишки или нет.
ЗЫ
никому особо в бизнесе не нужна ваша честность\чистоплотность, вы или выполняете поставленную задачу и получаете деньги за результат, или сидите без ничего(ваш вариант)

Ты прав на 100%.

З.Ы. Так я и написал, что я лох. За это уже говорит то, что я оказался в 50 у разбитого корыта.

Якщо можливо б було повернутися 10-20 років тому назад, щоб ви зробили по іншому?

Уже писал 100 раз.
1. Собственная раскрутка в инете. В 1995 году у меня была идентификация диктора по голосу получше большинства в мире. Надо было делать опенсурсной тогда и не слушать местных советчиков. Собственная раскрутка очень важна.
2. Свал в Канады и подобное. Причина? Там просто больше денег у народа, контор и государства. Больше шансов или к кому приличному устроиться или стартап запилить или в каком местном универе гранты делать. Там и специализацию легче сменить. Я же очень прилично тянул математику на ФПМ в БГУ. Один из лучших студней был. Синий диплом у меня был из-за всякой хренотени типа Истории КПСС.
3. Зубарить английский, пока молодой до уровня свободного общения на любые темы, от еды до специализированных. Вот недавно одно собеседование завалил потому, что не смог лекцию прочитать собеседующим на английском (у них были такие вопросы, что требовалось им лекцию читать). А да в области этой темы сейчас есть только иностранные заказчики. Местные — это 100% просто прослойка, что тебя продает (с оседанием процентов 30-50 денег у них) и даже не вникает в то, что за проект.

1. Тобто чим більше хорошого опенсоурсу розкидаєш в неті, тим вища ймовірність засвітитися?

Да. Тем более на тот момент подобные либы были только за очень приличные деньги. Опенсурс вовремя — это один из элементов собственной раскрутки. Если ты выложишь свою разработку, как одну из сотни подобных, тебя не заметят, но если среди первых, то заметят.
Понятно нужны еще поездки на тематические конференции, выступления там. Из совка 90-х это просто не возможно было. Да и сейчас из постсовка всё так же. Помню было приглашение на летнюю школу Элсевьр, но у меня было только 5$ и спонсоров найти не смог, так и не поехал (ну и английский никакой был, в школе учил французский, потом год немецкий учил, потом кусками английский — немного курсы, немного в командировках).
Свалив, сильно желательно PhD там защитить. Это даст нужные контакты.

Опять же — смотря что хотите делать, если просто
from САМЫЙ_КЛЕВЫЙ_МЛ_ФРЕМВОРК import ВСЕ_СУПЕР_МЛ_МОДЕЛИ
то хватит отголосков забытой математики из вузов, в книгах то ведь уже реализация есть
Ну а если новый дипблу кодить — то да, надо учить

речь про что-то конкретное не идет. просто подготовка к очередному поступлению в иностранный ВУЗ на CS. дабы сильно не зависнуть в изучении математики и китайского

не думаю что стоит равняться на эту тему, для поступления в конректный вуз надо смотреть конкретные методички конкретного вуза)
уверен там спектр знаний нужен шире но и более поверхностный

там просто как обычно все в общем написано. китайские вузы еще все как один очень «умело» делают забугорные версии сайтов(такой себе челендж для вступления). такое ощущение, что они там из 2000х(я так понимаю это проблема многих сайтов с иероглифами, например, похожее можно наблюдать на японском яху www.yahoo.co.jp или вот www.tealit.com/index.php?language=en), хрен что найдешь, кучу дубликатов в пределах одного сайта, «продуманный» дизайн. я там информацию по платежам кое как нашел, что говорить про методички... только если кто-то конкретно ткнет носом в урл. единственное знаю, что там обучение по книгам из MIT

Подписаться на комментарии