Да ладно. Речь же не об API, а о том, чтобы получить на выходе что-то вменяемое
А зачем использовали нейросети для данной задачи? Регрессия, Random Forest или на худой конец XgBoost решили бы вам проблему с намного меньшими трудозатрами. Ансамбли деревьев всеядны, устойчивы к переобучению, хорошо интерпретируются (например, важность фич вы могли бы просто вытянуть после обучения, а не подавать их на вход по очереди), и дают на подобных табулярных задачах точность даже выше, чем «капризные» нейросети.
Спасибо, Дима! В Нидерландах можно много чего получать другими способами :D
Вы наверно читать разучились. Вторым пунктом написано про тренера, а третьим — про экипировку. Более того, там так и написано, что надо брать шоссер, и лучше выбирать с человеком, который разбирается.
Интервалы катаются в
Я не еду туда. Ребята наши собираются многие, главный старт сезона! :)
Спасибо. Серьёзных никаких, местные триатлон и беговые старты, немного другие приоритеты в этом году :)
Такое тоже бывает, но уже не так часто. Тяжелые интервалы на велике выматывают, но обычные
Похоже, вы «изобрели» то, что во многих компаниях делается уже очень давно. Все так привыкли к аутстаффинговой модели, что уже забыли, как это работало в обычном «аутсорсинге». Кстати, в Validio, до покупки его GlobalLogic, тоже нанимали именно так.
3 года занимался саблей, пока не получил травму того же правого плеча. Действительно самый динамичный и, на мой взгляд, интересный вид фехтования :) Минус один: неподготовленные зрители ничего толком не понимают и не видят ))
Хорошая работа, спасибо. Но очень жаль, что получилось так мало опрошенных людей, по Харькову смотреть нечего, к сожалению. Даже по Киеву ~500 человек — это маловато, чтобы получить уверенные результаты.
Ещё, как мне кажется, стоило бы обратить внимание на 2 вещи:
1) Расстояние в км до места работы ни для кого не важно, важно время, которое человек тратит в пути. Человек может находитья на другом берегу Днепра в 2 км от места работы, но ехать ему туда час. ИМХО, стоило бы добавить вопрос про среднее время добирания до работы с вариантами ответов типа «до 30 мин», «от 30 до 60 мин», и т.д. и анализировать его
2) Интересным был бы срез по типу транспорта аля авто / публичный транспорт / пешком и т.д.
3) Вопросы про удовлетворенность транспортной развязкой возле офиса и уровень пробок в районе офиса могли бы помочь лучше оценить локации офисов и районы города
Я так понимаю, скорее лягушатник :)
«Есть одна фантастическая мечта. Я очень хочу бассейн. Без шуток. Мне по здоровью очень важно плавать, да и вообще для айтишников проблемы опорно-двигательного аппарата стали профессиональной болезнью. Технически это дорого и сложно выполнить, но в принципе я думаю, что это можно осуществить.»
Вот это я называю, люди вкрай охренели! А горнолыжный спуск, как в Дубае, вы не хотите там случайно? :))) Там бассейн и пара спорткомплексов в 5 минутах ходьбы! А офис классный, ничего не скажешь.
Microsoft уже довольно давно ушла в облачные сервисы, где успешно сражается с Амазоном. А вот сражение с Google и Apple по мобильным платформам она действительно проиграла. Как и сражение с Google по поисковикам. В настольных же операционных системах она всё еще лидер, особенно в корпоративном секторе. В среде офисного ПО, которое генерирует ей огромное количество денег они также пока вне конкуренции, поэтому чтобы «просрать» десктоп им придётся сильно постараться. Поэтому я бы не стал раньше времени хоронить Microsoft, особенно учитывая тот факт, что их акции с июля только растут. После ухода Баллмера и реструктуризации у них пока нет громких провалов.
Fare enough, это тоже можно в вопросах узнавать.
Вот это уже аргументированный кейс, спасибо. Но я бы сказал, что это забота курсов проводить отбор студентов в свои группы и объяснять им подобные вещи, а не обещать золотые горы. Те же, кто забивает на это в погоне за деньгами, будут в итоге страдать в рейтинге. И поделом.
Хорошая обзорная статья для начинающих. Но хотелось бы внести несколько поправок:
1) Некорректно использовать словосочетание «дата-инженер». Дата инженеры занимаются не машинным обучением и даже не анализом данных, а другими задачами. Правильнее говорить ML Engineer или Data Scientist, хотя последний термин тоже сильно размыт и не даёт четкого понимания, чем же именно занимается специалист.
2)
Как говорил незабвенный Врунгель: «Каждая селедка — рыба, но не каждая рыба — селедка». Машинное обучение действительно эффективно для решения задач, которые нельзя решить традиционным алгоритмическим программированием, но далеко не каждую такую задачу можно (и стоит) решать при помощи машинного обучения. Используйте машинное обучение для тех задач, где оно действительно подходит.
3)
Общепринято все-таки называть эти задачи классификацией и регрессией, а не регрессионным анализом. Регрессионный анализ — это не задача, а статистический метод исследования влияния одной или нескольких переменных на другую (таргет). Путаницы тут добавляет еще и два значения термина «регрессия»: это и тип задачи машнного обучения, и тип модели (линейная, логистическая, полиномиальная и т.д.). Задачу регрессии можно решать не только регрессионными моделями и не только методом регрессионного анализа, но и, например, деревьями решений, SVM или теми же нейросетями. И в то же время, логистическая регрессия (модель) применяется для решения задачи классификации :) Такие пироги.
4) K-means работает не в один проход. Это итеративный алгоритм, который заканчивает свою работу, когда изменения в положении центров кластеров становятся минимальны или вообще исчезают, либо же после завершения определенного количества итераций. Основным недостатком K-means является также то, что вам нужно заранее дать алгоритму на вход требуемое количество кластеров, что зачастую является неизвестной величиной. Есть другие, более продвинутые алгоритмы кластеризации.
5) Дополнение: Еще одной очень популярной и типичной задачей обучения без учителя является поиск аномалий, применяемый, например, для выявления мошеннических действий. Впрочем, эту задачу можно решать и при помощи обучения с учителем.