А причем тут «набредить бесконечно много»? Вы только крайности рассматриваете? Либо с первого раза попали в рынок или в правильное решение, либо проект закрыт? Как-то противоречит в принципе исследовательскому подходу.
В чем конкретно здесь «подход мартышек»? Что неправильного, например, в версионировании экспериментов или в том, чтобы думать не просто о технической задаче, стоящей перед тобой, но и бизнес ценности, которую она должна принести?
Девчонки, вы крутые! :) Ждем наполнения сервиса качественными курсами и школами, удачи вам!
Мммм, а какие модели тогда вы называете моделями «с нелинейным входом»?
Нейросеть — нелинейная модель
По-моему, вы что-то путаете. Это как раз нейросеть легко обмануть, совсем немного изменив входной вектор, что отлично демонстрируют разные adversarial атаки
Почему именно линейные модели легко обмануть таким образом?
Астрологи объявили год Data Science публикаций на ДОУ :D
Жаль, что в интервью мало технических деталей о том, что именно ребята делали, чтобы выиграть золото. А есть видео выступления на митапе или хотя бы презентация?
Если кому интересно послушать про решение, которые позволило получить «золото» на другом CV соревновании, Дима Панченко рассказывал об этом на последней встрече харьковского клубе ИИ: www.youtube.com/watch?v=yTnidkt_35k
Согласен, я именно это и имею в виду, когда говорю «на поверхности засветился». Но все случаи не расследуешь — есть лимит человеческого времени, поэтому приходить будут лишь за крупной рыбой. В налоговой системе есть даже понятие порога неуплаты, если ты задолжал меньше — ты никому не интересен вообще, расходы на тебя выше, чем потенциальный возврат.
Да, но создается стойкое впечатление, что ловят в лучшем случае лишь тех, кто на поверхности засветился. Сейчас столько каналов условно закрытой коммуникации, что даже встречаться или по телефону общаться не нужно.
Так вот почему ты «повелитель кофеварки»! :D
Мммм... мы-то можем, но это выглядит каким-то извращением по сравнению с обычным обучением, нет? Если у вас есть таргет переменная, зачем городить подобное?
Даже если они близки, что дальше? Как мы делаем прогноз значений при помощи кластеризации?
Можно, но это будет очень слабая фича. Позитивных и негативных статей очень много и они далеко не часто имеют хоть какой-то эффект на цену акций. Есть сотни других факторов, влияющих на это, которые не так легко собирать, как статьи в интернете.
А как вообще решаются задачи кластеризации? :)
Перефразирую вопрос: какое отношение имеет кластеризация к прогнозированию? Кластеризация находит кластера в данных, т.е. группы близких друг к другу объектов, при чем тут прогнозирование?
Также есть проблема с подбором параметров. Например стоит ли заносить такой параметр для нашей обучающей выборки как «Элон Маск покурил в прямом эфире» — 0/1.
Можно внести в модель параметр «СЕО/Founder компании вычудил» :)
Чаще прогнозирование рассматривают как задачу кластеризации, а не классификации.
Это как?
Но вообще прогнозирование цен на акции и валюты — это худшая область для применения машинного обучения на практике и как пример я бы их вообще не рассматривал.
Если говорить про точные прогнозы, то да. Но по-хорошему это самая что ни на есть задача машинного обучения, и с определенной точностью или в определенной формулировке она вполне себе решается. Просто чтобы решить её с высокой точностью нам нужно уметь выделять очень много параметров из огромного количества источников, что не всегда возможно.
Я бы мог рассказать на AI Ukraine :) но не сложилось, к сожалению
Вот тут у нас есть некоторый неполный взгляд на эти вещи, если будет интересно:
www.altexsoft.com/...nd-data-science-projects