вечный чайник
  • Помощник в подборе фильма на вечер (нужен ли?)

    дык collaborative filtering там, я же об этом и говорю все время :)

    PS справедливости ради, NN относительно недавно тоже начали использовать для рекомендаций — напр. тут, но для наших нужд тупейшего CF/matrix factorization хватит с головой

    Підтримав: Denys Poltorak
  • Помощник в подборе фильма на вечер (нужен ли?)

    1) Крайности слишком разные. Но, допустим, можно обучить нейросеть, как в старой книжке.

    я тут не совсем понял, как именно нейросеть нам поможет. что ты ей собираешься подавать на вход и что должно быть на выходе?

    3) Ты же не будешь смотреть то, что я посоветую.

    ну, то, что ты посоветуешь, может, и не буду, а вот если где-то во вселенной есть человек, которому нравятся ровно те же фильмы, что и мне, то его совет мне очень даже в тему. (surprise, surprise, это называется user-based collaborative filtering)

  • Помощник в подборе фильма на вечер (нужен ли?)

    как-нибудь за пивом расскажу, чтобы тут троллей не кормить. на самом деле, ничего особенного в монетизации мы не придумали, увы (хотя перепробовали много чего) :(

  • Помощник в подборе фильма на вечер (нужен ли?)

    это ты еще не занимался этим вплотную. на книги отзывы жирнее, но из них сложнее выуживать сигнал (если ты уже занялся NLP), и их меньше в пересчете на каждую книгу. кроме того, одним амазоном не обойдешься — нужно обходить кучу сайтов вроде NYRB. Личные рекомендации со стороны это хорошо, но для того, чтобы делать *персональные* рекомендации для пользователя, нужно, чтобы этот конкретный пользователь логинился в *твоей* системе и активно выставлял рейтинги. и т.д. и т.п. в общем, вроде как бы все решается, но когда начинаешь этим заниматься, находишь много интересных проблем, о которых раньше не думал (включая проблемы с законностью контента) :)

    Підтримав: Denys Poltorak
  • Помощник в подборе фильма на вечер (нужен ли?)

    хм. есть несколько вариантов, но у меня в стартапе ни один не сработал и мы закрылись :)

    Підтримав: Denys Poltorak
  • Помощник в подборе фильма на вечер (нужен ли?)

    это ты еще не открыл для себя болливуд :)

    а если серьезно, то у нетфликса (амазона, гугла и прочих больших стриминговых сервисов) есть все данные, необходимые для хороших рекомендаций, но фильмов действительно мало. причина банальна: лицензирование. я не помню деталей, но среди разных авторских отчислений за каждый фильм там есть очень ощутимая часть, которая не зависит от количества просмотров. это делает невыгодным прокат фильмов из «длинного хвоста», когда наличие его в прокате не окупается ни прямыми просмотрами, ни тем фактом, что наличие фильма может привести (и/или удержать) пользователей. а отсутствие фильма в прокате означает, что на него не собирается статистика, которую можно использовать для персонализации, и т.д. :( получается замкнутый круг: стриминг позволяет собрать рекомендательную статистику, которую иначе взять негде (например, тот факт, что пользователь досмотрел фильм только до середины, или, скажем, пропускал все страшные сцены, или несколько раз пересматривал кусок), но многие фильмы просто невыгодно держать в прокате. вот такая пичаль.

  • Помощник в подборе фильма на вечер (нужен ли?)

    на самом деле спама не так уж много. для начала достаточно проскрейпить обзоры пользователей с амазона — вот тебе и рейтинг со звездочками, и текст для сентимент анализа.
    другое дело, что для *личного* предпочтения нужен фидбек не только от тебя, но и от других пользователей, и чем больше, тем лучше

  • Помощник в подборе фильма на вечер (нужен ли?)

    посмотрел еще. непохоже, чтобы там было что-то действительно такое уж крутое. максимум — тырят звездочки с амазона + базовый сентимент анализ. возможно, еще агрегируют обзоры c пары других сайтов. не больше. как я это знаю? очень просто — у них совершенно голимый поиск. введите, например, «chick flick» или «ballet» — и максимум, что вы получите, это фильмы с этими словами в названии. уверяю, что любое серьезное применение NLP производит данные, которые сразу же очень сильно улучшают поиск. если у них нет нормального поиска (они даже не индексируют обзоры), то и об остальном нечего говорить.

    ЗЫ в любом случае, проблема холодного старта остается. NLP и пр. это очень здорово, но никак не помогает для персонализации, пока не будет обратной связи от пользователя.

  • Помощник в подборе фильма на вечер (нужен ли?)

    ну, с тех пор за 10 лет много всего интересного произошло. но как введение в тему очень неплохая книжка и очень легкая

  • Помощник в подборе фильма на вечер (нужен ли?)

    если вокруг есть столько людей, которые смотрели — на кой болгарский мнение робота?

    дык именно для того, чтобы все эти обзоры агрегировать и отсортировать в порядке твоего личного предпочтения

  • Помощник в подборе фильма на вечер (нужен ли?)

    судя по всему, их робот просто испольует мнение тех, кто фильм смотрел. я не уверен даже, что они парсят обзоры и вообще идут дальше сравнения базовых атрибутов фильма с freebase или еще откуда. (на что косвенно указывает фича «same director»). но готов спорить, что дальше обычной матричной факторизации они не заморачивались, и все держится на рейтингах которые пользователи сами им дали (или они откуда-то сперли).

    ЗЫ да, для книг подобные системы работают очень хорошо (и есть сервисы — поищи «what to read next») — несмотря на то, что там фидбека меньше. дело в том, что, как правило, вкусы и предпочтения у людей меняются достаточно медленно, и можно делать весьма надежные рекомендации даже по отзывам/рейтингам десятилетней давности — в отличие от, скажем, электроники.

  • Помощник в подборе фильма на вечер (нужен ли?)

    нема проблем. успехов в учебе.

    Підтримав: Олексій Пєніє
  • Переезд в Украину гражданина РФ

    а вот предложил бы кто парню прислать резюме, чтобы задвинуть в свою контору, или порекомендовал бы в знакомые фирмы в Украине, а? глядишь, и доброе дело сделаете.

  • Помощник в подборе фильма на вечер (нужен ли?)

    поздравляю, вы в одном шаге от того, чтобы открыть для себя рекомендательные системы. :) ищите по словам netflix prize, recommender systems и т.д.
    можно пройти курс на курсере, но он достаточно базовый и скучный, как по мне.
    потом, как подтянете матчасть, обращайтесь, помогу, чем могу

  • Стереотип айтишника — миф, карго-культ или...?

    чувак, полируй резюме и беги оттуда :)

    Підтримали: Andrii Shchurkov, Sergey Sheshenya
  • Стереотип айтишника — миф, карго-культ или...?

    ну дык есть же статья, где поведение хипстеров моделируется как фазовый переход в колебательной системе с задержкой arxiv.org/pdf/1410.8001.pdf

  • Что учить параллельно C++?

    прежде всего: не буду советовать, что учить *вместо* С++ — это можно обсудить отдельно. пока же будем считать, что у вас были на то причины, и не нам их оспаривать. итак. главное: С/С++ — это целый мир, со своими инструментами, библиотеками и пр. Что бы вы ни учили в дополнение, на первых порах будет проще оставаться в рамках одной экосистемы. Отсюда сразу вывод, что пока учить *не* нужно: другие большие экосистемы (прежде всего Java и C#, в меньшей степени — Objective-C), и языки, с ними связаные (Scala, Clojure, Kotlin, F#, Swift, etc.). далее. если вы уже пишете на С++, то многие вещи сами вас найдут: хочешь-не хочешь, а придется въехать в git, make, boost, posix, threads, и многое другое. поэтому инструментарий и библиотеки тоже не буду советовать. а вот что вам реально пригодится *в дополнение* к С++, так это небольшой скриптовый язык — скажем, на случай, если вдруг нужно как-то хитро перелопатить кучу файлов на диске, обработать данные и построить график или сделать маленький веб сервис. to get things done, как говорится. тут я бы советовал серьезно посмотреть в сторону двух вещей: 1) unix shell scripting + utilities (bash, sed, awk, grep, find, etc.) и 2) полноценного скриптового языка (python, perl, ruby, или даже R или php). я лично настоятельно рекомендую питон: он достаточно прост, универсален, идет с кучей библиотек и фреймворков на все случаи жизни, и хорошо вяжется с С/С++. имно, владение этими тремя вещами (С++, shell scripting, python) уже делает из вас полноценного универсального девелопера. а там уже сами разберетесь, куда расти дальше.

  • IT.MY WAY😂

    мама дорогая! такого вещества я еще не пробовал. поделишься при случае?

    ЗЫ пиши еще, мне нужно натренировать бота

  • Разработка на iPad Pro

    I don’t blame you :) но серьезно, если основная твоя работа будет в клауде, то ОС на клиенте не так и важна, а для многого другого есть вполне приемлемые порты под винду — emacs, vim, python/anaconda etc... cygwin со всем добром, опять же. И да, Linux Subsystem в 10 винде работает отлично

    Підтримали: ZeRMiuNT ZeRM, minodvesP Vasya
  • Разработка на iPad Pro

    дык Microsoft Surface. у меня уже несколько лет как Surface 3, его сейчас можно купить на амазоне баксов за 300, а то и меньше. получишь доступ ко всему своему клауду + куча возможностей для работы в оффлайне

    Підтримали: code monkey, ZeRMiuNT ZeRM
← Сtrl 123456...21 Ctrl →