Помощник в подборе фильма на вечер (нужен ли?)

Всем привет!
Сначала о проблеме:
Я ярый фильмоголик и давно столкнулся с проблемой, что посмотреть сегодня вечером. Группы в ВК советуют всякий хлам, на тематических форумах полный хаос, кинопоиск ТОП250 просмотрен. В данный момент проблема решается ежедневными опросами друзей, могут ли что-то посоветовать...

Так появилась идея сделать портал/ресурс, который будет помогать в подборе фильма.
Есть несколько идей как это будет реализовано (смотрите ниже) хотелось узнать ваше мнение, актуальна ли проблема для широкой публики (или это лично моя проблема), советы/критика/пожелания касательно функционала, пожелание участвовать в разработке на равных правах.

Как я это вижу:
* Каталог фильмов по типу кинопоиска (спарсить)
* Ресурс будет содержать несколько разделов (я предполагаю что есть два типа зрителей:пассивные и активные) для активных, тех кто ищет что-то конкретное:
1. На странице фильма список подобных фильмов. Предполагается что каждый фильм будет помечаться тегами и похожие фильмы будут подбираться по этим тегам.
2. Каталоги фильмов по тематике (фильмы про космос, про вампиров, про киллеров и т. д.)
3. Конструктор фильма на основе тегов.
Для пасивных, тех кто не имеет конкретного пожелания по фильму:
1. Онлайн кинозал: список рекомендуемых фильмов по типу афиш обычных кинотеатров.
2. Рандомный генератор фильма.
3. (Это ваще ух!) Лист минутных нарезок из фильма. Идея в том, что я очень люблю смотреть трейлеры, но они не всегда обьективно описывают фильм.
Еще были идеи о пользовательских каталогах «мои любимые фильмы» и т.д. Типа, — какие фильмы можешь посоветовать? — вот ссылка, там все мои любимые фильмы есть. — А ужастик какой посоветуешь? -вот все ужастики, которые мне нравятся....

По поводу тегов: пришел к тому, что все фильмы можно более-менее точно описать так:
* Место действия
* Время действия
* Действующие лица
* Противостоящие стороны
...
Но тут возникла проблема — самостоятельно описывать каждый фильм это накладно по ресурсам плюс их все нужно пересмотреть, что само по себе уже затратно по ресурсам. Думал в сторону того, чтобы реализовать функционал, чтобы пользователи ресурса сами могли проставлять теги для фильмов, останется только . Это требует реализации системы поощрения и системы модерации, даже подумывал о создании портала в таком виде, где наполнением контента занимаются именно пользователи (на подобии соц. сети или ютуба).
Надеюсь идея более менее понятна.
Целями же данного поста является:
* узнать мнение в актуальности такого ресурса, так как никого из друзей он особо не заинтересовал. Справедливости ради ни программистов, ни киноманов среди друзей нет.
* Услышать советы по функционалу, который я расписал. Может ктото укажет в сторону, в которую я ранее не смотрел.
* Найти единомышлеников, которые хотели бы поучаствовать в разработке проекта. Банально, самому и трудно и скушно)
* Даже если его реализует ктото другой, я стану первым его пользователем)))

Пару слов обо мне:
Я работаю веб-програмистом (пхп, нода, нейронки, аналитика) свыше 5 лет. Имею достаточно опыта и знания для реализации любой части данного ресурса. Могу помочь познакомится и освоить любую технологию по ходу разработки.
С уважением, Александр

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Идея не Нова, если начать искать то через пять секунд уже попадается тотже Рандомайзер фильмов
ezrandom.com/...​or-sluchajnyh-filmov.html
Спустя ище нескольких минут находите альтернативу всему что написали выше.

-

Тут tvtropes.org есть 100500 размеченных вручную фильмов. Напустить на них алгоритм поиска подобных — и будет (возможно) профит.

решил эту проблему начав смотреть сериалы (выбрал один сериал и смотришь его месяц-два)

Поки що з українських сервісів є
tf.auct.eu
jarvis.net.ua
kinobaza.com.ua (треба зайти у все кіно і вибрати тільки з укр. озвученням).

Якщо є профіль в imdb або кп тоді найкраще в кінобазі вибрати. Там є крутий фільтр не показувати переглянуті та інші фішки (рекомендації ітд ітп).

Не зовсім те що треба, але хоча б щось.
Торренти на toloka.to.

Якщо зробите напишіть мені, я теж затятий кіноман.

Всем привет. Всё это уже есть:

— Посмотреть вечером Дома: kinorium.com/list/home/
— Посмотреть Вкино: kinorium.com/list/cinema/
— Подобрать по жанрам/странам/годам/рейтингу: kinorium.com/R2D2/
— График проката в кино и выхода в онлайне: kinorium.com/list/premier/
— Полноценная база фильмов/актеров (в будущем редактируется пользователями)
— На двух языках. Будет еще третий английский.
— Есть персональные статусы/теги: Посмотрел/Буду смотреть/Не буду смотреть и навигатор по ним в профиле
— Удобное отслеживание статусов друзей в ленте друзей
— Никакой рекламы, удобный дизайн
— Вскоре будут персональные папки, улучшение страницы фильмы/актера, статистика в профиле
и тд и тп

Торренты это заведомо проигрышная история. Как только опубликуем ссылки — завтра же сайт будет заблокирован на всех территориях и вся работа пойдет в утиль. Поэтому мы опубликуем кнопки лицензионных онлайн-кинотеатров, а кому нужны торренты, тот поищет ручками.

Вы на Кинопоиске бывали когда-то? Туда ходят 3 млн человек в день. 15% c Украины. Это достаточно оживший сервис? Без «нетфликсов, разных планов и смузи с коворкингами»... А у нас будет еще лучше, чем КП :)

А как оно будет лучше, если КП занимается Яндекс? У Вас есть ноу-хау?

Проблема Яндекса в том, что он не занимается КП.

Реклама копии кинопоиска?) ну вообще именно в тему. Точнее в топку

а что не устраивает на сайте? что нужно добавить? или вам по умолчанию, не нравится всё, что сделано не вами? :)
нет «листа минутных нарезок»? вы будете заблокированы правообладателями через день после старта...

> Я ярый фильмоголик и давно столкнулся с проблемой, что посмотреть сегодня вечером.

Попробуйте Кинориум, и такой проблемы больше не будет.

спробувала. в жанрі детектив перший за популярністю в списку фільм — Гоголь. Начало.
«нєт уж спасіба...©»

> В данный момент проблема решается ежедневными опросами друзей, могут ли что-то посоветовать...

Опросы не нужны, когда вы видите все оценки/статусы друзей в удобной ленте. И можете сортировать фильмы по рейтингу друзей. Велком на Кинориум :)

И это вы еще не видели наше iOS приложение :)

Кинориум російський сервіс!

погугліть перш ніж пропонувати

Саша привет, добавляйся ко мне в скайп, поделюсь своими идеями, пару лет назад думал над идентичным проектом, mykhailo.murin

Неочевидная идея как роботу получить доступ к контенту фильма: нужно брать субтитры. И по ним можно даже ИИ пропустить, лингвистика любимый хавчик для ИИ решений.

А если фильм — Красная Черепаха?

Увы, придётся жертвовать качеством ради количества и скорости.

Есть предложение проверить идею на реализуемость: напиши здесь ОДИН сэмпл того, что ты хочешь сделать. Исходные данные (на примере конкретных произведений) и результат. Сделай идеально, без «сами додумайте».

В чём фокус: обсудить конкретику намного проще. Даже если 50% скажут «вау, круто» — значит спрос есть и неплохой. Даже если 20%. Дадут конкретные советы исходя из твоего понимания, а не того что уже где-то видели.

Следующий этап — оформить скетч. То есть на компе или на бумаге показать как это будет выглядеть. По сути на это уже сможешь искать разработчика. Но не перепутай, этот этап только после понимания, является ли твой контент — вообще контентом.

Стратап имеет шансы. Решаемая проблема: рекламируется хрен знает что, а фильмы занимают много времени. Соответственно ты экономишь время, которое могло быть потрачено на дерьмовый фильм (независимо от его актёров и бюджета).

Если это будет работать так, что он будет мне выдавать фильмы, которые мне будет хотеться посмотреть, то черт возьми да! Готов заплатить максимум 200 баксов в год.

За 200 баксов в год можешь нанять себе консультанта.

Врядли кто-то согласится за 5000 грн в год

Будешь смеяться, но у меня всё то же бесплатно. Как? Давай 200 скажу :)
// лучше сам подумай

за 200$ / рік я можу стати консультантом.
Не шутка

Дай говна, дай и ложку.

Фильмы снимают быстрее, чем ты можешь их смотреть. Книги — быстрее чем ты можешь их читать. А еды готовят больше чем в тебя влезет.

Пока ты читал эти строки, сняли полэпизода твоего любимого сериала.

А что достойно? С большим бюджетом? Кассовым сбором? То что все смотрят?

это ты еще не открыл для себя болливуд :)

а если серьезно, то у нетфликса (амазона, гугла и прочих больших стриминговых сервисов) есть все данные, необходимые для хороших рекомендаций, но фильмов действительно мало. причина банальна: лицензирование. я не помню деталей, но среди разных авторских отчислений за каждый фильм там есть очень ощутимая часть, которая не зависит от количества просмотров. это делает невыгодным прокат фильмов из «длинного хвоста», когда наличие его в прокате не окупается ни прямыми просмотрами, ни тем фактом, что наличие фильма может привести (и/или удержать) пользователей. а отсутствие фильма в прокате означает, что на него не собирается статистика, которую можно использовать для персонализации, и т.д. :( получается замкнутый круг: стриминг позволяет собрать рекомендательную статистику, которую иначе взять негде (например, тот факт, что пользователь досмотрел фильм только до середины, или, скажем, пропускал все страшные сцены, или несколько раз пересматривал кусок), но многие фильмы просто невыгодно держать в прокате. вот такая пичаль.

Это так и задумано. Понимаешь, делать нормальное кино дорого. Куда проще монополизировать рынок и брать откаты на всех этапах продвижения.

А народ всё равно смотреть будет то, что ему скормили. Даже если это про любовь к родине, с преферансом и матильдами.

Иногда нормальное делают дешево (культовые фильмы). Но это непредсказуемо и на конвейер не ставится

При поддержке госбюджетных фондов в принципе и пофигу, будут смотреть или нет.
ярким подтверждением являются выпуски бэдкомедиан с разбором новинок российского кинематографа.

Много лет мечтаю о таком сервисе, но думаю без нормальных вложений хорошим его реализовать будет очень тяжело.

Да, согласен. Поэтому даже думал в сторону того, чтобы создать систему, где пользователи сами наполняли контент. И сделать максимально независимой, что-то типа соц.сети только для кино. Или википедии. Единсвенный нюанс: насколько качественно пользователи будут заполнять контент? за деньги это будет делаться в разы качественней

Основатель википедии начинал с того, что попытался создать энциклопедию со статьями высокого качества которые будут писать специалисты в своих областях. В итоге кол-во статей через пол года было более чем скромным и проект закрылся. Думаю базу лучше всего заполнить хоть как-то, но чтоб даже про фильмы о которых слышало людей чуть больше чем в нем снималось было хоть две строчки описания. Даже гугл транслейтом.

Рейтинговая система. Все придумано до нас )

И додумано, и красиво, и... работает мнение большинства. Которые лемминги, и таковыми всегда будут.

Смотри в чём незадача: от мнения большинства быдла нужно избавиться. А сравнивать только крайности, только уникумов.

1) Крайности слишком разные. Но, допустим, можно обучить нейросеть, как в старой книжке.
2) Слишком мало фильмов отвечают вкусам крайности, так как масс продакшн. Соответственно, от крайностей прибыль — малая величина второго порядка (мало крайностей х крайности смотрят мало фильмов).
3) Ты же не будешь смотреть то, что я посоветую.
Итого: лезешь в коменты к видео, которое тебе нравится и смотришь, с чем его сравнивают.

1) Крайности слишком разные. Но, допустим, можно обучить нейросеть, как в старой книжке.

я тут не совсем понял, как именно нейросеть нам поможет. что ты ей собираешься подавать на вход и что должно быть на выходе?

3) Ты же не будешь смотреть то, что я посоветую.

ну, то, что ты посоветуешь, может, и не буду, а вот если где-то во вселенной есть человек, которому нравятся ровно те же фильмы, что и мне, то его совет мне очень даже в тему. (surprise, surprise, это называется user-based collaborative filtering)

www.htbook.ru/...​miruem-kollektivnyj-razum глава 2. Там не нейросеть, а что-то попроще.

дык collaborative filtering там, я же об этом и говорю все время :)

PS справедливости ради, NN относительно недавно тоже начали использовать для рекомендаций — напр. тут, но для наших нужд тупейшего CF/matrix factorization хватит с головой

Вообще-то требуется чтение мыслей (что пока увы), либо... умение втюхать мысли тебе (что реклама). По сути ты нуждаешься в рекламе. И не только ты.

Всем привет!
Сначала о проблеме:
Я ярый фильмоголик и давно столкнулся с проблемой, что посмотреть есть ДОХРЕНА чего а времени, б%%ть, НЕТ!!!
Извините :))

Думаю, кастрация подойдёт. Как вы считаете, коллеги?

Не стоит сразу рубить с плеча. Попробуйте сперва медикаментозную терапию ;-)

А если серьёзно, разве ни у кого нет такой проблемы как катастрофическая нехватка времени? У меня ФИФО стек со стабильными двумя десятками фильмов. А один фильмец могу смотреть неделю (по 15-20 мин. в день) — некогда. А здесь такое — «что посмотреть сегодня вечером». И думаешь себе: «херасе, разве так бывает»? :))

Отправляйся на Сатурн, там в сутках времени куда больше.
Если серьёзно, то времени обычно не хватает у тех, кто много времени тратит на дорогу. Взять себе вакуумные наушники и смотреть на мобильных устройствах — не всем доходит.

С книгами аналогично. Большинство прочитанных мною книг, прочитаны или прослушаны именно в таком режиме.

а может ты просто распределяешь не рационально?
у меня наоборт нет такой проблемы)

Меньше играй. появится время.
А если серьезно, научись экономить время или ставить приоритеты, глядишь увидешь, сколько свободного время появится.

Вот такой еще есть сервис:
movieo.me

фильм на подобии «остров проклятых»

вроде находит:
movieo.me/...​vies/shutter-island-lbdsw

Машинные алгоритмы здесь практически бессмысленны. Хотя бы потому, что робот не смотрел фильм.

Но гипотеза интересная — а с книгами сей фокус прокатит? Мне кажется, очень даже. Хотя придётся сильно пересмотреть своё отношение к плагиаторам.

робот может читать отзывы ТЕХ, кто смотрел фильм))

И тех кто читал описание и сделал рерайт, и тех кто просто написал отсебятины, и тех кто пишет это говнище за деньги в неимоверных количествах.

Скажи честно, если вокруг есть столько людей, которые смотрели — на кой болгарский мнение робота?

если вокруг есть столько людей, которые смотрели — на кой болгарский мнение робота?

дык именно для того, чтобы все эти обзоры агрегировать и отсортировать в порядке твоего личного предпочтения

А как ты отличишь обзоры от спама, при том что на любую строку поиска всегда найдутся тонны бреда.

на самом деле спама не так уж много. для начала достаточно проскрейпить обзоры пользователей с амазона — вот тебе и рейтинг со звездочками, и текст для сентимент анализа.
другое дело, что для *личного* предпочтения нужен фидбек не только от тебя, но и от других пользователей, и чем больше, тем лучше

Ну я допустим знаю, как такой генерировать. Расскажи лучше как это в денежку конвертить.

хм. есть несколько вариантов, но у меня в стартапе ни один не сработал и мы закрылись :)

Ну так расскажи. Отрицательный результат — тоже результат.

как-нибудь за пивом расскажу, чтобы тут троллей не кормить. на самом деле, ничего особенного в монетизации мы не придумали, увы (хотя перепробовали много чего) :(

судя по всему, их робот просто испольует мнение тех, кто фильм смотрел. я не уверен даже, что они парсят обзоры и вообще идут дальше сравнения базовых атрибутов фильма с freebase или еще откуда. (на что косвенно указывает фича «same director»). но готов спорить, что дальше обычной матричной факторизации они не заморачивались, и все держится на рейтингах которые пользователи сами им дали (или они откуда-то сперли).

ЗЫ да, для книг подобные системы работают очень хорошо (и есть сервисы — поищи «what to read next») — несмотря на то, что там фидбека меньше. дело в том, что, как правило, вкусы и предпочтения у людей меняются достаточно медленно, и можно делать весьма надежные рекомендации даже по отзывам/рейтингам десятилетней давности — в отличие от, скажем, электроники.

Кинопоиск — да, парсит отзывы. Но чтобы такое написать, надо быть очень крутым в NLP + ML. Это даже не на уровне последних научных статей, это — собственные алгоритмы.

посмотрел еще. непохоже, чтобы там было что-то действительно такое уж крутое. максимум — тырят звездочки с амазона + базовый сентимент анализ. возможно, еще агрегируют обзоры c пары других сайтов. не больше. как я это знаю? очень просто — у них совершенно голимый поиск. введите, например, «chick flick» или «ballet» — и максимум, что вы получите, это фильмы с этими словами в названии. уверяю, что любое серьезное применение NLP производит данные, которые сразу же очень сильно улучшают поиск. если у них нет нормального поиска (они даже не индексируют обзоры), то и об остальном нечего говорить.

ЗЫ в любом случае, проблема холодного старта остается. NLP и пр. это очень здорово, но никак не помогает для персонализации, пока не будет обратной связи от пользователя.

На книги, во-первых, ощутимо больше и рецензий, и личных рекомендаций коллекций.
А ещё их контент доступен роботам.

это ты еще не занимался этим вплотную. на книги отзывы жирнее, но из них сложнее выуживать сигнал (если ты уже занялся NLP), и их меньше в пересчете на каждую книгу. кроме того, одним амазоном не обойдешься — нужно обходить кучу сайтов вроде NYRB. Личные рекомендации со стороны это хорошо, но для того, чтобы делать *персональные* рекомендации для пользователя, нужно, чтобы этот конкретный пользователь логинился в *твоей* системе и активно выставлял рейтинги. и т.д. и т.п. в общем, вроде как бы все решается, но когда начинаешь этим заниматься, находишь много интересных проблем, о которых раньше не думал (включая проблемы с законностью контента) :)

поздравляю, вы в одном шаге от того, чтобы открыть для себя рекомендательные системы. :) ищите по словам netflix prize, recommender systems и т.д.
можно пройти курс на курсере, но он достаточно базовый и скучный, как по мне.
потом, как подтянете матчасть, обращайтесь, помогу, чем могу

нема проблем. успехов в учебе.

Проблема с этим не только у вас. Решалась она путем перелистывания FS.to (хорошая категоризация, с рейтингами и доступным качеством сразу возле названий). Сейчас вообще печаль.

Было бы неплохо:
1. отфильтровывать в выдаче уже просмотренные фильмы
2. устанавливать «просмотрено» путем выставления рейтинга (отзыва, как опция)
3. устанавливать «не хочу смотреть вообще и никогда»
4. возможность отфильтровывать фильмы ниже определенного рейтинга, чтобы даже не появлялись

Очень важно, чтобы первичная выдача результата была не фильтрована по рейтингу и пр., а формировала лучшие предложения на основании суммарной оценки уже просмотренного, рейтинга, новизны.

Возможно минусовые фильтры, типа, убрать ужастики и драму.

Спасибо, это наверно единственный комментарий, который именно отвечает на вопрос в топике.

Что-то безбожно падает сервак, не могу зайти на страницу фильма.
Да, это наиболее близкое из желаемого, но все еще нет:
1. Доступное в интернете качество фильма (HDRip, TS, пр.), или хотя бы дата выхода на DVD, как на Кинопоиске.
2. Нет: «Очень важно, чтобы первичная выдача результата была не фильтрована по рейтингу и пр., а формировала лучшие предложения на основании суммарной оценки уже просмотренного, рейтинга, новизны.» Т.е., я должен париться с фильтрацией, а не умная машина мне что-то предложит )))
3. Есть только плюсовые фильтры, минусовые фильтры более правильные. Люди обычно лучше знают чего НЕ хотят, чем того, что хотят. Вообще, странно, что человечество еще не просекло эту фишку на всевозможных сайтах.

Ну, и само собою, нет идеи топикстартера по описанию фильма, чтобы можно было найти.

Programming Collective Intelligence (O’Reilly, 2007) рекомендует применять машинное обучение и к тому, и к другому.

Робот рекомендует себя? Как неожиданно!

ну, с тех пор за 10 лет много всего интересного произошло. но как введение в тему очень неплохая книжка и очень легкая

А вы уже придумали, чем ваш помощник будет лучше того, что предлагается самим «Кинопоском»? После энного количества введенных оценок там появляются персональные рекомендации.В целом выходит неплохо, кмк.

По делу: я нежно любила «Имхонет», но он, к сожалению, умер. Из того, что пробовала (немного, кстати, но тем не менее) ничего так не приглянулось, как он.
Пока спасаюсь подборками, которые делают в Adme, The-village и другие нетематические ресурсы.

Если говорить о том что «лучше чем на кинопоиске», то я думал о двух фишках: структурное описание фильма (можно коряво это назвать тегами) и лист минутных нарезок интересных (но не спойлерных) моментов из фильма.
1. Структурное описание фильма позволит в машинном режиме подбирать наиболее похожие фильмы по своей структуре. Описывал ранее в комментах, не буду повторяться.
2. Нарезка коротких видео из фильмов решит пару моментов: когда ты хочешь что-то посмотреть, но не знаешь что, ты просто скролишь ленту (потипа инстраграмма) и смотришь короткие моменты из фильма, что очень заинтересовывает в просмотре данного фильма. Проверено, делал прототип с нарезками из около 100 фильмов, под час работы даже сам часто себя ловил на мысле что хочется посмотреть данный фильм.
И в первом и во втором случае нужны неслабые ресурсы (как минимум просмотреть фильм, определить по скелету его структуру и выбрать 4-5 минутных отрезка). предполагалось отдать это на аутсорс, но перед тем как тратить на это деньги, вот решил поинтересоваться, а стоит ли вообще заморачиваться? Для чего и создал данный топик.

С нарезкой идея интересная, но это же и правда дофига ресурсов! Шкурка вычинки может не стоить((
От себя скажу, что всегда ищу не столько знакомых актеров, пересечение сюжетов или жанров, а повторение того послевкусия и свои собственные ощущения, которые остались после просмотра любимых фильмов. Жаль, с таким подбором не справится ни человек, ни машина.

разумно стартовать с малого: не делать клон фичей существуюищих ресурсов за вагон денег, вместо этого сделать ресурс с одной конкретной фишкой — MVP которой можно склепать за месяц-два. Дальше нагонять трафик, получать фидбек, анализировать и думать — фишка в цель (тогда добавляем к фишке еще фичей) или мимо (пробуем новую фишку).

Это так не работает — создать топик и спросить «нужно ли такое». Можно получить позитив (о да нужно кул вау), реализовать и нифига не взлетит. Можно получить негатив (таких сервисов тыща блабла), а на деле есть аудитория которую зацепит но просто не тут. Короче, только эксперименты как завещал наш мессия бланк.

IBM Watson зробив нарізки Моргана для трейлеру. Якщо щось таке намутити буде круто, але треба мати всі фільми в HD, неслабий сервер і прогу штучного інтелекту.

Для початку можна рандомні відрізки закидувати, якщо взлетить то трохи уніфікувати (щоб ютуб не забанив) і автозаливати на ютуб і так косити бабло.

як мінімум тим що він не буде заблокований, як Кинопоиск

imdb.com , фича «People who liked this also liked... »
Пользуюсь не этой фичей, а списком фильмов, в которых снимался интересный мне актер-актриса, и качаю те, которых не видел. Качаю ± в порядке рейтинга, если никакой другой инфы нету.

Тоже база маленькая

Описания тошнотворные. Почитал описания того что видел — мог бы выбросить в сторону и никогда не посмотреть просто потому что автор описания конченый критик.

Я до цього сайта абсолютно нічого не маю, але все ж .Може автор комента

конченый критик

? Нормальні описи.

кейс: хочу найти фильм на подобии «остров проклятых». Этот ресурс поможет? Ответ будет аналогичный моему)

movielens.org ...
самый недооцененный сайт-рекомендационная система вообще

А где вход без регистрации?

а кой смысл в неперсонализированных рекомендациях в данном топике?

Наверно я не коректно назвал свой подход «тегами». Попробую обьяснить:
Я предполагаю, что мы, когда ищем фильм, подобный тому, который видели, опираемся на некоторые факторы:
Место действия фильма, главные персонажи, актеры, тема фильма и т.д.
Теоретически, если в таком ключе описать каждый фильм, то програмно можно подбирать наиболее похожие фильмы к требуемому. В теории, продолжения и фильмы из той же серии будут находиться первыми. Это нельзя назвать тегами, а скорее конструктивным описанием фильма.

а почему бы хайв-майнду не деть решать насколько фильмы похожи, или, что более близко к правде, как сильно понравится фильм А, если тебе понравился фильм Б

рекомендационка по схожему конструктивному сету будет иметь меньше список рекомендаций, чем рекомендационка типа мувиленса, чисто интуитивно

это при условии что сабжевая рекомендационка не будет мне выдавать все сезоны и эпизоды саус парка, если я посмотрел и залайкал 1 серию

короче, советую автору топика посмотреть на мувиленс, как пример удачного проекта

Спасибо за дельный совет. Чуть выше я описал свое отношение к персонализации. Но подумать об этом стоит, может вы и правы

Я сильно удивлен, как вы точно поняли мою идею! И я с вами полностью согласен — персонализация — полная фигня в этом деле. Это как искать зависимости в рандомно сгенерированных данных. Повторюсь для избежания холивара — Я ГОВОРЮ ТОЛЬКО ПРО АЛГОРИТМ ПОДБОРА ПОХОЖИХ ФИЛЬМОВ.

Так это Ваша цитата и есть

Вы не представляете, насколько меняются предпочтения в рамках одной персоны. Вспомните себя в понедельник утром. А в воскресенье вечером?

В воскресенье вечером мы хотим с понедельника начать новую жизнь. А в понедельник утром уже понимаем,что перебрали с амбициями, все же лучше со следующего понедельника)

Вроде не бездельники и могли бы жить
Им бы понедельники...

там барахлит от наплыва пользователей, ребята на университетском хостинге

Попробуй оттрекать запрос, что там реально летит и возвращается. Рискну предположить что остальные поля тоже обязательны.

Зашёл, тоже недооценил. Вот честно, там есть что-то по сути кроме «научного» бла-бла-бла-бла-бла-бла-бла-бла-бла?

Вечная болезнь современных проектов: зайдя прямо к ним на сайт, невозможно и за час понять, что конкретно они делают и на кой реальный хер мне это может понадобиться. Да понял я, понял, что они делают мир краше, а жопы чище. Но блин, правило ЧЯБИ?

Аналогичное ощущение испытал) Я думаю так: зачем я вообще должен логинится/регистрироваться, создавать свой личный мувилист, если просто хочу найти фильм похожий на понравившийся мне «остров проклятых»? Непонятно

Регистрироваться можно было бы давать после, например если хочешь сохранить результаты.
Типичный пример — Яндекс карты.

личный мувилист нужен для user-to-item рекомендаций. Иначе будет item-to-item (как в амазоне), но в случае с фильмами не факт что «фильмы похожие на этот» — это то что нужно всегда.

А давай, составь запрос: хочу фильмы, где нет тупых персонажей.
Высший пилотаж: хочу комедию, где нет тупых персонажей.

В комедиях всегда есть тупые персонажи)
Разве что в романтических комедиях их меньше -но тогда любовь -морковь, надо-французские смотреть..

Только в тех что не смешные. Хотя даже для них есть один способ покращення.

хоть один пример комедии- где нет ни одного тупого персонажа.
Хотя надо определиться- лузеры -это тупые?

Дай определение лузеру. Таких персонажей насколько знаю нет. Есть те кому не везёт (по сценарию), так бывает и с очень жизненными персонажами.
А есть те, чьи действия всегда неадекватны — это тупые — над которыми типа надо смеяться, не потому что смешно, а так надо. Что-то вроде лопаты Петросяна.

Есть те кому не везёт (по сценарию)

это они и есть в переводе с английского. Но как бы это не очень смешно.)
Приведи пример хорошей комедии.

А я не говорил что задача простая. Тем не менее, встречается сплошь и рядом.

Пример, как отсеиваю поисковый спам: по наличию слов «я» и «смотрел».
Могу подсказать свой вариант: если в комедии нет тупых, кому-то кого-то будет жалко.

Синонимы и семантику даже поисковики давно на ура процессят.

Синонимайзеры для генерации поискового спама проходят это ещё лучше. И гугл не станет их отсеивать, потому что оттуда идут клики по рекламе, а это фактор № 0 для рейтингования Гуглом.

А для меня наоборот, персонализация работает в плюс. Но... если запрос в 1-2 слова или точную цитату. Если 3 и более — ищет что бы мне такое продать, абсолютно игноря релевантные результаты. Такое впечатление, что он выбирает любые 2 слова из запроса, добавляет слово «купить» — и профит.

Подозреваю ему даже похеру куплю ли я. Гугл просто гонит трафик в виде меня на сайты с рекламой имени себя, и тем самым тупо списывает баблики со счетов рекламодателей.

абсолютно в дырочку, гуглу не выгоден абсолютно релевантный подбор рекламы..

Гуглу выгоден уход с нерелевантного сайта — по рекламе.

Забываешь, что на всякий товар есть свой покупатель. Для кого-то Тарковский с Кустурицей гении, для кого-то — тупость и нудятина, а щаз Кустурица еще и враг народа.

Это то, что надо смотреть постарше. Согласись, возраст не последний фактор. Я ведь когда-то тоже тащился от терминатора.

Допустим; но откуда этот интеллектуальный поисковик знает, что клиенту 16 (он анкету заполнил ?!), или что деда на мультики потянуло...

Ну если кто-то ищет Ну погоди — то ему должны показать в похожих Том и Джерри.
Если ищут Яйцо ангела — покажут Небесных тихоходов и Бугипопа.
А сколько кому возраста — не важно.

ну, совершенно верно, imdb так и работает, и я этим и предложил воспользоваться. А тут я писал исключительно про «высший пилотаж»:

хочу фильмы, где нет тупых персонажей.

Понятие тупости для каждого свое ИМХО, и таки зависит от возраста (точнее поколения) зрителей — тяжело не согласиться... «Броненосец Потемкин», «Чапаев» или «Золотая лихорадка» Чаплина — много желающих щаз их посмотреть? а ить мировые шедевры были...

Так поиск подобных в какой-то мере это решает. Они часто относятся к одному поколению.

Тупые значит тупые. Когда им по образу делают заведомо тупые роли.
Кстати, у Чаплина тупых ролей практически нет. Все действия мотивированы.

Алгоритму недоступно рекурсивное определение «тупые персонажи — значит тупые роли» :) Чтобы не поехал проц, он попросит другое, например «персонаж, который не соответствует профилю конкретного юзера». И когда вместо «конкретного юзера» подставят Твой или мой профайл, результат поиска будет разный. Т.е. снова мы вернулись к алиментарной серч-ангине. В качестве подсказки (не более) меня такой подход удовлетворяет.

Тупые персонажи — это те, поведение которых мотивируется исключительно тем, что они тупые. Иначе говоря, сценаристу совсем-совсем не досталось таланта, и он просто берёт N-ное количество идиотов, которые ведут себя как мухи на вашем отдыхе.

Вот представьте себе кинотеатр. Вы приходите, а вместо фильма там жара, мухи, и запах соответствующий. Это и есть продукт современного кинематоргафа. Разница только в национальности мух.

Жэсть. А я-то думал, у кого япошки сплагиатили.

Тупые персонажи — это те, поведение которых мотивируется исключительно тем, что они тупые.

Опять рекурсия :( как помниш — «в теннисе я люблю теннис» ;)

Вот это и портит фильмы. Тупость самодостаточна.

Ну если кто-то ищет Ну погоди — то ему должны показать в похожих Том и Джерри.

В рашке ему покажут Роскомнадзора. Будешь смеяться, но НуПогоди там запрещён :)

Которые Watchmen в полной версии с мультиком?

Тут, кажется, есть вертолеты www.youtube.com/watch?v=0K9keJYO8BM

И вот из-за засилия тупорылого стремления рынка к новому продукту, и рынка рекомендаций того же продукта, я Сталкера посмотрел в возрасте никогда.

Тогда посмотри Яйцо ангела. Его режиссер смотрел Сталкера.

Ну вот и как ТЕБЯ систематизировать? Как ни крути, машине чужда логика человека :)

Он создает моду, которая формирует желания.

Нет.
Желаний у тебя всего 3: поспать, пожрать и потрахаться. По сути.

Именно поэтому ты тут строчишь сутками комменты)
Вероятно, это сублимация какого-то из них)

поспать, пожрать и потрахаться

сказал человек на никотине, колёсах, по последним сведениям даже на иглу подсел.

Рынок, как и любая система, пытается изжить человеческий фактор, и вообще избавиться от информации во имя святой энтропии.

Если надо по-другому, этим счастьем надо управлять. Что участники рынка и делают, на свой страх и безумие.

У него появились доминанты человеческого поведения, и государственные механизмы сверху (весьма жадные до дойки рынков).

Некоторые шаблоны человеческого поведения склонны к самоподкреплению. Такие как боязнь риска, стремление выпендриться, стремление держать всё под контролем, и конечно же неистребимая тяга кого-нить наказывать.

Все эти доминанты чужды рынку. Но есть ещё самоудовлетворение от любого процесса. И рынок не был бы рынком, если бы не рос на дрожжах шопоголии. И не страдал перепроизводством от неё же.

Привет, я уже около года, в свободное от работы время, разрабатываю мобильное приложение для подбора фильмов под iOS и Android, Xamarin для мобильной разработки и Java для бэкенда, если есть желание можем обсудить сотрудничество?

Что-то там муть в топе. Как и везде, впрочем.

Так зачем тогда топ? Лучше листать коменты и смотреть, что там вспоминают незнакомое.

Узнал что Макото Синкай выпустил свою Маргошу, с каваем и школьницами.
Скачал ребёнышу.

A Letter to Momo лучше скачай. Его 10 лет вынашивали, получился хороший семейный мульт.
www.youtube.com/watch?v=k4KLGfBb_3M

Ну это миядзаки-подобная сказка, таких ещё накопипастят, благо пипл хавает.
Но второй раз не интересно даже детям, они успевают прискучить.

Властелины Времени, Наусика, Последний Единорог?
Детям-то сколько?

А «ловцы забытых голосов» нормально зашло?

Хороший вопрос, даже сам не видел.

Блин, ну оффтоп же аниме здесь, может отдельный топик поднять? И вообще не здесь :)
Здесь обсуждаются поисковые/рекомендательные ресурсы, и нужен ли ещё один от топипстартерта.

Тоже под Миядзаки, только совсем уж сильно. Лучше уже Patema Inverted www.youtube.com/watch?v=Aa7sa-Zd-3E

Ну это и рассчитано на раз посмотреть, обычный сериал. А мы тут говорим за крутые полнометражки.

Это — крутая полнометражка)

... если смотреть в 4 года. Для тех кто видел другие и много, это просто ещё один Last exile которому не хватило бюджета на тягомотину.

Так дети или не дети? Если не дети — смотрите GitS2: Innocence или Красную Черепаху, к примеру.

Имхо Красная черепаха и не каждому взрослому понравится, т.к.
несколько депрессивна.

Там народ Технолайз советует как пример депрессивной вещи. (я пока ниасилил)

Думаешь, чеклист по теме статьи помог бы защититься от анемэ?

Нашёл кого спросить :)
Я считаю что спрос на аниме в Украине недооценён, притом настолько что надо поднимать своё производство и/или аутсорсить.

Как считают классики, для этого нужен избыток денег в экономике https://ria.ru/interview/20150522/1065883205.html

Избыток основных средств имеет такое же влияние катализатора, как и избыток оборотных. При невмешательстве они порождают друг друга, генерируя огромные волны перетока одних в другие.

Нет, прикидывается. Нормально зарисованы характеры, и в графике местами сквозит динамичность Паприки.

Я не говорю что плохое. Просто слишком идентичный сюжет при слишком идентичной графике, шедевром уже не назовёшь. Хотя в кино на такое сводить можно, на большом экране выглядит попкорно.

Не знаю. Миядзаки обычно ниасиливаю, а эта штука вполне себе ничего смотрелась. Она не чисто детская.

Что характерно, по вводным «письмо для Момо» американцы б сняли триллер. Психика у девочки весьма устойчивая.

Режиссер пошел в обратном направлении. Вот его предыдущая работа www.youtube.com/watch?v=CTWrs4hB4EY

Вот это зачёт. Песнь козлов зачётная вышла, надо было клепать в эту степь, благо историй хватает.

Разумеется, не детская аудитория, но на старший подростковый возраст — самое оно.

Психика у девочки весьма устойчивая.

У японцев в принципе такая. Другая культура.

Я о том, что в топе только это. Скучные там только первые 311 серий.

Зазвичай беру з того, що рекомендують друзі мені або комусь. Банальний пост на фб «Що подивитись ( і бажано жанр)». А далі вибираєш що більше підходить.

Знакомая проблема. Однако предложенные решения, имхо, не помогут. На кинопоиске когда-то хорошо работали рекомендации к фильму, по типу как на imbd «People who liked this also liked», но незадолго до блокировки, алгоритм то-ли поменяли, то-ли он исчерпал себя. В итоге рекомендации стали бесполезными. Если бы кто-то реализовал решение, я бы был первым пользователем)

Да, решение кинопоиска «Если вам понравился этот фильм, не пропустите» очень годное, но есть в нем пару проблем. Допустим я посмотрел фильм «Черная дыра» и хочу посмотреть что-то похожее. Что предлагает кинопоиск? «Чужой», «Пандорум», «Хищники» и еще парочку. Ок, соглашусь фильмы где-то что-то похожие, но:
1. Где «Риддик»? это не просто похожий фильм, это часть серии
2. Что делать, если я пересмотрел все эти 10 предлагаемых фильмов?

В случае подбора похожих фильмов скрипт будет выдавать все менее и менее похожие, пока ты наконец не поймешь, что уже нету ничего похожего.
ну и алгоритм, где риддик не попадет в список советуемых по черной дыре это просто сделанное приложение для галочки, которое на практике не работает.

Пользуйся. Алгоритм нахождения секретный, открою за много денег..
i.gyazo.com/...​39d44699e8166d7253ba0.png

Очень годный алгоритм, но... многого не хватает. Например на вскидку, где «крикуны»? а фильм очень похож на «черную дыру». Да, пролистав несколько первых страниц результатов, можно найти почти все фильмы, которые мало-мальски походят на «черную дыру», но у меня это обычно заканчивается на 1-2й ссылке хлопком крышки ноутбука и раздосадованным включением ютуба...
В итоге спустя месяц-год я натыкаюсь на фильм, который еще не смотрел в данной тематике, но хотелось его посмотреть именно тогда! И так почти каждый вечер)))

Лучшим решением, как по мне, являются заголовки пронофильмов: там весь сюжет уже в заголовке.

Представьте себе название фильма: Мужык летит на Марс сажать картоху.
Хотя с индийскими сложно будет. Бла-бла-бла эпичная драка надо потанцевать.

Прикол в том что каждый воспринимает фильмы по разному, субьективно, сегодня знакомы отнес в одну категорию неск фильмов которые для меня капец какие разные, в итоге ты получишь те же самые подборки как в контакте и еще херовой куче сайтов с онлайн просмотром фильма, которые гуглятся на раз два.
Список фильмов похожих также есть на кинопоиске, там же есть и трейлеры и описание фильмов и расширенный поиск и рандомный фильм.
Итог — частичный клон кинопоиска с парой перделок и каталогами фильмов «которые заставляют задуматься» от домохозяек и любителей форсажа.

Зачем частичный? Наглый спизинг и рерайт теми, кто фильма не смотрел :)
Тем более что сам гуанопоиск делает в аккурат то же самое.

Я не хочу делать клон какого-нибудь сайта только для того, чтобы у меня был какой-нибудь проект. Я просто говорю, что существующие ресурсы по поиску фильма меня не удовлетворяют и хотелось бы знать, это актуальная тема для других людей или это сугубо моя личная проблема, так как я злостный киноман. Естественно, если 99% людей удовлетворяет гугление и подборки фильмов, смысла делать еще один 100500ный сайт не имеет смысла.

Лучше быть всем для некоторых, чем некоторым для всех. Закон сегментации рынка :)
В первом случае ты получаешь право откусить кусок общего пирога, во втором — позырить на весь.

Нетфликс умеет советовать фильмы. Подозреваю что любая серьезная площадка, которая занимается контентом, будет стимулировать потребление контента. В крайнем случае смотрю imdb, нахожу фильм который понравился, и там обычно идет пару рекомендаций что еще посмотреть на эту тему. Сферический сервис рекомендаций, имхо, не взлетит, ибо ни к чему не привязан.

А что по аудиокнигам? Дело в том, что я не любитель аудиокниг, поэтому незнаю об этом ничего)

Это пока ты на них не подсел. Классная вещь. В принципе тоже, что фильмы, только с одним (или несколько) исполнителей. По фильмам сайтов много, а по аудио книгам на порядок меньше, хотя спрос на них тоже большой. Хорошо справлялся с этим экс.юа, даже там были книги с лицензиями авторов. Оформлялся аудио раздел также, как у фильмов. Ну и главное, там были отзывы пользователей. По ним можно определить стоящая книга или нет, если автор неизвестен. А также качество начитки и звуковое сопровождение.

Вот такое еще есть, возможно, пригодится как-то:
www.livelib.ru/...​tag/аудиокниги/selections

Главное под каждым фильмом указывать «фильм для думающих»

Так может реализовать как фичу? Типа ТОЛЬКО фильмы для думающих (что они думающие).

Не знаю за других, мне ресурс для подбора фильма отрезанный от ресурса для просмотра фильма кажется мало привлекательным. Как человек ленивый, я хочу, что бы сайт сам смотрел, какие фильмы я смотрю, и предлагал на основании этого что-то новое. И что бы запоминал, что я смотрел, а что нет, где остановился, без дополнительных жмаканий кнопочек, что бы сохранял историю просмотра так же. Еще было бы не плохо, что бы была оценка, и это влияло на то, что мне предложить, ведь может фильм не плохой, мне просто актер какой-то не нравится или режиссер.. Что бы ресурс предлагал ремейки и продолжения понравившихся.

А ресурс оторванный от того, что я смотрю, мне кажется не сможет подобрать достаточно хорошо.

Не совсем с вами согласен. Больше склоняюсь к тому, что каждый ресурс должен заниматься своим делом. Проблема в том, что ресурс, предоставляющий просмотры фильмов, имеет свои проблемы (скажем мегого) — это договора с правообладателями, проблема хранения тысяч фильмов, нагрузка на сеть и задержки, монетизация и куча еще, что надо сделать на вчера. Ресурс же, который ориентирован на взаимодействие с пользователем (скажем кинопоиск) имеет соответственно свои проблемы и им просто некогда заниматься показами фильмов.

Но выход из этого вполне простой: прикручиваем к странице о фильме ссылку на тоже мегого, иви, гугл фильмы и получаем процент за просмотр, при этом можно реализовать практически все, что вы написали и все будут в плюсе.

Поддерживаю предыдущего оратора, лучше чтобы ресурс учитывал уже скаченные и просмотренные фильмы, и на основе этой статистики выявлял вкусы конкретного потребителя, и выдавал соответствующие этим вкусам фильмы. Для этого нужно будет вникнуть в тему, какие решения принимались в поисковике гугла. И конечно же, должна присутствовать возможность скачать фильмы тут же не отходя от кассы. Естественно через торренты, а не с ftp на этом сервере, можно с каких угодно трекеров, не связанных с данным ресурсом. И должно быть описание качества контента на предложенных ссылках. Вообще часть описанных в сабже идей и так уже реализована на разных ресурсах.

Офигенный стартап! Давай назовём его «телевизор» и будем монетизировать через рекламу и политеку.

Хаха. Только как вы предлагаете решить главный мой кейс, с которым я стыкаюсь каждый вечер: хочу посмотреть фильм на подобии «остров проклятых»? Телевизор — это один из пунктов, но он не вешает всех проблем.

он не вешает всех проблем

Это именно то, что он делает!

Оговогочки, по Фгейду :)

хочу посмотреть фильм на подобии «остров проклятых»

Сердце ангела. Попробуй любым из своих алгоритмов найти это совмещение, и вывести ну хотя бы в топ 7, не подсовывая правильного ответа заранее. В идеале — не подглядывая в сам фильм (так нечестно, ты ж не будешь роботу фильмы показывать).

PS. Убийца ацкий сотона :)

хочу посмотреть фильм на подобии «остров проклятых»

Попробуй ещё свести с Uninvited. Проблема в том, что его не сведёшь по описанию. Единственное чем ты можешь воспользоваться чтобы получить годный результат — это снять сливки со сборок по какой-то тематике. Иначе говоря, стырить контент :)
Смотри в чём загвоздка: фильм является подростковым ремейком корейско-японского хоррора, который в свою очередь ну очень местный, что не даст «пересечь» нейросети ключевые слова и высмотреть аналогию.
PS. Убийца не самая уродина.

Ещё более простой пример: пересеки Убить Билла и Госпожа кровавый снег. При том что это плагиат сюжета от самой идеи до мелких деталей, при полностью взятом саундтреке. Но нейросеть этого не пересечёт, а более простые индексирующие механизмы — и вовсе разнесут по разным углам, не позволив найти общее даже если хорошо постараться.

типа поиск по жанрам и рекомендации?
myanimelist.net/anime.php
myanimelist.net/...​.php?s=recentrecs&t=anime
или жанры с тагами и кадры от пользователей?
www.world-art.ru/...​tion/animation.php?id=312
www.world-art.ru/...​imation_photos.php?id=312
основная проблема намечается — раскрутка до уровня конкурентов

Наверно я не коректно назвал свой подход «тегами». Попробую обьяснить:
Я предполагаю, что мы, когда ищем фильм, подобный тому, который видели, опираемся на некоторые факторы:
Место действия фильма, главные персонажи, актеры, тема фильма и т.д.
Теоретически, если в таком ключе описать каждый фильм, то програмно можно подбирать наиболее похожие фильмы к требуемому. В теории, продолжения и фильмы из той же серии будут находиться первыми. Это нельзя назвать тегами, а скорее конструктивным описанием фильма.

По поводу конкурентов: вы о ком? Как раз в этом и проблема, что такого нет. И такой ресурс хочется сделать не потому, что хочется бабла (хотя слукавлю, если скажу что не хочется), а потому что до сих пор такого ресурса нет. И максимально пригодное для поиска фильма на вечер — кинопоиск, и тот заблокировали.

www.imdb.com/...​mendations&ref_=tt_rec_lm
Виджет «People who liked this also liked...» на IMDB как раз это и дает — поэкспериментируйте. Правда, веротяно, он на нейросети по профилям пользователей — например, для GitS2: Innocence показывает Акиру, Паприку и Бибопа, и не показывает американский GitS.

Может я не разобрался, но имдб откровенно слабоват даже по сравнению с кинопоиском. Мне кажется он ориентирован именно на новости по фильмам, а не на помощь в выборе фильма на вечер. Хотя могу ошибаться

«Даже»? Кинопоиском занимается Яндекс, у которого несколько тысяч специалистов по машинному обучению, и который успешно тягается с Гуглом.
Вот попробуйте проверить, поможет ли IMDB подобрать.
В любом случае, Вашему стартапу придется либо довольствоваться импортозамещением в одной бедной стране, и в рисках будет маски-шоу, либо — бороться с кинопоиском, IMDB и помидорами.

Я не в коем случае не говорю что кинопоиск недо-ресурс. Кинопоиск очень сильный и огромный проект. Я только сказал что в плане поиска фильма для просмотра и для выбора, что посмотреть вечером он слабоват, потому что ориентирован на другое — новости, рейтинги, энциклопедия по фильмам. Максимум инфы по каждому фильму и связанных с ним событий и т.п. А если я пришел вечером с работы и задаюсь вопросом, что посмотреть, то кинопоиск мне в этом не поможет, кроме топ250, который уже давно просмотрен. Даже топ1000.

Ну тогда посмотрите Санаторий под клепсидрой.

Если столько пересмотрел — поздравляю, ты киноман. Поднимай свой авторский проект, с очком и критиками :)

если в таком ключе описать каждый фильм

Кто этим будет заниматься? Мотивация? Контроль качества?

Любой алгоритм подбора упирается в «язык описания».

сайт почти пустой

И фильмы какие-то дэбильные.
Или затхлые документалки, или авторское, «андерграундное».

В разделе «фантастика» есть Мушиши и Мононоке Химе. Одно известное, второе — не документалка.
Но ничего из того, что вбивал в поиск, не нашлось.

У вас какие-то проблемы с авторским кино?

Что из перечисленых мной пунктов реализовано на этом ресурсе? Или это один из ваших проектов? Тогда мне было бы интересно узнать историю его развития и проблемы возникавшие по ходу

Підписатись на коментарі