Интересуетесь Machine Learning, Computer Vision, AI? -> Вам сюда

Да это снова я) На этот раз все легально на 300% без мухлежа, но все так же с блек-джеком и ш**хами.

На этот раз я решился немного заняться образованием и любимой мне темой машинного обучения. Посему решил создать канальчик на телеграме, для постинга интересной инфы, которая не успевает попадать в статьи.

Подписываемся, будет интересно всем, а не только фанатам боли)
t.me/ml_world

LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Автор, как успехи за почти два года?)

Да нормально, сча делаем систему по гейм-аналитике + аутсорс по МЛ)

подскажите пожалуйта хорошие оффлайн курсы по ML в Киеве, видела что Projector запустит годовой курс и есть точечно от компаний ...но там дикий конкурс, как в Гарвард, блин..(а потом жалуются, что специалистов мало). Прошла несколько курсов онлайн, но они какие-то или очень узкие..или уже слишком сложно, как для начинающего.

а потом жалуются, что специалистов мало

Кто??? Имя сестра, имя?

А так курс от Эндрю Нг самый приличный для начинающих и он в инете.

но изначально я просила оффлайн курс

Тогда в американский универ или английский. В постсовке и курс ML и приличный??? Дайте 10.

:))) ну есть же у нас несколько компаний которые делают healthcare (или еще какие) решения с тем или иным уровнем использования ML, значит не все так печально в постсовке. Можно не курс, можно тыкнуть в специалистов готовых делать трансфер информации 1 на 1. Может это будет не так и дорого, как курс за 88 тысяч))

есть люди готовые передавать знания по МЛ бесплатно?) Или имеешь ввиду — самообучаться?

ну я вот как бы для этого группу сделал. Часто много всяких митапов проходит где народ делиться. Мы вот у себя в компании каждый вторник стараемся чето рассказывать.

Всё печально и очень. 99% ML — это дернуть стандартные опенсурсные или платные решения из питона и сказать, что ML. Тот же самый формошлепинг. А как вспоминаешь хотя бы Байеса, глаза округляют — ЧТО ЭТО?

Так что самое разумное — это курс от Эндрю, а дальше в работе просто копипастить его примеры и задачки.

если бы все так было просто и очевидно) но увы 99% задач не вписываются в готовые решения)

И как часто у тебя такие задачи? Чаще втюхиваются туториалы по сути.

Или что еще чаще основная масса просто не знает про готовые решения (да, часто они в виде статей и старых) — опыт маленький.

Вот сейчас я наблюдаю во всем инете, что 95% тех, кто ковыряется с визуальными образами вообще не в курсе прошлых работ по звуку и речи и начинают выдумывать новую терминологию и заново двигаться к тому, что в речи еще в 90-х начале 2000-х сделали и отладили и исследовали вдоль и поперек.

та дохера всего.
рекомендационные системы с адекватной пероснализацией и точностью выше 30%, обджект детекшен на ембеде, гейм рекомендации, фоторетуширование, визуальные дескрипторы, аудиальные дескрипторы.. да кароче дохрена всего.

Вот то что я проходил. самый толковый это курс от Карпатого был cs231n.
medium.com/...​ing-engineer-a7d5dc9de4a4

А вообще никакой курс спецом не сделате, так как все они рассказывают то что уже давно сделано и работает с коробки + все примеры простые.
Реальная же работа это всегда полный звиздец как по данным так и по таскам, а посему только практика может помочь чего то достичь. Тут поможет Kaggle + свои пет проекты и исследования.

Насчет оффлайн курсов хз. Не все толковые специ хорошие преподы, увы.

Projector запускает годовой курс в сентябре, но стоит 88 тысяч. Ничего не слышал о специалистах Дмитрий Кордубан, Ян Цибулькин? Пока что это самый интересный курс, как по мне...но очень дорого)

Диму знаю, раньше был СТО в Заказ.уа, но насчет его МЛ бекграунда без понятия вообще.
Яна лично вроде не знаю, но если память мне не изменяет(тут как бы рандом) то спец довольной хороший(вот какойто его доклад fwdays.com/...​review/developing-control).
Но снова таки спец != учитель.

Я видел как некоторые люди дают очень много математики.. что изначально хреновая тема. Так как МЛ строиться на воображения, если можно так сказать.. тоесть нестандартных подходах(так как стандартные уже давно описаны и работают с коробки). Разумеется математика тоже важна, но уже как дополнение, а не базовая вещь. Базовая вещь это всегда идея. Не понимая же идеи вся математика будет сливаться в трубу(как это легко можно увидеть в наших тех вузах).

Смотри, вроде у прожектора была тема с возвратом денег. ну или как минимум можно договориться. Тоесть отходить неделю например и посмотреть насколько понятно обьясняют ребята, если все устраивает то как бы все ок, если нет, просто забираешь деньги и учишся сама.
Инного варианта дать оценку их пед. способностей придумать не могу.

но оффлайн курс лучше конечно мотивирует учииться чем онлайн, так как есть общение с людьми + соперничество

спасибо, так и сделаю, если до июля ничего не найду. Заплачу за месяц.

а по cs231n ты выполнял асайменты к лекциям?

прям все пункты или только те которые мог? он там во второй лекции рассказывает про к-соседей и линейный класификатор, а в задании то что он не рассказывал

ну так все образование западное строиться. 20% на лекции остальное сам копай.
Но там все ппросто как бы. Большая часть всех этих штук просто однослойные персептроны разной конфигурации.

когда начинал все. потом когда уже некоторые вещи стали дублями(бо все курсы +/- копираюут другие) то канеш на это время не тратил

если интересно мы в СБ эту в 12.00 в центре собираемся поговорить о том как зарабатывать 10к в месяц. можешь пподойти расскажу за мл

не смогу в сб, в киев приезжаю на рабочие будни обычно. Я живу в другом городе. В фб добавлю, спасибо)

Ну у нас по вторникам камерные ивенты в офисе вечером на 19.30 по МЛ. Можешь зайти туда. Вот наша группа www.facebook.com/...​groups/20thousandleagues

если че вот мой фб, маякуй в месенджер, а то тут могу проебать www.facebook.com/anikishaev

В kNN сложного только в том, как быстро искать этих к соседей.
Линейный классификатор — это почти школа (по крайней мере та, что была в совке).

Ну и дам совет, не заучивай эти названия, а старайся понять их суть, о чем они. После этого ты будешь видеть чем похожи и чем отличаются другие подходы.
Понимай, из каких и почему развился очередной метод или путь.

Вот сейчас новомодная хрень с громким названием EVM (Estream Value Machine). По сути почти чушь без малейшего доказательства его применимости и его ограничений и всего-лишь небольшое изврашение над давно всеми применяемыми функциями распределений.

Или вот тебе мой ляп из последнего. Есть такой подход калмановская фильтрация и ее многие бестолково сейчас лепят везде. И я прилепил и две недели долбался, пытаясь понять почему не работает. А потом подумал пару дней и вспомнил о границах ее применимости и из каких идей она создавалась и стало сразу ясно, почему она не работала и работать не могла.

Вот, например, нужно понимать что общего в факторном анализе и PCA и в чем различие и для чего.

Или, например, для чего нужна мера Махаланобиса, кстати в английской вике там ошибка (не в собственно формуле, ее написали правильно, а вот объяснение ее неверное в корне).

З.Ы. И да для понимая этого как раз и понадобиться матан с теорией вероятностей и мат статистикой.

обычно, после таких комментариев хочется просто все бросить и работать на кассе. Для начала и заучить — уже не плохо. Матан это прекрасно, тогда посоветуй хорошие курсы по всем этим прелестям. Какой у тебя бекграунд, ты начинал с нуля или на основе знаний с института?

обычно, после таких комментариев хочется просто все бросить и работать на кассе.

Почему? Это же получение удовольствия — разбираться в чем-то новом и сложном. По крайней мере для меня. Хотя, я возможно не совсем нормальный человек, с точки зрения основной массы людей. Я, например, плохо себя чувствовать начинаю, если часа хотя бы 2 в день не поковыряю чего научного.

Какой у тебя бекграунд, ты начинал с нуля или на основе знаний с института?

ФПМ БГУ, закончил в 1992 году.

Матан это прекрасно, тогда посоветуй хорошие курсы по всем этим прелестям.

Лучше всего самообучение в нужных для понимания частях. Но можно в универ пойти учиться, если нужен тот, кто пинать будет (преподы).

в универе учат хрене 50летней давности без привязки к реальности. Такое обучение == просто проебать время.

Тебе нужны первые 3 курса базы. Она более 100 лет назад разработана и юзается всеми и вся и сейчас.

я учился на мехмате.. и как бы вся эта база пошла лесом.. ибо привязки к реальным задачам и что главное умение формализировать задача в разрезе изученого материала там не приподавала, как сосбно и в любом ВУЗе Украины.
А посему все эти знания уже давно и успешно удалены мозгом в виду их безнадобности.
Вот например интегралы многие знают и проходили еще в школе. А обьем помещения кривого хрен кто сможет посчитать.. хотя и знает интегралы.. и что с них толку в таком случае? Вот тоже самое и здесь.

Странно, у меня после ФПМ не востребованы оказались разве что дифуры. Ну и собственно все те доказательства теорем. Но следствия и результаты тех теорем пригодились.
Да, мне нафиг не нужно было брать сложные интегралы аналитически, но численные методы для их решения оказались нужны и общее понимание об интегралах от университетского курса нужно было.
Без ГА вообще никуда.

1) Ты учились еще при СССР. А там обучение было не такое убогое как сейчас
2) Вопрос чем вы занимались после этого. Я вот программист. 10 лет занимался разработкой софта и не то что бы там мне нада была вышка. 10 лет знаний которые не имеют физ привязки это считай что и не учился. Я за 10 лет даже на велосипеде ездить разучился... а ты говоришь математика.
3) вопрос возраста и стреса. я бы счас врядли бы потянул обучение на мехмате физически. потому как мозги уже так шустро не бегают. а посему такое решение крайне утопично для многих

Сравнить образование не могу.

Но 90-е — было много говна. Но из меня ни бандит, ни чиновник, ни торговец получится не мог. Посему в общем впроголоть занимался программингом и ML (тогда его так не называли).
Ну а после программингом на галерах и помогал одному мужичку с наукой (в итоге он докторскую таки защитил).
Ну а как пришла мода на ML полностью в него вернулся, хоть и с просадкой по деньгам, относительно галер.

А с мозгами оказалось всё не просто и они таки бегают, правда не так как в молодости. В молодости я мог и 10 час в параллель решать 2-3 задачи. Сейчас только одну и не более 5 часов в день (честных).

А вот сегодня конкретно туплю, посему и развлекаюсь здесь. Но завтра пару часиков, послезавтра. В общем никаких потерь в среднем в темпе работы.

На самом деле как оно в тонкостях работает знать не нужно. Нам его не пилить ведь надо а юзать. Вот ты врядли знашеь как экран твоего смартфона работает ведь так? Вот и здесь тоже. Нужно знать лишь где каждая хрень применима и почему без глубокого понимания.
Например PCA усредняет, а ICA выделяет и это все что по сути нужно знать для применения.

Суть МЛ как раз в том что бы не иметь 20 лет зубрежа на мех-мате, но делать многие вещи просто апроксимацией.

Тоже понимание о котором ты говоришь, даст прирост точности например на единицу после 5го знака после запятой. Бизнесу это нафиг не нужно. у них +/- 5% ок.

Если же идти в науку то это совсем другой путь и совсем другие задачи, и наука не решает реальных проблем сейчас. она решает вымышленные траблы на базе которых другие уже решают реальные траблы(ну зачастую).

Если же углубляться в суть любого алга,то с работы вылетишь крайне быстро так как ни один проект не закроешь.

Ну и самая главная фишка. Если мне надо ответить на вопрос «что общего в факторном анализе и PCA и в чем различие и для чего», то я просто наберу того кто в этом спец да и спрошу. Это куда оптимальней чем пытаться стать всемирной энциклопедией.

Например PCA усредняет, а ICA выделяет и это все что по сути нужно знать для применения.

Нет. Это суть одно и тоже. По сути и то и то поворот, только второй, если память не изменяет с нелинейностью и оба выделение главных компонент. Сорри за очень кривое пояснение. Давно ICA не юзал, надо посмотреть на полчаса, чтобы вспомнить.

Тоже понимание о котором ты говоришь, даст прирост точности например на единицу после 5го знака после запятой. Бизнесу это нафиг не нужно. у них +/- 5% ок.

Нет, это как раз и даст приросты качества в десятки процентов. Но да формошлепства в ML, конечно оное не нужно. Заюзал по туториалу и забил, продажники втюхают.

Если же углубляться в суть любого алга,то с работы вылетишь крайне быстро так как ни один проект не закроешь.

Нет, просто при понимании ты будешь юзать то, что наиболее подходит к задаче.

Ну и самая главная фишка. Если мне надо ответить на вопрос «что общего в факторном анализе и PCA и в чем различие и для чего», то я просто наберу того кто в этом спец да и спрошу.

А я выставлю счет за консультацию.

PCA vs ICA. Две картинки усредняем до вектора размерности 2
первый даст что то вроде [0.25,0.25] и [0.75,0.75].
А второй [0,1] и [1,0] вот все различии. и соответсвенно их применимость. второй юзают для disentanglement понижения размерности и выделения фич.

приросты качества в десятки процентов ничего не дает) Такая суровая реальность.

Нет, просто при понимании ты будешь юзать то, что наиболее подходит к задаче.

Тут вот какой нюанс.. эти алги шлепают быстрее чем ты тут комент написал. А посему то что ты выучил зачастую может быть уже давно бесполезно. А слдеовательно и заучивать толку нет, так как любая задача начинается с ресерча области и того что придумали с предыдущегоо раза.
А посему просто запомнить чет и забить на эту часть не выйдет. а посему запоминание безсмысленно. И даже я бы сказал пагубно ибо приводит к стогнации.

А я выставлю счет за консультацию.

Вообще не вижу в этом проблем) при условии даже что твой рейт в 10х больше моего консультация всеравно будет дешевле чем изучение вопроса самому с нуля.
А посему я на такой теме лишь секономлю затраты.

Вообще говоря с одной стороны я с тобой согласен. С точки зрения зарабатывания денег ты во многом прав.
Но, есть еще два момента:
1. Понимание сути подходов и алгоритмов позволяет быстрее выбирать более правильный подход для решения задачи.
2. Собственно удовольствие от того, чтобы разбираться и понимать, как оно и почему работает.

З.Ы. Для девочки в ветке надо брать за основу твой подход, но не забывать по наличию времени влазить в понимание глубже.

И кстати вот совсем сейчас конторе пригодились мои знания. Я провел небольшое исследование (2 недели), сделал презентацию со ссылками на глубокую математику и в результате вся контора сэкономила кучу времени на задачу решаемую. Мы не пошли ложными путями. Осталось долизать продукт и результат на уровне лучших мировых в задаче.

Простой пример. Дип сетка. 1.5 ярда параметров. Просчитать ее за конечное время мат методом просто невозможно. А посему никакое понимание алгоритмов ничего не даст вообще.
При этом сетки делают почти любой алг на раз два.. просто за счет инвариантности. Посему на них так масово и переходят.
И если ты посмотришь.. то из всего спектра мам методов сейчас используются лишь парочку и большинство из области обработки сигналов. Все остальное дикий примитивизм.. просто настеканный в адовом количестве.

В МЛ мало вещей сложных. почти все тривиально. просто потому что если что то будет не тривиально то хрен ты сможешь отловить баг.

Ну и про понимание. Куча спецов с матбеграундом. профессора, академики.. А до сих пор народ отлавливает баги уровня 3го класа. Которые никто из этих гуру не заметил. И в чем в таком случае разница между ними и каким то левым челом?

При этом сетки делают почти любой алг на раз два.. просто за счет инвариантности. Посему на них так масово и переходят.

Тут такой момент, что долгое время кучу задач не могли решать из-за слабого железа. Современные сетки на том железе считать — это года.
Сейчас появилось железо для них и этот спектр задач на них решается.
Но, а на 90% уверен, что через 5 лет опять все упрутся в железо.

И сетки, что сейчас на текущем железе тянут — это CNN только. А эти сетки могут решать очень ограниченный класс задач.

А вот если взять область обучение без учителя, тут всё глухо. Или примитивная кластеризация или суперкомпы нужны, которые не ожидаются.
Или области, где сверточные сети не применимы — тут тоже всё глухо.

обучение без учителя имеет ограничение из-за непонимания как вводить информацию, но уже сейчас это тренд. так как данных все больше а обучение с учителем это оверфит всегда как ни крути(иначе и быть не может)

Проблема всех решение сейчас то что они работают без привязки к памяти(внутренюю не считаем так как она ничтожно мала). И как следствие сетка не контроллер, а просто некий вид извращенной БД с хреновым языком запросов и неточной выдачей.

обучение без учителя имеет ограничение из-за непонимания как вводить информацию

Нет. В том как организовать наказание.

ну и снова таки. Есть разные таргеты. Заниматься наукой или же инденерией. и они имеют очень разные требования и умения.

Инженерией я бы оное не назвал. Просто формошлептсво. Но за него платят и не скучно так формошлепить пока.

так инжнерия и есть формошлепство. Берешь инструменты и с их помощью делаешь то что надо.

Блин, чувак, да ты вылитый Рагнар Лодброк!
i.pinimg.com/...​ngs-lagertha-lothbrok.jpg

Кстати, подскажи, где искать специалистов по машинному обучению. Нам нужен такой (в Днепре, желательно)

Искать нужно в тусовках. Есть группы ФБ где тусят укр спецы, можно у нас в группе если дадите полное описание с зп или же за денежку если без него.

пока детальных требований нет, готовим еще. Дайте ссылку на вашу группу.

где искать специалистов по машинному обучению

Вообще эта фраза сродни «где искать программистов». А на вопрос для чего, ответит: «Столы носить».
Фрагментация ML не меньше фрагментации программинга.

как хорошо, что работодатель оплачивает ваше время $15/в час за то, что вы даете ценные советы на DOU.

Пока я тунеядец. И не считай деньги в чужом кошелке — это вредно для нервов.

Но уже твоя реакция на мой намек выше многое говорит о тебе, как о работодателе:
1. Не воспринимаешь советы и критику.
2. Все время смотришь в чужой кошелек, в том числе и своих работников.

В ML очень мало спецов, даже если брать глобальный рынок.
В Украине я реально могу толковых людей свести гдето к 20-30 людям. И при этом как понимаете все они уже заняты и получают немало.
А посему единственно адекватный вариант это брать смышленных девов желающих работать в этой области. В отсальных же случаях нужно готовиться платить от $8к

Собсно то что я и говорил. большой спрос, и слабое предложение. Цены в этой области очень долго будут высокие, а главное порог вхождения здесь намного выше. Что позволит рынку существовать в таком виде достаточно долгое время.

bons.ai внушает надежды на исправление ситуации, ибо текущее положение дел стопорит прогресс. Иначе говоря, нам нужен «C» (ну хотя бы FORTRAN) для ML. Ибо пока это как на заре возникновения ЭВМ, использовать которые первые полторы-две декады могли лишь PhD в математике или физике.

Не изменит. за два клика сделать работу нельзя.

Как инструмент0обертка выглядит неплохо. Но работы за тебя оно не сделает.
Так что требования к знаниям и понимаю области останутся теми же.

Да и C/FORTRAN за тебя работу не сделают. Но как обёртка над машинными кодами все же лучше, чем писать на оных.

Привет! Андрей кроме питона для ML что еще дефакто используется найболее часто

ну весь DataScience на пайтоне, ибо удобно. Если говорить за выполнение на девайсах и новые операции, то Си. Чисто для DS еще R юзают, но честно как по мне то очень не юзабельный язык, с кривым синтаксисом, который не дает никакого профита.

Сейчас ищу ментора/СТО/кофаундера в стартап по внедрению DS и ML в уникальную предметную область и отлично понимаю всю боль спрашивающего.

в стартап

Т.е. денег платить не будешь? Логично, что и найти сложно.

Т.е. денег платить не будешь? Логично, что и найти сложно.

На сегодняшний день там скорее менторство, т.е. код я написал, но надо ревью сделать, совет дать, помочь обойти ограничение алгоритма или пофиксить необычный баг, и т.д. На полноценную работу и оплату не тянет, а фрилансера брать не хочется, хотелось бы чтобы человек был в курсе дел и впоследствии вошел в проект как СТО/кофаундер.
Естественно, если появятся инвестиции, то объем вырастет до приличных размеров и будет оплата, конечно меньше чем в лидерах рынка, но с долей (или опционом).

Вопрос в том, что интересующихся новыми проектами в принципе немного.

Все эти стартапы большой напряг ввиду больших инвестиций и большой цены для клиента.
А посему нужно быть акуратным чтобы зря не профигачить год.

Год без оплаты при вероятности взлета стартапа 0.001.
Тут уж лотерейки выгоднее покупать, а еще выгоднее битки майнить. Пока растут, главное успеть выйти из них до схлопывания.

а фрилансера брать не хочется

Т.е. хочешь найти чела, что будет сидеть у тебя в офисе, разбираться в том, что ты наваял и всё это бесплатно за возможные плюшки в далеком будущем?
Я тоже хочу черной икры с возможной вероятностью моей оплаты в далеком будущем с большим количеством если. Только вот никто так икры не продаст. Более того, даже хлеба тебе в таком варианте не продадут.

Т.е. хочешь найти чела, что будет сидеть у тебя в офисе, разбираться в том, что ты наваял и всё это бесплатно за возможные плюшки в далеком будущем?

Я хочу человека, которому можно будет в скайпе написать «Привет, тут алгоритм вот такую фигню ... в результатах выдает. Есть идеи как исправить чтобы результат был поход на вот это ...?»
А офис и т.п. ясное дело уже при наличии денег. И в этом случае будет гораздо лучше когда человек уже в курсе проекта.

И получить ответ, ну попробуй вон ту фигню и ссылку в инет?
Ну так для этого уже есть прекрасный инструмент — туча форумов.

Если же ты хочешь, чтобы человек сделал какую-то работу, то обычно разумное ожидание человека оплаты за работу от тебя?
А иначе — это разводка лоха. Да лоха найти можно, но сложно.

Вот ты готов за бесплатно мне бульбу на даче посадить?
Или я тебе скину интересную мне задачку и ты мне ее бесплатно сделаешь?

И получить ответ, ну попробуй вон ту фигню и ссылку в инет?
Ну так для этого уже есть прекрасный инструмент — туча форумов.

И покопаться там целый день, а то и не один? Для обучения — да, для того чтобы сделать проект — не совсем.

Вот ты готов за бесплатно мне бульбу на даче посадить?

Я нет, но какой-нибудь Дядя Вася, которому выпить не с кем — вполне может быть.

Или я тебе скину интересную мне задачку и ты мне ее бесплатно сделаешь?

Ну пишут же люди pet-проекты «в стол».

Я нет, но какой-нибудь Дядя Вася, которому выпить не с кем — вполне может быть.

Вот видишь. То есть ты ищешь такого Дядю Васю, которому выпить не с кем. Но чтобы этот Дядя Вася еще и был докой в том, что тебе нужно — это тебе проще лотерейки покупать. Водка и работа головой не совместимы. И более того этот Вася работает за оплату водкой, а не потому, что он такой добрый.

Ну пишут же люди pet-проекты «в стол».

Да, для собственного удовлетворения. Я такое делаю.
Но если это твой проект, то бесплатно для тебя делать не буду. Извини, но это в нас эволюционно заложено. Недавно была передачка по дискавери, где разбирали 7 смертных грехов и почему они возникли и без них мы не выжили бы. А выжили именно благодаря тому, что они в нас заложены и достаточно глубоко за многие года нашей эволюции.

Так не существует спецов вообще в МЛ. У всех свои специализации.
Иначе ты мне напоминаешь одних ваших, что подвязались сделать «детектор лжи» по речи.
Я отказал им сразу же — ибо знаю эту область очень неплохо и знаю где там заканчивается научная фантастика и начинается ненаучная.
Пиши четко, кто нужен. И после уже можно причитать, что не найти специалиста или таки найти.
А еще одни хотят распознавать текст в любых условиях съемки при любых искажениях камеры и получить качественный результат за 3 месяца. С таким только в конторы мирового уровня, что подобное уже сделали и только свой движок под заказчика адаптируют — стоить такое будет очень прилично ибо в цену войдет и оплата за предыдущие 10 лет разработки.

Ну я, например, прошу всего 15 в час, это много? Если сказать про 25 в час у многих в постсовке глаза округляются. Но я не знаю весь ML, только определенный его части и направления.

а зачем ты работаешь с нашими? работай на США и получай от 50уе в час легко.
дектор лыжи по речи можно сделать.. только точность у него будет не то чтобы очень высокая.
А на счет 3 месяца это обычная тема.. так как люди не шарят вообще, а насмотревшись роликов презентаций думают что это просто.

дектор лыжи по речи можно сделать.. только точность у него будет не то чтобы очень высокая.

Нельзя. Нельзя сделать детектор лжи на параметрах управляемых сознательно. Только на тех, которыми мы не можем пока сознательно управлять. Это пот, пульс, давление, ЭКГ и т.п.
Речь же это исключительно сознательный процесс. И более того лжи мы учимся уже в 2 года, как только начинают формироваться определенные разделы мозга.
Более того, об этой хрени КГБ-ФСБ мечтают еще с совка и всегда их речевики с этим бредом посылали лесом и будут посылать.
Более того по речи даже с эмоциями человека всё плохо. Работает только на берлинской базе, начитанной профессиональными актерами с выпячиванием эмоций. Для берлинской базы сделать легко (делал, правда не в одиночку), но с обычными людьми просто не работает. Большинство людей не умеют так голосом выражать эмоции, как профессиональные актеры.
По сути работает только одно, ты можешь определить только степень возбужденности человека по его речи. Здесь можно достичь accuracy до 80% где-то.
Могу и про другие обликовые характеристики рассказать по выделению их на базе речи.

Вот один недавно хотел получить за полгода то, что канадские phd (команда из нескольких) 4 года делали. Я ему посоветовал для презентационного проекта воспользоваться сервисами гугла и подобных. А потом, если инвестора найдет уже думать, хочется-ли ему свое такое же делать.
Да то, что он хотел вполне реализумо, но не за полгода, а сильно дольше.

а зачем ты работаешь с нашими? работай на США и получай от 50уе в час легко.

Тупой я в разговорном английском. Да и не знаю, где там искать. Если ты про апворк, там спецов в МЛ тучи. Стоит появиться адекватному заказу в этой области в течение пары часов бидов 20 от спецов с рейтингами 100% в этом направлении.

Это пот, пульс, давление, ЭКГ и т.п.

Если у человека меняются параметры при ответе на какой-то вопрос. -это не значит, что он лжет. Может это просто очень значимая для его психики тема, какая-то травма детства или еще что. Например- на его глазах люди жестоко убили собаку в детстве. И теперь на любой вопрос про убийство он будет напрягаться, даже если не он это делал.

Ну, тут уже другие моменты. В том числе и калибрация на человека.
Но калибрация на сознательно контролируемые параметры невозможна.
Плюс еще обычно долго учат пользоваться полиграфами. Просто его включить. прилепить датчики и всё увидеть нельзя.

Не столы, программеры по ML нужны для разметки фоток, это все знают :), кто смотрел silicon valley

Тогда понятно. Достали эти американские сериалы. Насмотрятся сказок, а потом бегают с «хочу».

Судя по фразе про «без мулежа» и «300% легально», этот пацан когда-то работал в подмосковном городе Химки.
www.youtube.com/watch?v=j7jUbnLRj3Y

Тут нужно знать просто историю моих постов на ДОУ чтобы понять юмор)

как-то слишком научно-популярно все выглядит

Хорош выпендриваться. Вполне нормально выглядит. Это местный уровень, а не уровень Мита.
А то насморятся американских фантастических боевиков, потом хотят то же но вчера и бесплатно.
Более того, даже не понимая того, что это ненаучная фантастика в том кино.

Нормально без выпендрежа и научпопа даже на Украине можно собраться и разобрать эту книгу
www.amazon.com/...​Mathematics/dp/0521864674
и посмотреть, есть ли какие-то задачи, где это можно применить.

А зачем собираться, чтобы ее прочитать и понять?

Задачи есть, но денег нет. Так что в качестве хобби почему и нет. Но и научпоп тоже полезен, чтобы понять, что за область это ML и для чего.
Понятно, что в реальных задачах ни один показанный в научпопе подход не работает. Точнее работает, после большой работы с ним, как идеей и большой доработкой напильником.

Вот тебе задачка, решение которой я пока нигде не нашел в общем случае. Есть набор обьектов, заданных векторами пусть в R^n. Нужно найти большую часть этого набора в другом большем наборе. Причем совпадающие обьекты в этих наборах не тождественно равны. Есть функция расстояния между объектами.
Точное решение даст полный перебор. Но это ну очень долго. Да, деревья чуть ускоряют поиск, но сильно усложняют алгоритм.
Вот сейчас пробую аналог RANSAC придумать для этого. Пока не получается. SA и GA тоже долго работают. Градиентный спуск тут не очень применим.

А вот человек такую задачу решает мгновенно и почти всегда, если объектов не много. До 10 в одном наборе и до 30 в другом.

А зачем собираться, чтобы ее прочитать и понять?

Я, допустим, неплохо разбираюсь в том, за что отвечают первые два слова в названии этой книги, а все остальное при желании могу выучить. Вопрос в реальных кейсах и насколько все это применимо.

Причем совпадающие обьекты в этих наборах не тождественно равны.

что значит «не тождественно равны»? Симплексы можно поворачивать?

Значит, что есть мера расстояния и она между ними не 0.

заданных векторами пусть в R^n

И главный момент в почти. Несколько объектов из первого набора могут отсутствовать во втором, а также присутствовать другие во втором.
А применений этого море. Типичный вариант разные игрушки на изображении. Найти почти тот же набор в другом. Игрушки описываются вектором.
Стандартный RANSAC в R^2 работает и его несложно изменить на любой другой оптимизационный метод. Главное, что в нем быстро считается гомография. Спасибо тому челу, что расписал ту задачку математически и получил красивое решение. Но у ранзака большой плюс — он легко распараллеливается на одной итерации. Тоже можно и для SA сделать, правда готовых решений я не видел, только статьи о возможности.

Можно сделать LSH по cosine distance относительно рандомно расставленных плоскостей по гаусу. Поиск по хешам будет в разы быстрее. Можно также юзать какойнить Annoy индекс, но как он скелиться хз.
Со 100% точностью быстро не решишь. Хочешь быстро снижай точность за счет уменьшения размерности пространства. Или юзай асимптотическое приближение для поиска чтобы увеличить точность кластера но забить на точность более дальних членов.

У вас странный подход к жизни. Вы берете алгоритм и смотрите куда можно его применить.
Хотя по нормальному нужно брать проблему и смотрить какими методами ее оптимальней решить. Ебатня ради ебатни не в почете вообще. А тем более если вы говорите о деньгах.
Что касается приминения МЛ в бизнесе, то тут обьем задач уходит в бесконечность, было бы кому их решать.

Канал создан для людей которые хотят рости, а не для 5ти спецов в стране.
А книга ваша 2009 года. Если не в курсе, то в МЛ и ИИ за месяц все кардинально меняеться, и те методы которые были вчера стейт ов зе арт, сегодня уже кривоногие самоделки.
Что же касается науч. деятельности то это дохрена бабла, которого ни у кого нет и врядли в ближайшие годы будет. Но если вы расскажите как толпе народа можно заниматься наукой и не сдохнть с голода уверен минимум памятник при жизни вам обесспечен)

когда кто то говорит — легально + без мухлежа, это наводит на какие то странные мысли

почитайте мои предыдущие треды, поймете к чему этот юмор)

Подписаться на комментарии