×Закрыть

Fake it ’til you make it — все що вам потрібно знати про ML

upd: розходимось, нема на шо тут дивитися

Тут під’їхала новина:

theintercept.com/...​zon-ring-security-camera

Beginning in 2016, according to one source, Ring provided its Ukraine-based research and development team virtually unfettered access to a folder on Amazon’s S3 cloud storage service that contained every video created by every Ring camera around the world. This would amount to an enormous list of highly sensitive files that could be easily browsed and viewed. Downloading and sharing these customer video files would have required little more than a click.
This real-time crime-fighting requires more than raw video — it requires the ability to make sense, quickly and at a vast scale, of what’s actually happening in these household video streams. Is that a dog or your husband? Is that a burglar or a tree? Ring’s software has for years struggled with these fundamentals of object recognition. According to the most recent Information report, „Users routinely complained to customer support about receiving alerts when nothing noteworthy was happening at their front door; instead, the system seemed to be detecting a car driving by on the street or a leaf falling from a tree in the front yard.”
To jump-start the process, Ring used its Ukrainian „data operators” as a crutch for its lackluster artificial intelligence efforts, manually tagging and labeling objects in a given video as part of a „training” process to teach software with the hope that it might be able to detect such things on its own in the near future. This process is still apparently underway years later: Ring Labs, the name of the Ukrainian operation, is still employing people as data operators, according to LinkedIn, and posting job listings for vacant video-tagging gigs: „You must be able to recognize and tag all moving objects in the video correctly with high accuracy,” reads one job ad. „Be ready for rapid changes in tasks in the same way as be ready for long monotonous work.”

tl;dr: Ring винаймають операторів для ручного розпізнавання образів. Машин льорнінг та імедж рекогнішн працюють погано.

Є хтось звідти щоб підтвердити або спростувати цю інфу?

LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Многие звонки от имени Google Duplex осуществляют люди, а не ИИ
itc.ua/...​estvlyayut-lyudi-a-ne-ii

Шум вокруг Ring: разбираемся в обвинениях американских СМИ
ain.ua/...​9/01/16/shum-vokrug-ring

Украинец, что будет аннотировать базу сильно дешевле американца. Так что логично таких людей нанимать в этих странах.
Но у Ринга есть люди, что и делают распознавание, используя эти аннотированые базы.
С другой стороны для разработчика Ринг не сильно отличается от того же Епама или подобного.

А лично мне они не подошли потому, что у них нет удаленки, только офис.

Шок и сенсация!!! для supervised learning датасеты размечаются людьми)))

Для unsupervised тоже. Только используются датасеты немного по разному.
В unsupervised для обучения распознавалки тоже нужно поощрение и наказание.

Хм, мне казалось, что в unsupervised датасет все же не размечается) функция расстояния да, куда ж без нее)) но у самого датасета нету меток со старту — я ошибаюсь? (погуглила, reinforcement learning, где есть поощрение и наказание вроде отдельный тип ML)

Ну названий много напридумано. По сути есть с учителем и без учителя. А вот датасет и для одного и для второго может размечаться.
Поощрение и наказание — это в том числе и твоя целевая функция.

Але, в принципі, це проблема. Всі кортани, сірі, і весь інший ai так саме і розробляють. Ти заграєш з своєю алексою, а десь якийсь індусик це слухає і прецця. Потім все його село буде над тобою ржати. Воно, звісно, анонімізоване, але...

Ничего сверх ужасного. Для того чтоб обучить модель, ей надо предоставить промаркированные данные. Существует отдельное понятие Human-in-the-Loop — если система не может автоматически (например) классифицировать картинку с высокой долей точности, эту картинку отправляют оператору.

Хоть статья не столько про МЛ, сколько о том что какие-то чудики из очередного сомали получили доступ к личным данным американцев, но про МЛ тут есть одна, в принципе весьма известная штука для тех кто реально с этим работал, но не очень заметная для всех остальный — работа МЛ в реальном мире и в пейперах всяких лаб(даже честных, а не которые тупо врут) — это две большие разницы.
Очевидно же, что Ринг не начал с нуля, а уже с существующих открытых датасетов и, скорее всего, даже пре-тренерованых сеток. Но, в реальности, скорее всего, оказалось что
а) реальная картинка из камеры — так себе
б) люди носят разную одежду и лица сняты под разными углами и освещением
в) распознать то человека пол беды, а вот данных по «соседям» — реально голяк, они разрежены и variation очень большой и сеть тупо оверфитится и учит всякие левые фичи (типа — кто в шапке, а не фичи лица).
г)... я)
Так же, если я правильно понимаю задачу, то , скорее всего, там такой себе catch22 , с одной стороны — реально плохо пропустить чувака который «не сосед» и хочет взломать ваш замок, с другой стороны, если часто агрится на «соседей», то вера в функциональность продукта очень быстро пропадет и реально это превратится просто в камеру с детекцией движения.

Да, я полностью согласен. На деле имеем 2 основных проблемы:
— качество датасета (garbage in, garbage out);
— ML и DS — это всегда разговор о вероятности. Систем, которые дают 100% результат не существует;

А так воно і є. Не пам’ятаю де, але читав статтю, що десь в Африці наймають людей на таку роботу по отсорцу — клацати по картинках, покращувати алгоритми ai. Але це не заміна в реал тайм.
А сенсація статті, що ми, типу, отримали доступ до всіх різнокольрових мармиз американських, і не тільки, громадян. Думаю, непогано було б зберегти на серверах сбу. Вони ж своїм анб підсікають за нами через інтернет.

С точки зрения комара даже тигры неэффективны и медленны. Но фигня в том, что комар остаётся комаром :(

Про Рінг нічого не знаю, але стаття — рідкісна ***та. Автор вперше почув про МЛ і почав виводити рептилоїдів на чисту воду.

але стаття — рідкісна ***та

Посмотрите другие статьи на сайте и поймете, что ключевое слово в этой статье Ukraine.

От тільки люди працюють гарно якщо їх мотивувати. А якщо найняли в Україні не людей на аутстаф, а «команди» із місцевим менеджментом — то й працюватиме воно по-місцевому, як сапорт Приватбанку. Менеджмент мотивуватиме себе улюблених, не тільки грошима, а ще й наймом шльондр, та видачі їм керівних посад нижнього рівня. А на реальний персонал тупо наріже захмарні нормативи та штрафуватиме.

Наприклад, посадить слідкувати 1 стажера за 35 камерамми, і пофіг що в нього лише 2 ока. І сісь-менеджерка оштрафує його на всю зарплату, тому що не побачив куди побіг чийсь коте на березневі гульки.

так сердечно описано, шо аж собі захотілось таким стажорограєм і сіськощупом попрацювать :8))

Пару дет назад гуляла инфа про звездульку силиконовой долины , которую ещё окрестили Стив Джобс в юбке, типа феноменальных успехов достигла в изготовлении анализов крови.
Типа машинку смастерила, куда пробирку с кровью суёшь, а она тебе за пол часа развёрнутый анализ крови , который может цела лаборатория полноценная сделать.
В итоге оказалось что в машинка была просто порталом в олдскульую лабораторию в которой сидело 22 китайца и они по старинке анализ крови делали.

Там все намного интересней и драматичней: Bad Blood. Одна из лучших книг, которые я прочитал в прошлом году.

Вот так, блин, всегда — купишь вечный двигатель, а там гномики сидят и педали крутят!

Ладно гномики. А что если синьоры с доу ;)

Самое прикольное, что расцвет всего это любому критику или даже скептику отвечали примерно так:
Тот — мудак, гондон и неудачник,
Джентльмены так не говорят!
© Орлуша

СЕКСИСТ, МИЗИГОНИСТ

ну нвидия вроде в индии засадила 2000 человек для обучения компьютеров автономной езде, а может и не нвидия, может в китае ? ну вообщем нужен не слабый тренинг сет что бы начать отделять мух от грабителей

Так воно вже тіпа в продакшені працює ))) Виходить що купа інженерів два роки сидить щось там робить а по факту все розпізнавання вручную?

по факту все розпізнавання вручную?

не розпізнавання вручну, а збір трейнсету — це трохи різні речі

ну нвидия в продакшине еще не работает. Весь процесс выглядит так — вначале реагируем на изменение картинок, потом обучаем сетку распознавать характер изменений (ночь, день, дождь, кто то пришел), потом учим распознавать объекты во время изменений когда кто то пришел — детектим фейс, образ, и т.д. . Все это время продаем камеры и подписку на клауд.

Неожиданно для машинглернинга нужно иметь датасет для обучения!!!

P.S. Статья — очередной наброс.

очередной

А де попередній?

В СМИ. Гугли «fake news»

Может эти операторы делают разметку данных для нейронок (для последующего обучения)?

Хотя судя по отзывам доу, ринг-украина от среднестатистической укр. галеры не особо и отличается:

jobs.dou.ua/...​ng-ukraine/reviews/36803

для последующего обучения

Ага, вже другий рік підряд розмічають і продовжують ))) Мало даних напевне )))

Відома база ImageNet містить 14 мільйонів зображень (анотована вручну). Все ще думаєте, що 2 роки забагато? :) Нейромережам на трейнінг реально треба кінську кількість даних. А якщо трейнсет ще й з сегментованих картинок, то там роботи...

Відома база ImageNet містить 14 мільйонів зображень (анотована вручну).

Так кажеш ніби то багато. Чи хтось платив за якість, а не за кількість.

Ну гугл же до сих пор обучает нейронки на капчах.

В ML есть два вида обучения — с человеком и без. Без участия человека точность получается не более 50-60%, т.е. грубо говоря котики могут попадать в кластер к собачкам, собачки к котикам и будет детектится котопес. Чтобы улучшать нейронку собственно делается (упрощенно) следующее. Берем текущую нейросеть, прогоняем через нее какой-то датасет. Она кластеризирует изображения: котики налево, собачки направо. Соответственно могут быть ошибки. Люди эти ошибки исправляют. В результате получаем 2 кластера с уже откорректироваными изображениями. Потом засылаем их в нейронку и переобучаем ее. И так по кругу.

После этого «обучения» я прохожу капчу только если буду думать как робот. Или как обезьяна которой дали кликать эту капчу, и похеру на результат.

Точность 50% это рендом? :) половина в одну корзину, половина в другую

Если очень упрощенно описать, то при первом прогоне без какого-то датасета, считай так и получается, только кластеров больше чем 2. Если на примере — допустим у нас есть куча фоток людей.
Берем рандомную — это наш начальный датасет. Натравили нейронку, обучили ее распознавать эту фотку.
Дальше проходимся по всем остальным фоткам, если какая-то фотка похожа на изначальную (схожесть выше какого-то значения), значит считаем, что это один и тот же человек. Если нет — считаем что другой.
Из некластеризованых фоток берем рандомную, поулчаем новый кластер в добавок к первому.
Потом второй прогон аналогично, только обучаем нейронку по кластерам уже.
Далее распознаем те же фотки повторно. Фотки у которых наименьшая «схожесть» с кластером — выкидываем оттуда.

В итоге получаем приблизительно более-менее похожие кластера. Если это фотки нескольких людей, то в часном случае можно получить и 100% точность, но все зависит от первоначального выбора порога схожести и еще кучи других факторов. Поэтому на больших датасетах оно так себе и по итогу в кластере помимо правильных изображений может присутствовать 40-50% процентов левака.

Подписаться на комментарии