Три експерти зі сфер ML, AI та Data Science — Дмитро Сподарець, Михайло Константінов і Володимир Кириченко — про сучасні проблеми машинного навчання, тенденції розвитку й навіть вигоряння. А ще — поради початківцям та досвідченим спеціалістам.
Подход, помогающий создавать новые технологии в ML, от Алексея Чаплыгина из Reface. Спойлер: чтобы стать ML-исследователем, бессмысленно зубрить пейперы, молиться на мнения экспертов и коллекционировать «бест практисес».
В этой статье — 9 историй от ІТ-специалистов об интересном «железе», которое они сами собирали или улучшали. Кейсы самые разные — от сборки домашнего ПК, станции для машинного обучения до установок для тестирования устройств и embedded AI-системы.
У цьому випуску ви дізнаєтеся про використання теорії гри для масштабного аналізу даних, синтетичні дані для вибору моделі, ймовірнісне програмування для розуміння неточності у передбаченнях моделі, чи може АІ створювати меми, яке майбутнє нас чекає з дешевими deepfakes, AI агент, що грає в CS:GO та купу іншого.
У цьому випуску ви дізнаєтеся про підходи до open-source ліцензування у ML, АІ що сам пише код, чого не вистачає сучасному дата стеку, аудіо Deepfake, новий MLP-Mixer та купу інших цікавинок.
Свіжа підбірка останніх новин і цікавих матеріалів із data-індустрії. У випуску ви дізнаєтеся про методологію Microsoft в оцінці точності моделей прогнозування, новий підхід до паралелізації потоків даних з високою пропускною здатністю, чи проблема необєктивністі АІ — справді тільки в даних, як можна створити 3D модель об’єкта лише з одного зображення, та як побудувати нейронну мережу у Minecraft.
Написано много замечательных статей об алгоритме Seam Carving («Вырезание швов»), но Алексей Трехлеб не смог устоять перед соблазном самостоятельно исследовать этот элегантный, мощный и в то же время простой алгоритм, и написать о своем личном опыте работы с ним.
И если вы, как и автор, все еще находитесь на пути изучения алгоритмов, то это решение может обогатить ваш личный арсенал DP.
Свіжа добірка матеріалів із Data-індустрії. У цьому випуску ви довідаєтеся про те, як забезпечити якість даних у реальному часі, чи можуть штучно створені дані бути кращими за реальні, якими є останні оновлення платформи GPT-3, та як Google використав ML для тестування комп’ютерної гри на збалансованість.
Підбірка свіжих матеріалів зі світу Data Science за останні два тижні. Як виявити невдачу ML-моделі у виробництві, шлях до Data Mesh, ефективна «культура даних» Uber та багато іншого! Долучайтеся до обговорення і пишіть в коментарях, що ще варто було б додати.
Час минає, data-індустрія розвивається, а матеріали з цікавих мені технічних тем, як і раніше, доводиться по крихтах збирати звідусюди. Тож Володимир Кириченко вирішив скласти свої знахідки за останні півтора місяця до структурованого дайджесту та поділитися зі спільнотою.
Эта статья будет полезна руководителям команд тестирования и менеджерам по управлению качеством на проектах, где планируют или уже внедрили ML. Опыт Артема Прищепова, который занимается оптимизацией QA-процессов, может также пригодиться тестировщикам, которые хотят понять принципы тестирования ML в реальной работе.
Вероніка Демедецька, Tech Expert & Senior Software Engineer в AMC Bridge, кандидат технічних наук, покроково і з власного досвіду розповідає, як розробити симулятор промислових роботів. Тому, якщо ви працюєте або хотіли б працювати у цій галузі, стаття стане вам у пригоді.
Александр Гончар — сооснователь и Chief AI Officer консалтинговой компании Neurons Lab. Его команда разрабатывает решения в области искусственного интеллекта, в основном для финтех- и медицинских компаний. Александр выступает на технических конференциях по всей Европе, преподает на кафедре Data Science в Веронском университете и ведет популярный блог на Medium. Также он автор нескольких статей и AI & ML дайджестов на DOU.
Владимир Кубицкий рассказывает, как команда bird — приложения аренды квартир в Киеве — реализовала процессинг с ML-алгоритмами. Они научили приложение понимать местоположение из текста, определять дубли объявлений, вычислять мошенников и их фейковые предложения, улучшать фотографии и фильтровать квартиры с «бабушкиным» ремонтом.
С помощью TensorFlow 2 Object Detection API мы научим TensorFlow модель находить позиции и габариты строк https:// в изображениях (например в каждом кадре видео из камеры смартфона).
Дослідження від Grammarly доводить, що можна розробити швидшу, простішу й ефективнішу систему GEC — якщо ризикнути піти незвіданим шляхом. Перш ніж іти за трендом (у цьому випадку — GEC на основі NMT), варто запитати себе, чи не спробувати щось кардинально інше. Ви можете зазнати невдачі, але новий шлях може привести до цікавих відкриттів і кращих результатів.
Сергей Брандис, co-founder AI- стартапа и СТО в компании по разработке hardware-устройств, рассказывает о разных подходах к созданию умных систем. Сегодня благодаря доступным библиотекам, понимая подходы и терминологию, можно сделать тестовый AI-проект самостоятельно и ускорить развитие своего бизнеса. Поэтому материал будет полезен проектным менеджерам, продактам, owner’ам и всем, кого интересует внедрение искусственного интеллекта.
Сергей Шельпук — сооснователь и СЕО стартапа DeepTrait. Раньше Сергей строил с нуля и возглавлял Data Science отделы в компаниях SoftServe и Eleks, а также преподавал AI и Machine Learning на факультете прикладных наук в УКУ. Расспросили его подробнее о карьере и развитии в Data Science.
Микола Гашевський, ІТ-консультант та інженер з цифрової трансформації, ділиться досвідом використання штучного інтелекту для поліпшення офісного життя. Головна ідея проєкту — вдосконалити систему контролю доступу в офіс. Тема може бути цікавою для всіх поціновувачів DIY, які хотіли б використовувати штучний інтелект, а саме нейронні мережі, у своїй роботі.
Команда SoftServe Data Science у співпраці з Лабораторією Машинного Навчання Факультету прикладних наук УКУ посіла 3 місце у міжнародному LID Challenge — CVPR Workshop, 2020, задачею якого було розробити новий підхід до попіксельної сегментації об’єктів на зображенні не використовуючи попіксельну розмітку, а лише анотації на рівні всього зображення (звична класифікаційна розмітка).
Коментарі