У новому випуску дайджеста з-поміж інших новин ви довідаєтеся про те, як підійти до пробем NLP, що таке data mesh та як ефективніше використовувати і зберігати метадані.
А також про те, як працювати з геопросторовими даними за допомогою R, як навчити моделі на незбалансованих даних, і про GAN-мережу, що відтворює оточення Grand Theft Auto 5 і в яку можна грати. І ще про багато інших цікавинок — завітайте.
Що таке ROC-крива? Які види ROC-кривих існують і де їх застосовують? Як її використовують у Machine Learning? Спробуємо знайти відповіді в цьому оглядовому матеріалі, що стане в пригоді охочим краще розуміти метрики, важливі для оцінювання ML-моделей.
У цьому випуску ви дізнаєтеся про використання машинного навчання у медицині, та які перешкоди стоять на шляху, безпечний штучний інтелект, MLOps та схожості між широкою та глибокою мережею.
Три експерти зі сфер ML, AI та Data Science — Дмитро Сподарець, Михайло Константінов і Володимир Кириченко — про сучасні проблеми машинного навчання, тенденції розвитку й навіть вигоряння. А ще — поради початківцям та досвідченим спеціалістам.
Подход, помогающий создавать новые технологии в ML, от Алексея Чаплыгина из Reface. Спойлер: чтобы стать ML-исследователем, бессмысленно зубрить пейперы, молиться на мнения экспертов и коллекционировать «бест практисес».
В этой статье — 9 историй от ІТ-специалистов об интересном «железе», которое они сами собирали или улучшали. Кейсы самые разные — от сборки домашнего ПК, станции для машинного обучения до установок для тестирования устройств и embedded AI-системы.
У цьому випуску ви дізнаєтеся про використання теорії гри для масштабного аналізу даних, синтетичні дані для вибору моделі, ймовірнісне програмування для розуміння неточності у передбаченнях моделі, чи може АІ створювати меми, яке майбутнє нас чекає з дешевими deepfakes, AI агент, що грає в CS:GO та купу іншого.
Александр Гончар, ML Director в Neurons Lab, делится книгами, которые он прочел и приобрел в бумажном варианте. Это как критерий «настольности» книги — к ним всегда можно обратиться за советом. В подборке издания о предпринимальстве и менеджменте, машинном обучении и финансовой математике, а также о мотивации и дисциплине.
У цьому випуску ви дізнаєтеся про підходи до open-source ліцензування у ML, АІ що сам пише код, чого не вистачає сучасному дата стеку, аудіо Deepfake, новий MLP-Mixer та купу інших цікавинок.
Свіжа підбірка останніх новин і цікавих матеріалів із data-індустрії. У випуску ви дізнаєтеся про методологію Microsoft в оцінці точності моделей прогнозування, новий підхід до паралелізації потоків даних з високою пропускною здатністю, чи проблема необєктивністі АІ — справді тільки в даних, як можна створити 3D модель об’єкта лише з одного зображення, та як побудувати нейронну мережу у Minecraft.
Написано много замечательных статей об алгоритме Seam Carving («Вырезание швов»), но Алексей Трехлеб не смог устоять перед соблазном самостоятельно исследовать этот элегантный, мощный и в то же время простой алгоритм, и написать о своем личном опыте работы с ним.
И если вы, как и автор, все еще находитесь на пути изучения алгоритмов, то это решение может обогатить ваш личный арсенал DP.
Свіжа добірка матеріалів із Data-індустрії. У цьому випуску ви довідаєтеся про те, як забезпечити якість даних у реальному часі, чи можуть штучно створені дані бути кращими за реальні, якими є останні оновлення платформи GPT-3, та як Google використав ML для тестування комп’ютерної гри на збалансованість.
Підбірка свіжих матеріалів зі світу Data Science за останні два тижні. Як виявити невдачу ML-моделі у виробництві, шлях до Data Mesh, ефективна «культура даних» Uber та багато іншого! Долучайтеся до обговорення і пишіть в коментарях, що ще варто було б додати.
Машинне навчання — штука поширена, доступ до Coursera є в будь-кого, і всі, хто мав бажання піти в Data Scientist’и, вже в них пішли. Про це вже навіть мемів немає: ML давно увійшов у наше життя. Але якщо вважаєте, що вам ML ні на що не здався, ви помиляєтесь, і розробник Андрій Лящук намагається це довести.
Час минає, data-індустрія розвивається, а матеріали з цікавих мені технічних тем, як і раніше, доводиться по крихтах збирати звідусюди. Тож Володимир Кириченко вирішив скласти свої знахідки за останні півтора місяця до структурованого дайджесту та поділитися зі спільнотою.
Эта статья будет полезна руководителям команд тестирования и менеджерам по управлению качеством на проектах, где планируют или уже внедрили ML. Опыт Артема Прищепова, который занимается оптимизацией QA-процессов, может также пригодиться тестировщикам, которые хотят понять принципы тестирования ML в реальной работе.
Ярослава Лочман, випускниця магістерської програми Data Science Українського католицького університету (УКУ), після закінчення навчання стажувалася у Facebook Reality Labs в Pittsburgh. Під час інтернатури провела власне дослідження з автоматичного калібрування камер з wide-angle та fisheye-об’єктивами. В інтерв’ю ДОУ Ярослава розповіла, як проходило стажування, як вона продовжує академічні дослідження з комп’ютерного бачення та чому обирає науку на користь інженерії.
Вероніка Демедецька, Tech Expert & Senior Software Engineer в AMC Bridge, кандидат технічних наук, покроково і з власного досвіду розповідає, як розробити симулятор промислових роботів. Тому, якщо ви працюєте або хотіли б працювати у цій галузі, стаття стане вам у пригоді.
Ян Бутельський, фахівець із NLP, ділиться досвідом розробки діалогових систем, який буде корисний усім, хто вже займається обробкою природної мови або хоче спробувати себе в цій галузі.
Борис Кабаков 7 лет своей жизни посвятил медицине с участием в международных клинических исследованиях и серьезной анестезиологической практикой. Однако после 30 лет, осознав карьерную и финансовую бесперспективность работы, он решил круто изменить свою профессию. Сегодня Борис — Senior Machine Learning Specialist в SoftServe. С читателями DOU он делится трудностями вхождения в отрасль, применением медицинского бэкграунда и размышлениями о будущем украинской медицины.
Коментарі