Найцікавіші новини за останній час зі світу AI, ML та Data Science у дайджесті Вови Кириченка, CTO в Xenoss.
Ви дізнаєтеся все, що ви хотіли знати про графові нейронні мережі, як побудувати просту ANN з нуля, AI/ML в ігровій індустрії, поточний стан креативної автоматизації, баг-баунті від Twitter та багато іншого. Налітай!
Новий випуск дайджесту від Вови Кириченка, CTO в Xenoss, у якому зібрано найцікавіше зі світу data science за останній час.
У ньому ви дізнаєтеся про системи машинного навчання, те, чи варто переосмислити встановлений підхід до NLP, про масштабування АІ для бізнесу, маркування даних, адаптивні алгоритми ML та багато іншого. Приємного читання!
Свіжі новини та цікавинки зі світу Data Science та AI!
Вова Кириченко, CTO в Xenoss.io, пропонує розглянути, як мовні моделі розуміють світ, що такого поганого в Julia, що робити з брудними даними, нащо потрібен SQL та багато іншого.
Spark — один із найпопулярніших фреймворків для обробки великих масивів даних (Big Data). Він має складну структуру, тож якщо у роботі спливають проблеми, вони часто комплексні.
У статті Дмитро Лазаренко розбирає основи Spark та підводні камені роботи з ним. Цей базис може допомогти уникнути багатьох проблем у написанні архітектури програми.
У цьому випуску ви дізнаєтеся про новий підхід до побудови data-інфраструктури, проблематику SQL і що з цим робити, АІ та CLIP, упередження в системах АІ... а також як Tesla використовує камери для побудови АІ-систем для самокеруючих машин, глибоке навчання з синтетичними даними, як використовують машинне навчання у кібербезпеці і багато інших цікавинок.
У новому випуску дайджеста з-поміж інших новин ви довідаєтеся про те, як підійти до пробем NLP, що таке data mesh та як ефективніше використовувати і зберігати метадані.
А також про те, як працювати з геопросторовими даними за допомогою R, як навчити моделі на незбалансованих даних, і про GAN-мережу, що відтворює оточення Grand Theft Auto 5 і в яку можна грати. І ще про багато інших цікавинок — завітайте.
У цьому випуску ви дізнаєтеся про використання машинного навчання у медицині, та які перешкоди стоять на шляху, безпечний штучний інтелект, MLOps та схожості між широкою та глибокою мережею.
У цьому випуску ви дізнаєтеся про використання теорії гри для масштабного аналізу даних, синтетичні дані для вибору моделі, ймовірнісне програмування для розуміння неточності у передбаченнях моделі, чи може АІ створювати меми, яке майбутнє нас чекає з дешевими deepfakes, AI агент, що грає в CS:GO та купу іншого.
У цьому випуску ви дізнаєтеся про підходи до open-source ліцензування у ML, АІ що сам пише код, чого не вистачає сучасному дата стеку, аудіо Deepfake, новий MLP-Mixer та купу інших цікавинок.
Свіжа підбірка останніх новин і цікавих матеріалів із data-індустрії. У випуску ви дізнаєтеся про методологію Microsoft в оцінці точності моделей прогнозування, новий підхід до паралелізації потоків даних з високою пропускною здатністю, чи проблема необєктивністі АІ — справді тільки в даних, як можна створити 3D модель об’єкта лише з одного зображення, та як побудувати нейронну мережу у Minecraft.
Андрей Старжинский и Ярослав Недашковский — об опыте в проектировании и разработке системы автоматического анализа данных с промышленного оборудования, позволяющей масштабироваться до десятков тысяч моделей.
Свіжа добірка матеріалів із Data-індустрії. У цьому випуску ви довідаєтеся про те, як забезпечити якість даних у реальному часі, чи можуть штучно створені дані бути кращими за реальні, якими є останні оновлення платформи GPT-3, та як Google використав ML для тестування комп’ютерної гри на збалансованість.
Підбірка свіжих матеріалів зі світу Data Science за останні два тижні. Як виявити невдачу ML-моделі у виробництві, шлях до Data Mesh, ефективна «культура даних» Uber та багато іншого! Долучайтеся до обговорення і пишіть в коментарях, що ще варто було б додати.
Час минає, data-індустрія розвивається, а матеріали з цікавих мені технічних тем, як і раніше, доводиться по крихтах збирати звідусюди. Тож Володимир Кириченко вирішив скласти свої знахідки за останні півтора місяця до структурованого дайджесту та поділитися зі спільнотою.
Сфера Big Data Engineering відносно молода, однак її цілком можна розглядати як шлях професійного розвитку. У цій статті спробуємо розібратись, у чому суть професії Big Data Engineer, її плюси та мінуси та шляхи опанування.
Руководство по тестированию приложений big data: как выглядят такие проекты, какие подходы и виды тестирования использовать, и даже как это все автоматизировать. Дмитрий Собко, Automation Lead, уверен, что big data — это та область, которая почти наверняка будет развиваться, и узкоспециализированные технологии будут быстро и активно совершенствоваться.
Розглянемо питання, які постають на етапі побудови архітектури, проблеми в безпеці IoT-платформ, яке програмне забезпечення краще використовувати і проблеми оптимізації Big Data.
Всем привет, меня зовут Дмитрий Собко, и мне хотелось бы поделиться с вами своим недавним опытом прохождения сертификации GCP (Google Cloud Platform) Professional Data Engineer. Сертификат подтверждает навыки проектирования систем обработки данных и создания базовых ML моделей на Google Cloud Platform стеке.
В выпуске: статьи, новости и тренды Big Data, инструменты визуализации, люди и образование. Wolfram, D3.js, русскоязычная поддержка Wolfram Mathematica, серия онлайн‑брейнвошингов по визуализации от Лаборатории данных и другое.
Визуальная информация лучше воспринимается и позволяет быстро и эффективно донести до зрителя мысли и идеи. Физиологически восприятие такой информации является основной для человека.
Коментарі