Big Data/Machine Learning/Data Science Digest #7: ML in Healthcare, Safe AI, MLOps, Wide and Deep Networks

Підписуйтеся на Telegram-канал «DOU #tech», щоб не пропустити нові технічні статті.

Привіт!

Продовжую радувати вас новими підбірками свіжих матерілалів. У цьому випуску ви дізнаєтеся про використання машинного навчання у медицині, та які перешкоди стоять на шляху, безпечний штучний інтелект, MLOps та схожості між широкою та глибокою мережею.

Якщо ви проґавили мій попередній дайджест, його можна переглянути тут. Як завжди, фідбек та коментарі вітаються.

Приємного читання.

Свіжі статті та матеріали

1. Machine learning is booming in medicine. It’s also facing a credibility crisis

Експерти стверджують, що критичні недоліки в методології багатьох робіт з машинного навчання не дозволяють довіряти опублікованим ними заявам.

2. How Airbnb Standardized Metric Computation at Scale

У другій частині цієї серії постів команда Airbnb розглядає основні принципи проектування власної метричної платформи Airbnb під назвою «Minerva». Зокрема, тут розповідається про те, як Airbnb визначає, версифікує і поповнює набори даних, щоб ефективно управляти своїми даними в масштабі. Це корисний пост, в якому міститься багато деталей і обґрунтувань того, чому все працює саме так, як працює.

3. Building Effective Data Science Teams

Незалежно від того, чи ви є першим фахівцем з даними в своїй компанії, чи керуєте командою з сотень людей, створення ефективної команди фахівців з даними залежить не тільки від використовуваних технологій. У цій стенограмі недавньої дискусії лідери в галузі науки про дані з різних організацій діляться своїми міркуваннями.

4. Dynamic scientific visualizations in the browser for Python users

Вони можуть бути дуже ефективними, але якщо ви не є фахівцем в області веб-технологій, створення динамічних візуалізацій в Інтернеті може виявитися складним завданням. У цьому гіді Патрік Міно показує різні фреймворки для веб-візуалізації, починаючи з якомога більш низького бар’єру для входу. Гід написано з точки зору користувача Python, але здебільшого Python не потрібен.

5. We need to design distrust into AI systems to make them safer

Аянна Говард, відомий робототехнік каже, що наша віра в автоматизовані системи надмірна і може призвести до небезпечних наслідків. Рішення може полягати в активному впровадженні недовіри в систему, щоб зробити її більш безпечною.

6. Deepfake Maps Could Really Mess With Your Sense of the World

Дослідники застосували методи штучного інтелекту, щоб зробити деякі райони Сіетла більш схожими на Пекін. У статті докладно розглядається, як такі зображення можуть вводити в оману уряду або поширювати дезінформацію в Інтернеті.

7. What I’ve learned about MLOps from speaking with 100+ ML practitioners

Що стоїть за надто гучною заявою «90/87/85% моделей машинного навчання ніколи не доходять до виробництва» і яке відношення це має до MLOps? У статті показано основні висновки зі звіту про повсякденні проблеми MLOps.

8. Do Wide and Deep Networks Learn the Same Things?

Нове дослідження від Google, в якому провели систематичне вивчення подібності між широкими і глибокими мережами одного архітектурного сімейства через призму їх прихованих уявлень і кінцевих результатів.

9. PyTorch builds the future of AI and machine learning at Facebook

Щоб постійно вдосконалювати свої механізми AI, Facebook оголосив про переведення всіх своїх систем AI на PyTorch.

10. Session-Based Recommender Systems

Сесійно-основані рекомендаційні системи надають рекомендації, засновані винятково на взаємодії користувача протягом однієї сесії. Це корисно, оскільки не вимагає історії переваг користувача. Це введення показує, як працюють ці алгоритми, як їх оцінювати і що потрібно враховувати, якщо ви створюєте свій власний.



Що нового у наукових працях

1. Comparing Test Sets with Item Response Theory

2. An Attention Free Transformer

3. Drawing Multiple Augmentation Samples Per ImageDuring Training Efficiently Decreases Test Error

4. On the Bias Against Inductive Biases

5. Cross-validation: what does it estimate and how well does it do it?

Що послухати

1. Detecting Drift | Data Skeptic

Сем Акерман, дослідник даних в IBM Research Labs в Хайфі, Ізраїль, розповідає про свою роботу «Detection of Data Drift and Outliers Affecting Machine Learning Model Performance Over Time.»

2. The Inner Alignment Problem | TowardsDataScience

Як ви можете знати, що надзвичайно розумна система АІ намагається зробити саме те, про що ви його просили? У цьому епізоді Еван Хубінгер розповідає про створення безпечних і чесних АІ систем.

3. Exploring The Patterns And Practices For Deep Learning With Andrew Ferlitsch | Python Podcast

У цьому епізоді Ендрю Ферліч ділиться своїми глибокими знаннями і великим досвідом у створенні та тренуванні машинного навчання в багатьох компаніях і галузях. Це захоплююча та пізнавальна бесіда про те, як створювати підтримувані моделі для різних додатків.

4. Build Your Analytics With A Collaborative And Expressive SQL IDE Using Querybook | Data Engineering Podcast

Розчаровані відсутністю сучасної IDE і спільного робочого процесу для управління SQL-запитами і аналізом своїх великих даних, команда Pinterest створила Querybook. У цьому епізоді Джастін Мехорада-П’єр і Чарлі Гу розповідають про те, як первісний прототип каталогу даних перетворився в один з найбільш широко використовуваних інтерфейсів для роботи з аналітичними даними.

5. Learning to learn deep learning | Practical AI

Дізнавайтеся про нові цікаві розробки в галузі АІ, включаючи wav2vec-u (модель розпізнавання мови без спостереження) і мета-навчання (нова книга «How To Learn Deep Learning And Thrive In The Digital World»). В ході дискусії також зачіпаються питання інженерних навичок для розробників АІ та стратегії запуску ініціатив в області АІ в уже існуючих компаніях.

6. How to Thrive as an Early-Career Data Scientist | SuperDataScience

У цьому епізоді ви дізнаєтеся про варіанти початку кар’єри data science з нуля в програмуванні, переваги ступенів CS, програмному забезпеченні і інструментах, необхідних для початку роботи, потужних графових згортальних мережах, терапії на основі РНК і багато іншого!

7. Methodology & Functionality in Differing Data Science Roles | The Banana Data Podcast

Емма Ірвін обговорює різні методології і функціональні можливості в області науки про дані і свою роль інженера за рішеннями в Dataiku.




Що подивитися

1. High-Resolution Photorealistic Image Translation in Real-Time

Застосуйте будь-який стиль до зображення 4K в режимі реального часу за допомогою нового підходу, заснованого на машинному навчанні.

2. Predicting Stock Prices and Making $$$ Using the ARMA Model

Як використовувати модель ARMA для моделювання покупки і продажу акцій.

3. Decision Transformer: Reinforcement Learning via Sequence Modeling (Research Paper Explained)

Правильний розподіл кредитів протягом тривалого часу є фундаментальною проблемою в навчанні з підкріпленням. В обговорюваній статті автономне навчання з підкріпленням розглядається як чиста проблема моделювання послідовностей, при цьому дії вибираються на основі даної історії і бажаного майбутнього винагороди.

4. AI Fixes The Horrendous CR7 Statue

У Кріштіану Роналду була сумнозвісна статуя, яка потрапила в усі новини. У цьому відео ви познайомитеся з сучасним штучним інтелектом для передачі стилю особи під назвою FaceBlit, який може створювати в реальному часі деякі дійсно вражаючі речі.

5. Generative Python Transformer p.6 — Testing larger model

Трансформери глибоко розуміють мову та контекст. Чи можемо ми використовувати їх для написання коду Python? Нове відео у серії роликів присвячених саме цьому яке фокусується на тестуванні моделі. Раджу також переглянути минулі частини звичайно.

Дякую за увагу! Щоб не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом.

Якщо ви бажаєте працювати у колі однодумців над складними data-centric проектами — приєднуйтесь до команди Xenoss! Серед наших найгарячіших вакансій:

Стежити за новинами Xenoss можна у соц-мережах — LinkedIn та Facebook.

👍НравитсяПонравилось2
В избранноеВ избранном2
LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Подписаться на комментарии