Володимир Кириченко не міг залишити вас без новин зі світу Data Science, тож ловіть 27-й випуск дайджесту, який зібрав у собі найкращі подкасти, відео, статті та матеріали про всі знахідки та інноваційні досягнення останнього місяця з використанням AI/ML/Big Data.
Як тренувати рекомендаційні системи так, щоб вони не радили дітям контент 18+, а фанатам документалок продовжували показувати документалки. В статті є практичні поради, як виправляти рекомендаційну систему за допомогою різних методів обробки даних.
Говоримо про роботу з ML-моделлю, тренування її та пошук інформації. Зі статті можна дізнатися про цикл життя даних на трьох реальних прикладах опрацювання тексту українською мовою. Також розбираємося, як можна покращити якість ML-моделі та її результатів.
Ян Бутельський продовжує серію публікацій про NLP в контексті розробки діалогової системи. У статті описує власний досвід роботи з NLU-модулем та детально аналізує наявні Python бібліотеки (SPACY, STANZA, FLAIR) для якісної та швидкої розробки NLU-модуля.
У Microsoft повідомили, що більше не продаватимуть технології, які мають визначати стать, вік та емоції людини. Компанія пішла на цей крок зокрема через критику низки науковців та активістів, які стверджували, що таке програмне забезпечення може бути «упередженим і ненадійним».
Максим Бочок, Senior Data Scientist, показує як швидко розробити прототип моделі машинного навчання для сервісу продажу авто
Сучасні закони не дозволяють безконтрольний збір інформації, в той час, як ІТ-індустрія постійно впроваджує нові й нові методи обробки даних. Як розробляти AI-продукти так, щоб не отримати мільйонний штраф — пропонуємо юридичний аналіз справи Clearview AI у Великобританії.
Що сталося у світі AI минулого місяця? Поговоримо про DALL·E mini як альтернативу DALL·E з відкритим кодом, штучний інтелект для виявлення зброї та потенційних стрільців, як працює технологія Neural Voice Camouflage, що за нова модель від DeepMind під назвою Gato та багато іншого.
Інженер Google вважає, що AI-система чат-ботів, над якою він працював з осені 2021-го, здатна мислити, висловлювати власну думку й почуття, як семирічна дитина. Компанія вивчила докази співробітника та вирішила відсторонити його від роботи за порушення конфіденційності. DOU розповідає деталі та публікує розмову інженера з AI.
У машинному навчанні, як і в будь-якому іншому процесі, головне — це розуміння всього, що відбувається. Як занурюватись у цю галузь, з чого починати і де шукати інформацію — радить учасник нашої спільноти, CIO AI HOUSE Богдан Питайчук.
R для візуалізації даних, новий чіп Nvidia, законопроєкт про ШІ, машинне навчання для сільського господарства — що ще ви пропустили? Зазирайте в дайджест, щоб бути в курсі новинок зі світу AI.
У черговому дайджесті — як, використовуючи ШІ, Пентагону вдається генерувати корисну розвідку на полі бою; мовна модель Pathways Language Model від Google, що важить 540 мільярдів параметрів; технологія НЛП, що полегшила доступ та синтез досліджень COVID-19 та багато іншого.
У дайджесті — висновки нещодавно опублікованого Індексу штучного інтелекту за 2022 рік; ефективні стратегії зниження етичних ризиків у сфері штучного інтелекту; використання Clearview AI у війні України та росії та багато іншого.
У свіжому випуску: про нову масивну мовну модель для генерації коду — AlphaCode; чи зможе ШІ повністю автоматизувати розшифровку стародавньої невідомої мови; що буде, якщо штучний інтелект підживити мемними заголовками BuzzFeed; як і для чого Uber використовує Deep Learning та багато іншого.
Розробка ML-моделей — це процес, який містить кілька компонентів: від роботи з даними та експериментів, до моніторингу та повернення до одного з попередніх кроків. У матеріалі розберемо високорівневу структуру цього процесу. Стаття буде цікавою Data Scientists, Junior або Middle ML-розробникам, що прагнуть навчитися впроваджувати й розширювати ML-моделі у продакшні та стати Full-Stack Data Scientists.
У цьому випуску ML-дайджеста дізнаємось, як TinyML впроваджує нейронні мережі до мікроконтролерів, які винаходи штучного інтелекту представив Google на останній конференції I/O, як BioNTech та London A.I. створили «систему раннього попередження» про штами COVID-19 і багато іншого.
Curiosio працює на базі Ingeenee — машині штучного інтелекту, що знаходить унікальний розв’язок з-поміж нескінченних варіантів. Ingeenee працює на основі високопродуктивних обчислень (HPC). Для високопродуктивних обчислень потрібна електроенергія. Електроенергія дорога. Arm-процесори — енергоефективні. Отож ми провели оцінку цілком нового серверного Arm-процесора Ampere Altra від компанії Ampere Computing. Результати — у статті.
Коли справа стосується Machine Learning, точність результатів моделі повинна максимально задовольняти очікування користувачів і дозволяти бізнесу здобувати вигоду. Щоб це сталося, observability має бути на висоті. Команда Operational Intelligence з EPAM Systems ділиться лайфхаками для ефективного моніторингу ML-моделей, підводними каменями, які часто зустрічають MLOps-інженери та (не)найкращими практиками для моніторингу моделей у продакшн-середовищі.
Як з нуля, не маючи досвіду в Machine Learning, навчитися основам Reinforcement Learning?
Ростислав Мироненко, Solution Architect в EPAM, розповідає про основи «навчання з підкріпленням» — типу машинного навчання, що фокусується на автономному прийнятті рішень (виконанні дій) моделлю при взаємодії з певним середовищем.
За вікном та на календарі вже 2022 рік, а ми не знижуємо темпи, продовжуючи разом занурюватись у новини, апдейти та останні тренди зі світів Data Science, Machine Learning та Artificial Intelligence.
Коментарі