Big Data, Machine Learning, Data Science Digest #33: Google анонсував Bard, DeepL залучає $100M, GraphCast від DeepMind, модель глибинного навчання Sybil
Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!
Привіт!
З вами Вова Кириченко і найновіший випуск Big Data, ML&Data Science Digest. Продовжую робити свою справу та ділитися з вами цікавинками з індустрії AI/ML.
Сьогодні маємо уже тридцять третій випуск апдейтів, які трапилися зі світом Data Science в останні декілька тижнів. Сподіваюсь, буде цікаво та корисно!
А конкретніше, у цьому випуску ви дізнаєтесь про таке:
- анонс конкурента ChatGPT — сервісу Bard від Google;
- як Україна використовує Clearview AI у війні з росією;
- сервіс нейронного машинного перекладу DeepL залучив $100M фінансування;
- що відбуватиметься з напрямком data science у цьому році й які тенденції варто очікувати;
- модель глибинного навчання Sybil від MIT, та як вона допоможе передбачати рак легень;
- та за доброю традицією — підбірка корисних і інформативних відео та подкастів.
Якщо ви проґавили мій попередній великий річний дайджест — не проблема, його можна переглянути ось тут. Як завжди, фідбек та коментарі вітаються.
Статті про AI/ML
Ukraine will continue to use Clearview AI with their continued support in our war against Russia
Україна й надалі користуватиметься системою розпізнавання облич Clearview AI. Про це домовився міністр цифрової трансформації Михайло Федоров з Хоаном Тон-Тхатом — головним виконавчим директором компанії. Нагадаємо: на початку повномасштабної війни Хоан запропонував Києву свою розробку, і відтоді її активно застосовують для ідентифікації російських військових злочинців та безпеки блокпостів і пропускних пунктів.
Лабораторія штучного інтелекту OpenAI запускає пілотну преміумверсію свого чат-бота. Передплатники матимуть постійний доступ до сервісу (включно з піковими годинами), отримуватимуть швидші відповіді, а також будуть першими, перед ким відкриватимуться нові функції та покращення. Спочатку підписатися на ChatGPT Plus зможуть лише користувачі зі Сполучених Штатів, проте компанія планує охопити згодом й інші країни.
Apple Books quietly launches AI-narrated audiobooks
В Apple Books зʼявилися аудіокниги, озвучені штучним інтелектом за технологією text-to-speech. Описуючи цю нову функцію, Apple виступає за загальну можливість створювати аудіокниги і за зменшення коштів, що їх витрачають автори та паблішери. Наразі послухати «штучно озвучені» книги можна тільки англійською мовою, і поки що йдеться лише про художні твори, однак нехудожня література також буде доступна.
Adobe, facing blowback, says customer data not used to train AI
Скотт Белскі — chief product officer в Adobe — спростував твердження, буцімто компанія використовує проєкти юзерів навіть для того, щоб навчати власні моделі генеративного штучного інтелекту. Цьому передував скандал навколо дата-політики Adobe, а саме — опційного аналізу користувацького контенту для поліпшення продуктів та сервісів. Cкотт визнав те непорозуміння «тривожним дзвінком» і заявив, що умови будуть конкретизовані.
OpenAI, Georgetown, Stanford study finds LLMs can boost public opinion manipulation
Науковці зі Стенфорду, Джорджтаунського університету та OpenAI дослідили, як великі мовні моделі можуть допомагати пропагандистам у маніпуляціях з громадською думкою, що відбуватиметься завдяки онлайн-контенту. Якщо коротко, то ці технології здатні підсилити операції з політичного впливу. Запорукою цього виступає масштабне створення контенту, нижчі витрати на оплату праці й більші складнощі в ідентифікації бот-активності.
DeepL, the AI-based language translator, raises over $100M at a $1B+ valuation
DeepL — сервіс нейронного машинного перекладу, який базується в Німеччині. Стартап конкурує з гігантами, як-от Google та Bing, а нещодавно він отримав понад $100 млн у процесі фандрейзингу — будучи оціненим у більш ніж $1 млрд. Згідно з джерелами, цифра ґрунтується на сумі регулярного річного доходу, збільшеній удвадцятеро, — що свідчить про зростання компанії, її беззбитковість та рух у сторону рентабельності.
Anthropic’s Claude improves on ChatGPT but still suffers from limitations
Два роки тому Даріо Амодей, колишній віцепрезидент з дослідництва в OpenAI, запустив власний AI-стартап Anthropic. Тепер же в арсеналі цієї компанії — потенційний конкурент ChatGPT під назвою Claude, доступний поки що в бета-версії. Внаслідок тестувань нової розробки були виявлені як недоліки (наприклад, математичні помилки), так і успіхи — скажімо, Claude спромігся скласти університетський іспит з права та економіки.
Tipping point: Nvidia Drive scales AI-powered transportation at CES 2023
Foxconn приєдналася до екосистеми Nvidia Drive. Тепер компанія вироблятиме електромобілі на платформі Nvidia Drive Hyperion. Також серед намірів міжнародного техгіганта — електронні пристрої керування на базі однокристальних систем Nvidia Drive Orin, які вже були реалізовані в практичних спортивних автомобілях Polestar 3 і Volvo EX90, представлених під час Міжнародної виставки споживчої електроніки в січні.
Google announces ChatGPT rival Bard, with wider availability in «coming weeks»
CEO компанії Google Сундар Пічаї анонсував проєкт, який складе конкуренцію ChatGPT. Bard — експериментальний розмовний сервіс на базі LaMDA, і спочатку він доступний лише для окремої когорти тестувальників, а широкому колу користувачів нададуть таку можливість у найближчі тижні. За словами Сундара, Bard генеруватиме «свіжі» відповіді, що натякає на вирішену проблему з актуальністю, яка досі присутня в чат-боті від OpenAI.
Google shares lose $100 billion after company’s AI chatbot makes an error during demo
Оприлюднивши у твіттері демо-GIF про свій новий продукт, Google відразу ж зазнав фіаско. Bard отримав запитання: «Про які нові відкриття космічного телескопа Дж. Вебба я можу розповісти своїй
Наукові видання
Real-time detection of robotic traffic in online advertising
Ананд Муралідхар та низка інших дослідників з Amazon діляться важливими висновками за результатами проєкту SLIDR (Slice-Level Detection of Robots). Мова йде про модель глибинної нейронної мережі, задеплоєну ще у 2021 році. Вона допомагає боротися проти роботизованого трафіку під час рекламних кампаній на Amazon, виявляючи недійсні кліки по оголошеннях, розміщених на сайті електронної комерції, у реальному часі.
DeepMind and Google introduce GraphCast: A fast and scalable machine learning weather simulator
Google і DeepMind презентують GraphCast — симулятор прогнозу погоди, який працює на основі машинного навчання. За його допомогою можна зробити передбачення на 10 днів усього в межах однієї хвилини. Навіть у порівнянні з новітніми стандартами, що базуються на машинному навчанні, й найточнішою у світі детермінованою оперативною системою середньострокового прогнозування погоди, — GraphCast посідає перше місце.
MIT & Mass General Hospital have developed an AI system that can detect lung cancer
Массачусетський технологічний інститут спільно з Mass General Hospital розробили модель глибинного навчання Sybil. Вона здатна передбачати ризик раку легень завдяки одній лише компʼютерній томограмі — поза межами вже розпізнаваних ознак, як-от солітарні легеневі вузли. А втім, дослідники визнають: потрібно виконати великий обсяг робіт, щоб зрозуміти, як саме застосовувати цю технологію в реальних клінічних умовах.
Teaching speech recognizers new words — without retraining
Сакет Дінґліваль, Моніка Сункара та їхні колеги спробували вирішити одну з проблем CTC-моделей автоматичного розпізнавання мовлення — а саме пристосувати їх до рідкісної та незвичної лексики. Повторне навчання за допомогою нових наборів даних було б непомірно часозатратним та обчислювально інтенсивним завданням. Тому вчені пропонують ефективніший спосіб, який базується на використанні списків слів.
Компанія OpenAI провела спільні студії зі Стенфордською інтернет-обсерваторією і Центром безпеки та перспективних технологій при Джорджтаунському університеті. Фокусом цієї співпраці стало зловживання великими мовними моделями в цілях дезінформації. Дослідники зʼясували, які загрози для інфосередовища становлять мовні моделі, а також визначили, які кроки можна здійснити, щоб зменшити цей ризик.
Подкасти
ChatGPT and how generative AI is augmenting workflows
Скотт Даунс — технічний директор у компанії Invisible Technologies — розповість, як генеративний штучний інтелект доповнює робочі процеси. Також ітиметься про варіанти використання GPT-3 в роботі з текстом, масштабування процесів у компаніях і не тільки. Зокрема, ви довідаєтеся, наскільки корисна ця мовна модель для каталогізації та управління запасами — важливих операцій в охороні здоровʼя та ресторанному бізнесі.
Advancing AI adoption with Dânia Meira
Данія Мейра працює в галузі data science більш ніж 10 років, а до того ж має досвід роботи над машинним навчанням для передбачувальної аналітики в стартап-компаніях. Отже, в цьому випуску вас чекає історія заснування AI Guild — спільноти фахівців, що впроваджують штучний інтелект; обговорення ініціативи #datalift, зосередженої на обміні знань з аналітики даних і машинного навчання; та інші професійні інсайти з перших уст.
Data trends & predictions for 2023
Що відбуватиметься з data science у новонасталому році та які тенденції можна виділити? На цю тему поговорять фундатори навчальної платформи DataCamp Йонатан Корнеліссен і Мартейн Тевіссен. Вони спробують не лише спрогнозувати подальший розвиток дата-індустрії, але й окреслити напрямки, в яких уже сьогодні рухається галузь. Бесіда не омине й згадки про відповідні навички, фахові інструменти і роботу в цій сфері.
Sequoia Capitalʼs Pat Grady and Sonya Huang on generative AI
На розмову про генеративний штучний інтелект завітали Пет Ґрейді та Соня Хуан — партнери Sequoia Capital, каліфорнійської компанії з управління венчурним капіталом. Гості подкасту розуміють можливості генеративного штучного інтелекту, як-от креативність чи експресія, а також повʼязані виклики та етичні міркування. І щонайголовніше — Пет і Соня розкажуть про власне есе під назвою «Generative AI: A creative new world».
A skeptical take on the AI revolution
Ґері Маркус — експерт зі штучного інтелекту, засновник компаній у цій галузі й заслужений професор психології та нейронауки Нью-Йоркського університету. Під час своєї участі в «Шоу Езри Кляйн» він висловив скептичний погляд на сучасні дослідження штучного інтелекту загалом та ChatGPT зокрема. На його думку, відсутність механізмів для перевірки інформації уможливлює генерацію фейків у безпрецедентних масштабах.
A history of ML and how low code tooling accelerates solution development
Своїми знаннями поділилася і Розарія Сіліпо, яка очолює популяризацію data science у компанії KNIME. Разом із ведучим подкасту Беном Вілсоном вона розглянула переваги низькокодового машинного навчання, занурилася в історію ринку праці у сфері розробки моделей машинного навчання, виокремила зміни, які відбулися в останні десятиріччя, а також оповіла декілька історій про важливість простоти в реалізації рішень.
Відео
Will artificial intelligence take away developer jobs?
Тім Корі — розробник програмного забезпечення, викладач програмування та ведучий девелоперського подкасту — адресує актуальні питання, що побутують в IT-спільноті. Чи замінить програмістів штучний інтелект? Правда, що девелопери залишаться без роботи через дедалі більший розвиток інтелектуальних систем? Як штучний інтелект і машинне навчання позначаться на кількості розробників? Дізнайтеся відповіді в цьому відео.
Get rich in the AI revolution (2023)
Підприємець та відеоблогер Алекс Гормозі вважає, що у винятковій популярності ChatGPT може ховатися відповідь на питання, як саме влаштований капіталізм і що він означає для нас як індивідів. Також Алекс виділяє 5 основних аспектів життя, які зазнають докорінних змін під впливом штучного інтелекту: специфіка роботи як явища, функціонування бізнесу, економіка в її загальному вигляді, романтика та сутність життя в біологічному розумінні.
Data visibility & control | BigID co-founder & CEO Dimitri Sirota
Цього разу в гості до Метта Турка навідався Димитрій Сирота — співзасновник і головний виконавчий директор B2B-компанії BigID, що спеціалізується на безпеці й конфіденційності даних та управлінні ними. В ході інтервʼю Димитрій розкриє тему видимості та контролю даних, відповість про їх юридичне регулювання, опише продукти й технології BigID, поділиться історією розвитку свого бізнесу і дасть настанови з огляду на власний досвід.
9 new AI tools that will blow your mind (must see)
Надихнувшись повселюдним ажіотажем навколо ChatGPT, ютубер Ліам Джеймс Кей склав власну добірку інструментів, які також працюють на основі штучного інтелекту і є не менш прогресивними, аніж вищезгаданий славнозвісний винахід. Програмне забезпечення, застосунки та вебсайти, які перелічує Ліам, допомагають користувачам підвищувати продуктивність, заробляти кошти в онлайні, творити мистецтво і навіть більше.
Generating music with AI! (MusicLM explained)
Луї Бушар відкриє для своїх глядачів новинку зі світу штучного інтелекту — MusicLM. Чергове напрацювання фахівців з компанії Google дозволяє створювати Hi-Fi музику за допомогою текстових описів, наприклад «заспокійлива мелодія скрипки, у супроводі викривленого гітарного рифу», і експерименти вже доводять його переваги. Луї ж вирішив пізнати принцип роботи цієї моделі й ознайомити підписників зі своїми роздобутками.
***
Друзі, на сьогодні це все!
Дякую вам за ознайомлення з дайджестом. Щоб не втрачати зв’язок та не пропустити мій наступний дайджест, клікайте «Підписатися на автора» одразу під текстом
Нагадую, що у повсякденному житті я обіймаю посаду CTO у компанії Xenoss, де ми з командою реалізовуємо різноманітні цікаві й складні речі. І нещодавно наша компанія увійшла в ТОП кращих ІТ-роботодавців України згідно з щорічним рейтингом DOU.
Ми працюємо з високонавантаженими системами та вирішуємо проблеми, що пов’язані з інтенсивною обробкою даних. Реалізація цих проектів вимагає унікального технічного світогляду, який трапляється в одного серед ста інженерів. Розуміючи це, ми адаптували remote-first філософію керування членами команд, які перебувають на трьох континентах. Як результат, у нас є колеги з 14 країн світу, здатні ефективно справлятися з дедалі більшою складністю домену AdTech/MarTech.
Якщо ви в пошуках нових кар’єрних можливостей, запрошую переглянути наші актуальні вакансії. А найактуальніші новини від Xenoss ви завжди можете дзінаватись підписавшись на наші соцмережі: LinkedIn та Facebook.
Ваші лайки, поширення і коментарі до дайджесту додають наснаги творити далі, тому лайк, шер та коментар — ваш спосіб надихнути мене на нові випуски дайджесту! :)
До нових випусків!
Слава Україні!
Немає коментарів
Додати коментар Підписатись на коментаріВідписатись від коментарів