Final countdown. DevOps Stage 2018. Book your ticket today.
×Закрыть

Data Science for Business: 150 успішних кейсів використання науки про дані в Україні та світі

Протягом 150 днів від сьогодні ми публікуватимемо 150 data science випадків використання даних у всьому світі.

Отже, № 1/150 Політика — Президентська компанія Барака Обами 2012 року, США

Мета: вибрати канали комунікації — на кого з виборців який канал найкраще вплине голосувати «ЗА», а також яких виборців підштовхне голосувати за іншого кандидата.

Результат: таргетована аудиторія та перемога на виборах.

Більше інформації — www.facebook.com/DSMLAIUA та телеграм — t.me/dsmlai_ua

LinkedIn
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Допустимые теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

71/150 — Бізнес(вікторини) — Використання DS для перемоги у Вікторині або як правильно використовувати дані

Мета: перемога у вікторині

Результат: побудова алгоритму, що прогнозує, на які питання ігорк надасть неправильну відповідь

Використовуючи самостійно розроблено програму розпізнавання патернів, щоб зосередити свої дослідження на найбільш поширених темах, Крейг виграв шість ігор, а також турнір чемпіонів, і найбільшу суму, виграну в одній грі.

Читати більше — www.theverge.com/...​raig-jeopardy-data-mining

70/150 — Наука (медицина) — Використання інструментів DS для аналізу ДНК

Мета: побудова алгоритму для передбачення можливої схильності до захворювання на рак, діабет та інші захворювання

Результат: у процесі розробки

Описуючи зміни в ДНК в 6,6 мільйонів місць в гені людини, дослідники Інституту Великої Британії та Гарвардського університету змогли виявити більшу кількість людей, які перебувають у групі ризику, ніж звичайні генетичні тести, що враховують інформацію про дуже мало генів.

На даний час дослідники створюють веб-сайт, який дозволить будь-кому завантажувати генетичні дані проаналізовані компанією, наприклад, 23andMe або Ancestry.com. Користувачі отримають оцінки ризику для серцевих захворювань, раку молочної залози, діабету 2 типу, хронічного запального захворювання кишечника та фібриляції передсердь.

Читати більше — www.nytimes.com/...​smid=fb-nytimes&smtyp=cur

69/150 — Громадський сектор (пожертви) — Використання DS для таргетування реклами

Мета: залучення цільової аудиторії для внесення пожертв на громадську діяльність

Результат: отримання на 0,5 млн доларів США більше, озопивше лише 10% членів організації

The Nature Conservancy («TNC») є найбільшою екологічною неприбутковою організацією в світі, яка хоче «зберегти рослини, тварини та природні спільноти, які представляють різноманітність життя на Землі, захищаючи землі та води». TNC здатний фінансувати свою місію в першу чергу за рахунок залучення коштів, з яких вона залучає близько п’ятисот мільйонів доларів на рік у своїх 3 мільйонів членів.

Дивитись презентацію — www.lexjansen.com/...​nesug/nesug09/sa/SA09.pdf

68/150 — Право (вирішення спорів) — Використання DS для передбачення результату розв’язання правового спору або як повільно зникатиме юридична професія?

Мета: перемога у конкурсі з вирішення спорів
Результат: точність людей 62.3%, алгоритму — 86.6 %

Протягом жовтня 112 юристів попередньо зареєструвалися для участі у адвокатському конкурсі, який проходив з 20 по 27 жовтня. Їм було представлено реальні юридичні спори та запропоновано прогнозувати «так чи ні» щодо того, чи зможе фінансовий омбудсмен перемогти. Ті ж справи були надані CaseCrunch: той, хто мав найвищу точність, виграв. 775 прогнозів були представлені учасниками.

Читати більше — www.artificiallawyer.com/...​unch-prediction-showdown

67/150 -Бізнес (гарантійне обслуговування) — Використання DS для виявлення підроблених гарантійних претензій

Мета: зменшити видатки на обслуговування підробок
Результат: економія близько 66 млн дол США за 5 років роботи алгоритму

• У 2000 році Price Waterhouse Coopers оцінила, що зловживання правами, пов’язаними з гарантійним обслуговуванням, витрачає мільярди доларів США щороку
• 2003 р. HP розробив стратегію зменшення зловживання правами, пов’язаними з гарантійним обслуговуванням. Основною частиною стратегії була активна програма розпізнавання шахрайства, яка передбачала вилучення даних
• 2004 рік Проведено історичний огляд випадків гарантійного шахрайства, в якому були визначені загальні методи роботи, які використовувались для шахрайства з НР
• Виявлено джерела даних, які мають інформацію, яка використовується шахрайською стороною для здійснення шахрайства.

Дивитись презентацію — rexeranalytics.com/...​CFE_Presentation_Dist.pdf

66/150 — Бізнес (поштові послуги) — Використання DS поштовим оператором США US Postal Service

Мета: оптимізація бізнес-процесів (зокрема доставка кореспонденції)

Результат: впровадження алгоритму аналізу даних у режимі реального часу

Відповідно до прикладу, опублікованого на веб-сайті Kinectica, система надає USPS (поштовому оператору) детальний геопросторовий вигляд операцій, що дає змогу посилити його функціонування кількома способами, зокрема:

— надання диспетчерам можливості ефективно планувати та максимально використовувати маршрути;
— включення поліпшення планування на випадок надзвичайних ситуацій, коли перевізник відсутній;
— виявлення аномалій у поштовому розповсюдженні, в тому числі перекриття, покриття, невидимі місця та вузькі місця;
— забезпечення більш ефективного використання робочої сили за допомогою використання сукупних даних про ефективність;
— перевірка того, що кореспонденція фактично доставляється та забирається в передбачуваний час і місце.

Читати більше — www.datanami.com/...​roves-mail-delivery-usps

65/150 — Бізнес (фондовий ринок) — використання DS для торгівлі цінними паперами за допомогою алгоритмів чи як вкласти всі свої заощадження

Результат: вкладення всіх сімейних заощаджень у проект і розроблення успішного алгоритму

Отримані уроки
1. Оцініть вартість та потенційні винагороди
2. Майте надійний доступ до інформації
З. З фінансовими програмами невеликі поліпшення можуть призвести до великої винагороди.
4. Працюйте надзвичайно важко, щоб зламати модель.
5. Поділіться роботою та поділіться нагородою: спільне використання пирога зазвичай збільшує пиріг

Читати презентацію — www.predictiveanalyticsworld.com/...​3/pdf/Day2_1350_Elder.pdf

Слушай, вот ты тут это ищешь и пишешь. Но зачем?
После сделаешь краткий обзор этого всего? Тогда большое тебе спасибо за такую работу будет.

64/150 — Бізнес (страхування) — Використання DS страховиками для отримання прихованих закономірностей Lloyds TSB

Філіп Вюббелер представляє інструменти Market Intelligence Lloyd — аналіз страхової індустрії з географічної перспективи для керуючих агентів Lloyd’s, брокерів та страхувальників, щоб допомогти їм розвивати свій бізнес на міжнародному рівні.

Дивитись відео (en) — www.youtube.com/watch?v=xVVRdyGM71Y

Час для перегляду — 3:38 хв

63/150 — Бізнес (інфраструктура) — Використання DS для прогнозування часу проїзду до Сіднею по трасі M4

Мета: розробити алгоритм для оптимізації транспортного потоку

Результат: онлайн публікація інформації про затори на сайті www.livetraffic.com/desktop.html

Завдання було розміщено на Kaggle. Учасники цього конкурсу повинні були прогнозувати час проїзду на автостраді М4 на 15 хвилин, 30 хвилин, 45 хвилин, на одну годину, 90 хвилин, на дві години, 6 годин, 12 годин, 18 годин та 24 години на майбутнє. Служба автомобільних доріг і дорожнього руху NSW надала 2 роки історичних даних про використання дороги в період між 2008 та 2010 роками, доступними для цього змагання.

Для виграшної моделі був передбачений приз 10 000 доларів.

Конкурс проводиться Австралійським офісом автомобільних доріг та дорожнього руху NSW та фінансувався департаментом Прем’єр-міністра та Кабінету Міністрів штату.

Читати більше — www.kaggle.com/c/RTA

62/150 — Бізнес(авіаперельоти) — Використання DS для прогнозування затримок літаків Continental Airlines

Мета: прогнозування затримок
Результат: економія мільйонів доларів та покращення сервісу

Переваги включають зменшення або усунення затримок, які в іншому випадку мали місце, та більш ефективну координацію та співпрацю з іншими сторонами, усунення хронічних умов затримки. В результаті пасажири доставлені за графіком, і авіакомпанія включає багато значних витрат через затримки з її операційного плану та бюджету.

Читати більше — www.passur.com/...​airlines-at-new-york-hub

61/150 — Бізнес (ЗМІ) — Використання DS для для аналізу контенту, створеного читачами BBC News

Мета: зменшити навантаження на працівників шляхом автоматизації процесів перевірки коментарів

Результат: зменшення на 75% коментарів необхідних для перевірки

«За гроші, які ви витрачаєте на „будинок транскрипції“, ви можете використовувати ML для передачі мовлення до тексту, локалізації зображення та майже нескінченної різноманітності інших завдань з даними — і в кінцевому підсумку з багатшим змістом», говорить Джош Віггінс, головний контент-офіцер автоматизованого збирання метаданих та пошукової компанії GrayMeta.

Читати більше — www.broadcastnow.co.uk/...​-learning/5122637.article

.
.
.
.
.
#datascienceforbusiness #DSMLAI

60/150 — Бізнес (захист даних) — Використання DS для виявлення образ в Інтернеті

Мета: побудова алгоритму, який визначатиме в інтернеті словесні образи

Результат: виграш командою-переможцем $10.000 та використання результатів компанією Imporium у своїх продуктах

Imperium є провідним постачальником послуг з якості даних та анти-шахрайських рішень.

Більше п’ятнадцяти років у сфері перевірки особистої інформації, що подається самостійно, та обмеження шахрайських дій в Інтернеті. Послуги Imperium включають RelevantID®, Verity®, Real Answer®, Capture®, Address Correction ™ та ChildGuardOnline ™.

Читати більше на Kaggle — www.kaggle.com/...​social-commentary#winners
.
.
.
.
.
#datascienceforbusiness #DSMLAI

59/150 — Бізнес (атомна енергетика) — Використання DS для передбачення можливих ушкоджень атомних реакторів

Мета: збільшення рівня безпеки об’єктів атомної енеретики
Результат: розробка алгоритму, який сповіщає про можливі пошкодження та побудова реакторів нового типу на основі цих даних

«Використовуються мільйони годин комп’ютерної обробки на IBM Blue Gene / P і унікальний код для детального моделювання потоку теплоносія в реакторові. Модельований пристрій — це розмір довгої, вузької поштової скриньки, упакований з 217 паливними штифтами та близько 1 мільярда точок даних.

Кожна з ряду властивостей може бути розрахована в кожній точці даних — температурі, тиску, турбулентності та швидкості.

Використовується 65 тисяч процесорів, які працюють 8 годин на день протягом 16 днів, стискаючи дані, щоб зрозуміти, як буде працювати справжніий ректор при певних тисках і температурах.»

Читати більше — deixismagazine.org/...​10/09/nuclear-predictive

58/150 — Бізнес(медицина) — Використання DS для покращення якості життя пацієнтів та оптимізації витрат бізнесу BlueCross BlueShield of Tennessee

Мета: оптимізація страхових витрат

Результат: розроблення алгоритму, який на основі даних про минулі страхові витрати прогнозує майбутні необхідні медикаменти для пацієнтів

Незважаючи на те, що BCBSNC хоче керувати медичними витратами та здійснювати виплати обґрунтовано, проект з реадмісії полягає в основному в підвищенні якості життя. Як тільки BCBSNC отримує дані про своїх клієнтів, програмне забезпечення для прогнозування обчислює ризик реадмісії. «Ми хочемо зробити все можливе, щоб підтримати виписаного пацієнта з лікарні, зберегти його здоровим і зберегти високу якість життя».

Страховик співпрацює з іншими у сфері використання інформації та щоденного користування його мережними провайдерами. Цей прозорий підхід і нове бачення спонукали багатьох постачальників підписати контракти з BCBSNC, щодо зменшення кількості реадмісій.

Читати більше — www.psqh.com/...​gement-and-improves-care

57/150 — Бізнес(медицина) — Використання DS для передбачення порушення режиму лікування MyFICO

Мета: зменшення летальних випадків через порушення прийому медикаментів, зменшення втрат компаній

Результат: виявлення груп клієнтів, які можуть 100 і більше днів у рік порушувати режим

The FICO Medication Adherence Score (Показник дотримання прийому ліків FICO) дає корисну інформацію, яка досі не була доступною «, - сказав Ерік Ньюмарк, менеджер з досліджень IDC Health Insights. «Враховуючи те, що порушення режиму прийому лікарств коштує фармацевтичній промисловості понад 35 мільярдів доларів за втрачений прибуток на рік, Показник дотримання прийому ліків FICO може принести велику цінність для оптимізації маркетингу та розуміння способів поліпшення здоров’я пацієнтів. Таке рішення, швидше за все, сприятиме синергії в інших інвестиціях, таких як віддалений моніторинг пацієнтів та дотримання режиму прийому ліків. »

Читати більше — www.fico.com/...​ion-medication-06-23-2011

56/150 Бізнес (страхування) — Використання DS для прогнозування можливості настання нещасного випадку

Мета: розроблення алгоритму для підвищення точності прогнозування настання нещасного випадку та аналізу інших даних

Результат: економія в рік приблизно 40 млн. $

Earley Information Science (EIS) — це агентство, яке, як повідомляється, допомагає підприємствам підвищити ефективність роботи за допомогою аналізу даних. Allstate співпрацював з EIS для розробки віртуального асистента під назвою ABle (Allstate Business Insurance Expert). ABIe (проголошена як «Abbie») була розроблена для надання допомоги Allstate агентів, які шукають інформацію про товари комерційного трахування Allstate Business Insurance (ABI).

Коли компанія вирішила перенести свою увагу на комерційне страхування, багато агентів мали довгий період навчання та стикалися із проблемами доступу до інформації, необхідної для ефективного спілкування з потенційними клієнтами. В результаті, Allstate виявив, що їх кол-центр підтримки продажів постійно наповнюється запитами від агентів і, в кінцевому підсумку, «довго чекають», а отже переведені на «втрачені можливості для бізнесу».

Читати більше — www.techemergence.com/...​g-at-insurance-companies

Змагання на Kaggle — www.kaggle.com/...​/allstate-claims-severity

55/150 Бізнес (підбір працівників) Використання DS для пошуку працівників

Мета: автоматизація підбору та оцінки працівників

Результат: створення алготитму, який на основі багатьох факторів дає рекомендаційну оцінку потенційного працівника та свторення сервісу Supahands

Три роки тому компанія Supahands перетворилася з віртуального асистента-постачальника послуг у технологічну компанію, яка надає послуги з обробки бізнес-процесів зі спеціальностями у модерації контенту та управління базами даних. У 2018 році увага зараз спрямована на допомогу компаніям у підготовці та створенні наборів даних для машинного навчання. Заснована компанією, що працює у місті Куала-Лумпур, підтримана сильною віддаленою робочою силою, яка має 2000 + сильну віддалену робочу силу, і натовп інноваційних технологічних платформ, компанія, що працює в технологіях, працює над технологічними процесами у всьому світі, щоб швидко розширити свій бізнес.

Місія Supahands — створити найефективнішу робочу силу в світі, яка інноваційно впливатиме на роботу людей та надасть можливість компаніям у всьому світі вирости.

Рішення повинно бути гнучким, швидким і масштабованим. Для цього ми оснастили нашу платформу для роботи з нашим цифровим інноваційним помічником для інженерії (DIANE). Цей алгоритм міг запропонувати найкращий підхід для проекту, на основі даних історії та рейтингів, які вони отримали. DIANE був побудований з графовою базою даних.

Читати більше — asiandatascience.com/...​tarting-projects-5-times

54/150 Бізнес(біржа) — Використання DS для торгівлі цінними паперами London Stock Exchange

Мета: написання алгоритмів для атоматизації торгівлі та врахування більшої кількості факторів

Результат: більше 50% торгівлі на Лондонській біржі за допомогою алгоритмів

Алгоритмічна торгівля або «торгівля алго», як відомо в фінансовому секторі, спирається на комп’ютерні системи, щоб автоматично купувати акції при заздалегідь визначених ринкових умовах.

Цей метод торгівлі є майбутнім, вважає Пайн. «Ринки будуть продовжувати оцифровуватися з поширенням алгоритмів, що мають покращуватись. Близько половини обсягу обміну зараз формується в електронному вигляді, і ми вважаємо, що ця тенденція буде продовжуватися».

Решта заявок створюється за допомогою ручного втручання, коли трейдери подають замовлення за допомогою інтерактивного екрану.

Читати більше — www.computerweekly.com/...​f-stock-market-technology
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

52/150 Бізнес(онлайн-знайомства) — Використання інстурментів DS для підбору партнера(-ки) OkCupid

Мета: побудова алгоритму для знайомств за допомогою аналізу повідомлень

Результат: прогнозування з яким змістом повідомлення будуть успішними

OkCupid був заснований математиком з Гарварду у 2004 році, і це зразу привернуло увагу читачів через його обчислювальний підхід до пошуку людей. Користувачі відповідають на запитання щодо опитувань, що складаються з вибору варіантів, від політики, релігії та сім’ї до кохання, сексу та смартфонів.

У середньому респонденти вибирають 350 запитань із тисяч. «Наскільки важливим є релігія / Бог у вашому житті?» та інші.

Кожне питання оцінується відповідно до важливості для інших за п’ятибальною шкалою від «невідповідних» до «обов’язкових». Алгоритм OkCupid використовує ці дані для розрахунку сумісності пари.

Чим ближче до «100-відсоткового математичного» співрозмовника — тим краще.

Дивитись відео — www.youtube.com/watch?v=m9PiPlRuy6E
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

51/150 — Бізнес (спорт) — Використання DS для аналізу футбольних матчів

Мета: аналізувати футбольні дані для отримання інсатів

Результат: створення додатку Match insights та перемога Німеччині на євро

У 2016 році перемога Німеччини на Євро може бути пов’язана не тільки з винятковою продуктивністю своєї національної збірної, але також (так, ви здогадалися!) з великими даними. SAP була давньою послугою для німецької футбольної асоціації (DFB), яка в основному піклувалася про back-end операції. Тільки на чемпіонаті світу з футболу 2014 року SAP створив програму для DFB, що називається Match Insights (пізніше став комерційним продуктом для всіх команд, званий SAP Sports One). Це дозволило тренерам фільтрувати ігрові кліпи, щоб побачити, як гравці грають у конкретних ситуаціях та аналізують дані матчів.

Отже, в чемпіонаті Європи з футболу 2016 року SAP пішов ще далі з двома новими додатками. Перший з них називався Challenger Insights, який надав інформацію про характеристики конкурента, нападаючі та оборонні тенденції та їх формування. Друга програма була названа Penalty Insights Function. Вона відіграла вирішальну роль у боротьбі з рахунком 6-5, в якому німецький воротар Мануель Нейер зумів утримати опозицію. Були проаналізовані патерни як супротивники приймають пенальті. Гравцям було надано доступ до цих додатків (на базі SAP HANA Cloud Platform) через iPad-и у їхніх роздягальнях.

Дивитись відео — www.sap.com/...​10-82c7-eda71af511fa.html

Вихідні — час набратись сил та підняти рейтинг? Пам’ятаєте серію «Чорного дзеркала» про рейтинги людей?

Сьогодні одразу два випадки використання Data Scince для соціального та кредитнго рейтингів. У кінці огляду посилання для перевірки свого рейтингу (кредитного).
4️⃣9️⃣/1️⃣5️⃣0️⃣ Уряд (соціальний рейтинг) — Використання Китаєм DS для рейтингування людей

Мета: «щоб громадяни, що виправдали довіру, користувалися всіма благами, а ті, що її втратили — не могли зробити ні кроку»

Результат: експеримент триває

У Жунчені єдиний інформаційний центр аналізує 160 тисяч різних параметрів із 142 установ. Активно вітається і система доносів. Громадянину, що повідомив куди слід про всякі нехороші справи свого сусіда, приплюсовується як мінімум п’ять балів.

Якогось єдиного документа, де було б чітко прописано, що робити можна, а що не можна і що за це буде, система не передбачає. Відомо лише, що якщо твій рейтинг більше 1050 балів, то ти зразковий громадянин і маркуєшся трьома буквами А. З тисячею балів можна розраховувати на АА. Якщо балів 900 — на B. Якщо рейтинг впав нижче 849 — ти вже підозрілий носій рейтингу C, тебе виженуть зі служби в державних і муніципальних структурах.

А тим, у кого 599 балів і нижче, не минути лиха. Їх записують в чорний список з припискою D, вони стають вигнанцями суспільства, їх не беруть майже ні на яку роботу (навіть у таксі з чорною міткою D працювати не можна), не дають кредити, не продають квитки на швидкісні потяги та літаки, не дають в оренду автомобіль і велосипед без застави.

Сусіди від тебе сахаються як від вогню, адже не дай боже хтось побачить, як ти спілкуєшся з людиною D, на тебе відразу донесуть, і твій рейтинг теж стрімко піде вниз.

Читати більше — www.wired.co.uk/...​it-score-privacy-invasion

5️⃣0️⃣/1️⃣5️⃣0️⃣ -Бізнес (банки) Використання іструментів DS для рейтингування клієнтів

Мета: мінімізация ризиків шляхом надання кредитів відповідно до рейтингу

Результат: зменшення кількості недобросовісних позичальників

В Україні інформацію для оцінки кредитоспроможності беруть із Бюро кредитних історій, які в різних країнах мають різні назви, але по суті виконують одну і ту ж функцію. Так, в нашій країні дані позичальників збирає Українське бюро кредитних історій (УБКІ).

Рейтинг представлений у вигляді шкали від 0 до 700 балів і виглядає наступним чином:

від 0 до 250 — дуже низький
від 250 до 350 — низький
від 350 до 450 — середній
від 450 до 550 — високий
від 550 до 700 — дуже високий

Звіт з оцінки кредитоспроможності в УБКІ називається «Кредитний бал».

Перевірити свій рейтинг (платно) — ubki.ua/...​ebtor_credit_history.html

Читати більше — nashibanki.com.ua/...​bnosti-skoringovye-modeli
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

48/150 Держава (військова служба — спецовики) — Використання DS для передбачення ступеня успішності курсантів

Мета: передбачення, хто пройде всі випробування і завершить навчання

Результат: побудова алгоритму, який на основі твердості характеру та можливості віджатись 80 разів передбачає шанси на успіх курсанта у навчанні

Читати більше — www.ncbi.nlm.nih.gov/pmc/articles/PMC3910317
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

47/150 — Бізнес(техніка) — Використання NCR інструменів DS для передбачення поломки POS та банкоматів

Мета: збір даних з Інтернету речей для вивлення збоїв

Результат: побудовано ефективну систему передбачення несправностей

«Як наголошує Валейко, NCR директор з корпоративних даних та бізнес-аналітики, „Наші клієнти знають, що їхні клієнти мають чудовий досвід з нашими пристроями“.

Таким чином, обробка даних та аналітика мають прямий, практично невідкладний вплив на здатність пристрою NCR та досвід роботи з клієнтами. Але все починається з можливості збирати, зберігати та зберігати ці дані ефективно.»

Для чого це все потрібно? NCR використовує Teradata Enterprise Data Warehouse для щоденного аналізу та можливості глибокої аналітики Teradata® Aster® Discovery Platform для ефективного переміщення цих даних в архітектуру. З Teradata Aster, NCR може зібрати справді глобальний набір даних. Всі банкомати NCR, POS та пристрої самоконтролю збирають та передають дані пристрою про стан пристрою, незалежно від того, чи працюють компоненти, а також, як працює мережа, з метою пронозування.

Читати більше — www.teradataemea.com/...​l-TDU2018-Hortonworks.pdf

Спасибо за полезную информацию)

46/150 Бізнес( HORECA) — Використання DS для покращення показників ресторанів Dickey’s Barbecue Pit

Мета: відслідковування продажів та задоволення клієнтів на основі різних показників

Результат: можливість оновлення інформації (кожних 20 хв) про стан бізнесу та прийняття оперативних управлінських рішень

CIO Лаура Рей Діккі вважає, що Smoke Stack — це інструмент, який надає їм конкурентну перевагу в швидкому темпі розвитку харчової промисловості в США. Рішення приймаються на основі даних, наданих Smoke Stack кожні 20 хвилин. Щоденний брифінг на корпоративному рівні у штаб-квартирі забезпечує більш високий рівень планування та виконання різних стратегій. Простий приклад того, як Діккі використовує Smoke Stack — якщо дані показують, що продажі курячих реберв були низькими в певній області, а в магазині є значна кількість ребер, текстові запрошення надсилаються клієнтам у цій області за спеціальними цінами. Корекція кожні 12-24 годин дозволила їм залишатися на крок попереду від конкурентів, на відміну від прийняття рішень в кінці кожного тижня або кожен квартал зі старими даними.

Читати більше — www.forbes.com/...​performance/#93a2f886d952
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

У світлі ажіотажу з цінами на проїзд в Києві та молебню за зменшення ціни пост :)
💡Ідея для КП «Київський метрополітен» як зробити ціну 5 і навіть 3 грн :)

45/150 — Бізнес (транспорт) — Використання Transport for London Data Scince для покращення міської інфраструктури (роботи метрополітену) або як пов’язані метрополітен Лондона та відстань до Місця

Мета: збільшення надійності та зменшення видатків на експуатацію

Результат: очікується зекономити 3 мільйони футнів стерлінгів за допомогою інструментів DS

Для інформації:

Лондонське метро залишається одним із найбільш завантажених мереж метро у світі. Щоранку 538 поїздів проходять між 270 станціями, і 2018 році в мережі очікується 1,4 мільярда поїздок, що охоплюють 86 мільйонів кілометрів, еквівалент 110 поїздок на Місяць та назад.

Вікторіанська інфраструктура та вітрильні вагони, що проходять разом, потребують регулярного технічного обслуговування, щоб обмежити порушення графіку.

Близько половини всіх затримок викликають проблеми з активами TfL (Transport for London). Вартість їх підтримки становить 59 відсотків від бюджету.

Зовнішні чинники також можуть спричинити порушення служби. В одному проекті з вивчення даних, TfL досліджував, як погодні умови впливають на надійність транспорту шляхом виявлення кореляцій між несправностями та температурою, вологістю та дощем.

Читати — www.computerworlduk.com/...​erground-running-3671541

42/150 Бізнес(медицина) — Розроблення електронної єдиної медичної карти для збору неструктурованих даних Yandex

Мета: об’єднати в одному місці медичні дані

Результат: розроблення Yandex.Здоров’я

Читати більше — habr.com/...​mpany/yandex/blog/330152
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

Подобное уже давно в развитом мире внедрено и юзается, только не рекламируется так, как яндексовое.

Не могу, ибо конкретно в этих областях не работал. Но не раз проскакивало и в статьях и в инете. Вообще это началось еще с экспертных систем.

41/150- Бізнес (платіжні системи) -Використання DS для збільшення ефективності телефонних дзвінків (та зростання прибутку)

Мета: побудова алгоритму для аналізу дзвінків

Результат: зменшення на 40% телефонних дзвінків, неохідних для організації бізнес зустрічі

Читати — www.rosebt.com/...​ive_analytics_e_guide.pdf

40/150 — Бізнес (реклама) — Використання DS для прогнозування успішності «клікової» реклами

Мета: визначення потенційно неуспішної реклами

Результат: розроблення алгоритму, який передбаає відмови у рекламі ( коли користувача натисне «назад»)

Читати — research.google.com/pubs/archive/41159.pdf

39/150 Наука (фільми) -Використання інструментів DS для прогнозування успішності фільмів

Мета: побудова моделі, яка б передбачала шанси нової стрічки

Результат: прогнозування з 93% точністю успіху фільму серед глядачів

Читати — www.diva-portal.org/...​a2:1106715/FULLTEXT01.pdf

это совсем не трудно, снимай очередной шлак по комиксам и вот тебе успех

суть щоб прорахувати ймовірність

40/150 — Бізнес (реклама) — Використання DS для прогнозування успішності «клікової» реклами

Мета: визначення потенційно неуспішної реклами

Результат: розроблення алгоритму, який передбаає відмови у рекламі ( коли користувача натисне «назад»)

Читати — research.google.com/pubs/archive/41159.pdf

38/150 Бізнес (медіа) — Використання DS для збільшення кількості відвідувань веб-стоінок

Мета: вивчення вірусних постів та інших даних для зростання кількості переглядів

Результат: збільшення на 55% переглядів веб-сторінок

Читати — www.forbes.com/...​-experience/#25621bab69e5

37/150 Бізнес(знайомства) -Використання DS для пошуку другої половинки Match.com

Часи коли алгоритм підбере вам пару ще попереду ;)

Мета: спрощення пошуку партнера на сайті знайомств

Результат: рекомендація можливих партнерів для стосунків на підставі аналізу багатьох факторів

Читати — mashable.com/...​om-equation/#RALiTkeoqqqp
.
.
.
.
#datascienceforbusiness #DSMLAIUA

36/150 — Наука (розлучення) — Використання DS для обрахунку ймовірності розлучення

Мета: побудувати алгоритим, який би обраховува можливість розлучення

Результат: з точністю до 90% передбачення ймовірного розлучення протягом 4 років

Читати — iamkos.com/...​omising_couples_paper.pdf

Найбільш відомий випадок у світі науки про дані.

35/150 — Бізнес (передбачення вагітності) — Використання DS для передбачення вагіності

Мета: виявлення потенційних покупців товарів для вагітних
Результат: на 30 % покращення таргетованості реклами

Читати більше — www.forbes.com/...​-father-did/#2b3314106668

34/150 Бізнес (казино) — Викристання DS для оцінки скільки гравець витратить за все життя

Мета: збільшення прибутку за допомогою нових підходів до утримання клієнтів

Результат: визначення «пожиттєвої вартості клієнта»

Читати більше — hbr.org/...​diamonds-in-the-data-mine
.
.
.
.
#datascienceforbusiness #DSMLAIUA

33/150 — Бізнес (одяг)- Використання DS для прогнозування продажу одягу Elie Tahari IBM

Мета: краще дослідження вподобань покупців

Результат: пронозування попиту на колекції нового одягу

Читати — www.ibm.com/...​/case-studies/elie-tahari
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

32/150 -Медицина (лікування раку) — Викорисання DS для підбору індивідуальних препаратів (проект open source!)

Мета: покращення лікування раку за допомогою медикаментів

Результат: створення персональних медикаментів на основі аналізу генів

Читати — journals.plos.org/...​1371/journal.pone.0186906
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

31/150 Наука (зоологія) — Використання DS для дослідження дельфінів

Мета: вивчати стан морської екосистеми за допомогою аналізу звуків дельфінів

Результат: побудова алгоритму, що розрізняє декілька видів дельфінів серед інших акустичних сигналів

Читати більше — journals.plos.org/...​1371/journal.pcbi.1005823

.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

30/150 Бізнес (супермаркети) — Використання DS для персоніфікації купонів (кейс Tesco)

Мета: збільшення прибутків через знання своїх клієнтів та використання купонів ними для покупок

Результат: використання купонів у 3.6 разів частіше за допомогою методик Data Science

Читати більше — stat-exchange.blogspot.com/...​analytics-behind-top.html
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

Чи одні ми у Всесвіті?

29/150 Наука (космос) — Використання DS для пошуку планет подібних до Землі

Мета: за допомогою даних від Телескопа Кеплера виявити планети, які можуть мати придатні для життя умови

Результат: виявлено 8 потенційних планет як Земля

Читати більше — www.telegraph.co.uk/...​cement-habitable-planets
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

Пост для SMM-щиків :)

28/150 — Наука (фото) — Визначення за допомогою DS можливої кількості переглядів фото

Мета: побудувати алгоритм, що визначатиме популярність фото

Результат: оцінка фото за шкалою та прогнозування можливої кількості переглядів

⚠️Читати більше і зробити тест фото — popularity.csail.mit.edu

.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

27/150 Бізнес (локація) — Визначення вашого майбутього місцезнаходження

Мета: розроблення алгоритму для перемоги у конкурсі Nokia

Результат: визначення на 1 день наперед місцезнаходження з точністю до 20 м

Читати більше — www.eelcoherder.com/...​icting_user_locations.pdf
.
.
.
.
.
#datascienceforbusiness #DSMLAIUA

З Днем Конституції, Україно!

26/150 — Наука (конституціоналізм) — Data Science та конституції — семантичний аналіз та цікаві результати

Мета: проаналізувати 591 конституцію з 1789 до 2008 року на предмет культурного спадкування та інновацій

Результат: визначення неочевидних зв’язків між конституціями різних часів та країн

Читати більше -sfi-edu.s3.amazonaws.com/...​ssociation_for_d2e96a.pdf

25/150 — Бізнес (послуги зв’язку) — Використання іструментів науки про дані для передбачення збоїв у роботі мережі

Мета: зменшення витрат на обслуговування телекомунікаційного обладнання та зменшення ризику збоїв у роботі мережі

Результат: передбачення з точністю до 95% поломки обладнання за 14 днів

Читати більше — networks.nokia.com/...​ervices/predictive-repair

о, привет запланированное устаревание

24/150 Бізнес (перевезення) — Використання DS для безпеки автомобільних вантажних перевезень Omnitracs Averitt Express

Мета: побудова системи для розпізнавання втоми водіїв

Результат: зменшення кількості нещасних випадків з вини водіїв на 30%

Дивитись відео — omnitracs.wistia.com/...​dias/yfoqp8p620?Analytics

23/150 -Бізнес(пошук роботи) — Використання DS для рекомендації роботи на основі резюме

Мета: спростити пошук роботи

Результат: прогнозування вакансій, які можуть зацікавити, щоб підібрати оптимальні варіанти

Оцінити своє резюме — www.careerbuilder.com

⚠️Якщо не працює — через cameleo.xyz можна отримати доступ

22/150 Бізнес (розваги — ігри) — «Читання думок» за допомогою інструментів DS

Мета: мати можливість вирахувати людські думки

Результат: створення інтелектуальної гри, яка викристовує нейронну мережу для гри у «20 питань», що вгадує з точністю 98% задуману вами тварину, рослину чи мінерал

Спробувати гру — www.20q.net
Читати більше — www.spokesman.com/...​ind-20q-reveals-thoughts

21/150 Навчання (ВНЗ) — 🇺🇸 Використання інструментів DS для визначення успішності студентів для попередження викладчів

Мета: аналіз інтернет активності студентів та інших критеріїв для зменшення кількості відрахованих

Результат: на підставі результатів 8-ми днів начання прогнозування з 70 % точністю, хто отримає «С» і вище

Читати більше — pdfs.semanticscholar.org/...​4bfd7f0475f962a62c523.pdf

Перед робочою суботою :)

20/150 — Бізнес(медицина) — 🇬🇧Алгоритм, який прораховує вашу ймовірну смерть від хірургічного втручання

Мета: визначити ймовірність смерті під час операції

Результат: прогнозування ризику вашої смерті на основі показників здоров’я та характеристик вашого тіла для малих, великих та важких операцій

Більше інформації — riskprediction.org.uk

19/150 Бізнес (кінотеатри) — 🇺🇦 Ідея Планета Кіно зробити рекомендаційний сервіс фільмів

Мета: cтворення алгоритму, який буде визначати вподобання глядачів і рекомендувати їм фільми

Результат: будемо слідкувати

«Займатися створення рекомендаційної системи („як у Netflix“) в „Планеті Кіно“, ймовірно доведеться тим же людям, які останні кілька років доводять стандартизованому українському кіноринку, що місцеві кінотеатри ще є куди покращувати. »

Читати більше — rau.ua/...​eta-kino-set-kinoteatrov

18/150 — Бізнес (передбачення захворювання) — Використання DS Google (Flu Trends) для прогнозування поширення захворювання на грип

Мета: використання даних для попередження епідемій

Результат: прогнузвання поширення грипу на 7-10 днів швидше, ніж органи влади США

Читати більше — health.howstuffworks.com/...​nts/google-flu-trends.htm

17/150 — Бізнес (музика) — Використання Pandora інструментів Data Science для рекомендації музики

Мета: покращення якості рекомендаційних алгоритмів

Результат: врахування більше 400 критеріїв для особистої рекомендації музики

Читати більше — blog.kissmetrics.com/how-pandora-uses-data

А как практически с помощью искусственного интеллекта спрогнозировать например сколько электричества я в следующем месяце использую? У меня есть показания счётчика за несколько лет. Как мне написать такую простую программку.

для такой задачи не нужен ии)

Є прості статистичні методи, а програмку можна написати і в Python, але чи будуть співмірними результат/час. Питання)

16/150 Бізнес (мобільний зв’ язок) — 🇦🇺 Використання DS австралійською компанією для прогнозування відтоку клієнтів

Мета: зменшити кількість розірвання договорів абонентами
Результат: виявлення абонентів ймовірність зміни оператора якими у 10 разів вища за середню

Читати більше — www.arnnet.com.au/...​data-new-oil-especially

ссылка битая, классно, оператор улучшает качество сервиса только в том случае если абонент надумал уходить

There is a story behind ;)

15/150 — Бізнес (відеоконтент) — Використання Netflix Data Science для рекомендації фільмів і конкурс на 1 млн. доларів

Мета: побудова ідеальної рекомендації фільмів для вас

Результат: створення моделі, яка з точністю більше 80% запропонує фільм, який вам сподобається

Читати більше — medium.com/...​flix-content-bac55800f9a7

І конкурс — www.thrillist.com/...​/nation/the-netflix-prize

Ви редактор Вікіпедії — і хочете припинити чи вже почали менше постити, вона знає, що ви у групі ризику.

Big Library is watching you :)

14/150 — 🇺🇸Неприбутковий сектор (Вікіпедія) — Виявлення за допомогою іструментів Data science відтоку добровольців
Мета: створення алгоритму для обрахування редакторів, що можуть припинити роботи для Wikipedia
Результат: прогнозування хто із більше 750 000 редакторів може припинити співпрацю найближчим часом
У посиланні знахідка для HR-ів ( а на 212 сторінці більше про Вікіпедію) — нижче

Більше інфо — books.google.com.ua/...​stop contributing&f=false

Наклікали чи як працює пошук Google ?

DSMLAIUA — 13/150 Бізнез(IT) — 🇺🇸Найпопулярніший у світі алгоритм, пошук Google

Мета: підвищення можливостей пошуку веб-сторінок

Результат: створення найпопулярнішого у світі пошуковика

Читати більше — textum.com.ua/...​ipy-nyuansy-novosti-2018

13/150.
Мексика. Система фоноучета голосов засветившихся в полиции и быстрый поиск голоса в базе.

Могу сказать, что выиграли по соотношению цена/качество у американских контор.
А вообще подобные системы уже внедрены у большинства развитых государств, у тех, у кого есть деньги для оплаты подобных проектов.
И да в постсовке ни одно государство себе такого позволить не может — дорого.

Подобные системы и с лицами во многих богатых государствах внедрены.

Но для речевой пока нужно от 1 минуты чистой речи. В общем см. НИСТовские базы. На них базируют разработку.

Я сейчас от речи отвалил. Но 5 лет назад на базе на 3 сек парольной фразы достигалась EER < 2-3%. При использовании в реале 6%. Есть-ли изменения за последние 6 лет, я не смотрел.
На 1 минуте речи на базах меньше 0.5%. В реале около 2-3%.

Т.е. это не системы для идентификации, а для оценки есть-ли в базе с похожим лицом или голосом и выдаче N наиболее близких.
Для идентификации уже работают эксперты, там и математика и ручная работа юзается.

А можно конкретизировать, какая именно математика нужна для такого рода задач?

ЦОС, TBиМС и ML. Но если есть экспертные системы, то обычно глубокого уровня не надо, главное понимать, что система выдает и как ей правильные данные подготавливать.
Но судебным экспертам в постсовке платят копейки — наработался им, больше не хочу.

12/150 — Бізнес(продажі) — Використання інструментів DS (Data science) HP для продажів

Мета: створення системи виявлення та оповіщення менеджерів з продажів про можливі потреби корпоративних клієнтів

Результат: прогнозування розвитку продажів у 92% з точністю 95% та строків у 60% випадків

Читати — analytics-magazine.org/...​ion-sales-force-strategy
.
.
.
#datascienceforbusiness #dsmlaiua

11/150 — 🇺🇦Бізнес (мобільний зв’язок) — Використання DS (Data science) мобільними операторами (Lifecell, Kyivstar, Vodafone)

Мета: отримання інсайдів для особисого використання операторами, а також для надання нових послуг

Результат: нові послуги для бізнесу в Україні (скоринг, персоналізована реклама тощо), а також покращення якості мобільного зв’язку

На фото аналіз даних від мобільних операторів щодо завантаженості зупинок.
.
.
.
.
Більше інформацції — ain.ua/...​6/29/big-data-ukr-telecom

10/150 — 🇺🇸Використання даних для створення детектора брехні по руху очей

Мета: виявляти брехню за допомогою аналізу руху очей

Результат: виявлення брехні з точністю до 82% вченими

Читати зі сторони DS — www.ncbi.nlm.nih.gov/pmc/articles/PMC3403832
Читати для бізнесу — www.scientificamerican.com/...​/automated-lie-detection

#datascienceforbusiness #dsmlaiua

Поки в Україні лінчують Лінчевського за вирвану з контексту цитату про нібито скору смерть онкохворих, у світі тим часом створюють розумні алгоритми для діагонстики раку. 9/150

9/150 — 🇺🇸Використання даних для діагностування раку грудей, США

Мета: розробити алгоритм, який би визначав наявність раку

Результат: побудовано систему, котра точніше, ніж люди, діагностує рак у зв’язку з тим, що враховує більше медичних даних

Читати — cs229.stanford.edu/...​final-reports/5242363.pdf

3/150 Влада(Поліція) — Використання DS Департаменом поліції у Чикаго для розкриття вбивств, США

Мета: зменшити кількість нерозкритих вбивств, отримати дані, які люди більше схильні до насилля

Результат: створено алгоритм для можливого обрахунку особи вбивці

Читати більше — www.nytimes.com/...​lgorithm-reveals-about-l

.
.
.
#datascienceforbusiness #dsmlai_ua #datascienceua #police

№ 2/150 Фінаси(банки) — Сегментація клієнтів у Приватбанку, Україна

Мета: збільшити конверсію та персоналізованість рекламних матеріалів

Результат: поділ всіх клієнтів на 9 категорій та підготовка підходящої реклами для кожної з них

⚠️ На 41 слайді є QR-код, перевірте як вони вас бачать: зірка, тихоня чи може, успішний?)

Детальніше — ppt-online.org/181231

отлично, буду пополнять список компаний которые используют сомнительные маркетинговые методы, приват давно там

Попереду ще 148 різних випадків використання даних :)

таргетинг для продавца дает возможность делать больше продаж, покупатель же просто видит рекламу той компании у которой рекламный бюджет больше/лучше используется таргетинг, поскольку я не продавец то для меня таргетинг как минимум бесполезен, а может и назойлив, поэтому ответ очевиден

Поржав як кінь. Якщо провести сегментацію в довільному порядку, але не казати того рекламодавцям — результат буде той самий. А якщо це видати за дуууже затратну та ефективну технологію, то може й на 30% вищий. Бо ефект плацебо залежить від ціни :)

Дякуємо, за коментарі. Запрошуємо вас долучитись до оцінки інших 149 прикладів у Фейсбук та Телеграмі.

тю, я думал будете тут 150 дней подряд накидывать

А от постити посилання із віруснею — то вже моветон

Найс, буду следить за кейсами

Подписаться на комментарии