В чем преимущества R над Excel?

Кто подскажет, в чем профит работы аналитику с R по сравнению с Excel? У нас в компании все аналитики и статистики работают в экселе, но смотрю, что повсеместно во многих компаниях аналитики используют R. Какие задачи он решает из тех, которые Excel не может?

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

В большинстве случаев именно Excel и лучше. Прежде всего, потому что результат в Excel. Его можно отдать кому угодно на планете, и даже бухгалтер в Сомали знает как его открыть и расчепятать.

A VBA достаточно приятен тем, что можно легко сделать запись действий производимых руками. Но Excel мерзостен своими меню ribbon, и только когда накатываешь Classic menu — он таки няшечка.

Основной и чуть ли не единственный инструмент Excel, оправдывающий его название — Сводные таблицы, они есть классический гиперкуб OLAP. Прекрасно строятся на основе запроса к внешнему источнику данных (и не теряют своего содержимого после разрыва связи).

Далее — за долгие годы Excel прекрасно научился понимать что такое печатный бумажный документ, и что форматирование не менее важно чем вся математика вместе взятая.

А вот КОРМИТЬ данными лучше всего обычной SQL-ной вьюшкой, созданной специально под конкретную бизнес задачу. Далее VBA-кодом собрать/обновить сводную таблицу, вылизать данные (группировка, ручные фильтры, и это тоже можно на VBA), скопировать-вставить данные в новый документ.

Другой вопрос, что на Линуксе эта тварь не хочет нормально существовать, потому что мелкомягкая. Но такова селяви.

В идеальном варианте — натравить её из облака на свой источник данных, и оттуда же делать бизнес-агрегаты, и оттуда же раздавать желающим. Я думаю, это работает «из коробки», но мне такая задача не ставилась, а я уж давно отошёл от задач тяжёлого бизнес-анализа.

Если Excel хватает для выполнения поставленных задач и нет цели в развитии как аналитика, то R не дает никаких преимуществ.
К R приходят тогда, когда Excel недостаточно по любой из причин: недостаточно быстрая обработка имеющихся объемов данных, продвинутая/кастомизируемая визуализация, необходимость применения алгоритмов машинного обучения, проведение аналитических исследований на данных структура и состав которых заранее не известен и т.д. R — мощнейший инструмент анализа данных, язык программирования, который создан именно с этой целью.
Корректнее было бы задать вопрос «Какие задачи Excel может решить из тех, что решает R» ;)

R более мощный и универсальный по сравнению с экселем)

какую сложную формулу бизнес анализа и статистики- нельзя запрограммировать на VBA?

Например P-value
Это стандартная функция екселя вроде бы, зачем ее программировать?)

Когда выбираешь -Данные- анализ данных -Регрессия — то там среди прочих выходных результатов есть и P-значение.

Точно, через анализ данных можно, сорри, но формулы как таковой нет.
Когда-то давно была у меня необходимость реализовать P-value на VBA как UDF, помню, что ничего у меня так и не вышло, и на форумах адекватных решений не нашёл.
Но на R, после подключения нужного пакета, это вышло очень просто в одну строчку

R все-таки язык программирования, заточенный под математику, а Execl — таблица с ограниченными возможностями в макропрограммировании. Это и есть главное преимущество перед Excel. Перед другими языками ( при всей кривости R как языка ) - что это де-факто стандарт для статистики, на нем публикуются все новые алгоритмы, существует большой репозиторий пакетов и если какой-то статический метод описан — скорее всего в R уже есть его реализация.

повсеместно во многих компаниях аналитики используют R
Приведите список компаний)

Эр это пафосно, модно, молодежно.
А икселем коммунисты и ватники пользуются.

аж интересно как в ексель засунуть больше миллиона записей

это только на одном листе)

И биндинги для спарка и хадупа)

нафига бигдата для бизнес анализа? Если это не амазон какой нибудь..

он был лет 15 тому назад
как и 32K в openoffice

Import millions of rows of data from multiple data sources With P Power Pivot for Excel, you can import millions of rows of data from multiple data sources into a single Excel workbook, create relationships between heterogeneous data, create calculated columns and measures using formulas, build PivotTables and PivotCharts, and then further analyze the data so that you can make timely business decisions—

all without requiring IT assistance.

работать будет медленее в разы по сравнению с R, плавали знаем

Подключив напрямую к источнику данных, разумеется. Зачем сырые данные в ячейки-то гнать?

Ну, на это бизнесу как раз плевать с высокого забора. Пару минут подождать пока сварганится тяжёлая аналитика, пока «несчастный» аналитик нальёт себе кофе и получит результат «своей» работы на блюдечке — говно вопрос.

Вот когда это почему-то перестаёт работать — база переехала, сеть не пашет, структуры поменялись или [что чаще всего] хотелки руководства по этой аналитике — вот тут можно и протррахаться несколько часов пока сделаешь руками. Но если сделаешь, загнать это в VBA уже не такая проблема.

И когда поднимается вопрос постоянных хотелок и перехотелок, Excel как раз лучше — гораздо быстрее переделать. Ну и немаловажный аспект — количество рецептов которые можно нагуглить для Excel существенно богаче.

модули, тысячи их
интеграции со Spark и тд
на экселе будет сложно делайть всякие пайплайны

главное, интеграция с юпитером или цепилином каким.
Напедалить трема строчками кода, чтото полезное что прошуршит реальные биг-дата обьемы, и нарисует график, меня досих пор впечетляет.

Підписатись на коментарі