Что означают «I квартиль», «Медиана» и «III квартиль» в статистике зарплат?

Всем привет! Подскажите пожалуйста, никак не могу найти информацию, что означают «I квартиль», «Медиана» и «III квартиль» в статистике зарплат?

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn

Найкращі коментарі пропустити

Спорили о необходимости алгоритмов/структур данных для кодерка, коллеги? Получите и распишитесь.

I квартиль

Промежуток с нового года по конец марта. Обычно на финишной прямой выпадает много снег,а к которому коммунальные службы не готовы. На дорогах заторы и аварии, так как водители попрятали зимнюю резину в гараж.

III квартиль

Конец жаркого лета, завершается первыми неделями учебного года, пробками, толпами людей и комарами, которые особо злые и кусючие.

Медиана

Была певица такая, её клипы крутили на мониторах над кассами в сильпо. Участвовала в Х-факторе с песней «Я буду любить тебя»
На уроке физкультуры слева и справа от неё в шеренге стояло одинаковое количество девочек.

вместо того, шоб играться со средним арифметическим(шутка про «а в среднем мы едим голубцы») список зп сортируется и выбирается значения в позициях 1/4, ровно посередине(медиана) и на 3/4 от общей длины.
это позволяет нивелировать влияние аномальных значений(типа, одна огромная зп «ради шутки» или копеечные зп в каком-то НИИ), которые бы задели расчет среднего арифметического.

вообще, немного обидно выступать в роли гугла :(

III квартиль — скільки обіцяють на вайтішних курсах, що ви будете мати одразу, на першій же роботі
I квартиль — скільки буде насправді, коли нарешті пощастить влаштуватись на першу роботу

Аж жыр с монитора закапал.

Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

«Не надо, не запоминайте эти слова !» (Со.Уральские пельмени)

ДОУ — заміна гугола

Скільки емоцій через статистику )) А взагалі, я зайшов залишити цей коментар в підтримку автора: я сам дізнався що таке медіана і квартилі вже після того як захистив кандидатську по теоретичній фізиці — ну не треба було мені статистики до того від слова «зовсім». На стековерфлов нормально реагують навіть на таке
stackoverflow.com/...​-do-i-exit-the-vim-editor
Я сам іноді зависаю на math.stackexchange, так там цілком спокійно уживаються такі задачі
math.stackexchange.com/...​-if-so-how-can-i-prove-it
і написати коротку відповідь чи дати посилання на вікіпедію нікому корона не падає.

там за це отримують «бали». тому там будуть відповідати навіть на 2+2, тому що це «правила» гри
тут за роботу гуглем нічого не отримуєш — тому буде така реакція.
більш природня

З приводу балів згоден, Ви праві. А от з приводу природності — ні. Я відповідаю на math.stackexchange. І мені відверто до лампочки ті бали — роблю це або з чистого альтруїзму, або цікава задачка підвернеться (коли на те все є час, звичайно). І навряд чи я там такий один. Так що мені більш природно 5 секунд гуланути посилання на вікі і вставити в комент, ніж «вот это вот всё».

да, там другая история. там нужно головой думать

хм...

На math.stackexchange есть много продвинутых вопросов graduate level. Для серьёзных вопросов существует mathoverflow.

ну це ж не єдине задане на math.stackexchange питання )) Я просто привів його як приклад, що там за подібне аж прямо помідорами не закидають. А так є і з абстрактних розділів математики
math.stackexchange.com/...​ig-cong-prod-i-in-ihpx-ig
і зі старого-доброго матаналізу
math.stackexchange.com/...​2-sqrt49×4-50×21-right-dx
і просто якась олімпіадна штука
math.stackexchange.com/...​-mathbbn-such-that-mfnnfm
А є питання, які заставляють спочатку засміятися, а потім задуматися
math.stackexchange.com/...​of-mathematical-induction

На SO не приветствуется задавать вопрос, не попытавшись воспользоваться поиском. Подобным образом сформулированные вопросы выпиливаются в течение 5 минут — либо со ссылкой на дубликат, либо со ссылкой на нарушение правил формулировки вменяемых вопросов.

ссылка на дубликат — уже и есть ответ

на стек оверфлоу неплохо ***т за проявления снобизма. тренирует ок. на себе испытал.

«ъ» там, не «ы». за звездочками не видно,я понимаю

мне казалось, однозначно написал, что мне «сделали ай-ай-ай»

тренирует ок. на себе испытал.

а, сорри, я думал, это всё троллинг на тему «в***ать».
Да, зашел как-то в стотысячнораз заданный вопрос и отписал с сарказмом в духе «неужто сложно было поиском воспользоваться, но вот, держи ответ». На шо сразу несколько комментов пришло(где-то минут за 5), шо если мне влом искать дубликат и не охота отвечать — можно просто не отвечать. И что нечего тут самоутверждаться. Отрезвило.
Теперь, в подобных ситуациях, скорее, просто пройду мимо.

областные политехи это такой по своему ... эм... мирок )) я когда-то чисто чудом не попал повезло тупо на ровном месте тупо вышел на крыльцо в удачное время минута в минуту ))

тупо вышел на крыльцо в удачное время минута в минуту

С этого метода можно поподробней...

III квартиль — скільки обіцяють на вайтішних курсах, що ви будете мати одразу, на першій же роботі
I квартиль — скільки буде насправді, коли нарешті пощастить влаштуватись на першу роботу

Про первый квартиль это Вы еще очень оптимистично сказали :)

III квартиль — это то что обещают на курсах вайти.
$0-250 за 250-часовой месяц — реальная зарплата тех, кому вайти посчастливится.

Можно больше не обсуждать этот вопрос!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

На вокзал спешишь?

А вот стихи на песню певицы Медианы, с которой она пыталась пробраться на евровидение.

Я твоя Медиана
А ты мой Родриго
Мы вновь набухались
Поехали в Ригу

(одна минута музыки без слов)

Я — Медиана
Твой средний квартиль
Чувства угасли
В свиданиях — штиль

(одна минута музыки без слов и обрывки слов на заднем фоне, похожие на «я упаду — я уплыву»)

Да, я — Медиана
И ею я буду
Уеду куда-то
Тебя позабуду.

Не думал, что это сообщество такое не дружелюбное... Спросил раз в жизни тут людей, которые больше понимают, чтобы получить нормальное объяснение. Где ж я ещё спрошу, как не тут?!? Ну как всегда, все у нас очень умные и это не их уровень отвечать на такие вопросы... Реально большое спасибо тем людям, которые отвечали по сути!!!!!!)
И отдельное спасибо тем, кто помог своим остроумием и манией величия гения!!!

Можно больше не обсуждать этот вопрос!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

Слишком мало восклицательных знаков.

А ты что хотел? Какие вопросы — такие и ответы. На будущее просто вбивай их в гугл.

Где ж я ещё спрошу, как не тут?!?

На стаковерфлов?

Ах да этож английский надо знать...

Не в той стране вы родились...

На стаковерфлов?

Ах да этож английский надо знать...

нє нада
ru.stackoverflow.com

Забавно.
Даже лишне-хромосомные могут почувствовать себя такими как все.

Тебе в гуглі часом не забанили?

Держите еще восклицательных знаков на будущие посты:

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

Где ж я ещё спрошу, как не тут?!?

в гугла наприклад. Це просте питання, яке доречі покривається шкільним курсом статистики.
На банальні питання ніхто не хоче відповідати

шкільним курсом статистики

Это что за школа у Вас такая была где преподают статистику? :)

з поглибленим вивченням німецької мови. Статистика не була окремим предметом, але була в курсі алгебри

Мабуть різні роки різні програми. В мене ні в школі не було ні в політеху

спасибо большое!)

Хоть кто-то не включал гения и не показывал своё остроумия, и ответил нормально. Спасибо тебе большое!!!!!!!!!)

А он вам неправильно ответил. Максимальное+ минимальное пополам будет средним(а заодно и медианой) только пока в выборке не больше двух значений.
Правильно так

Среднее — берем суммируем ВСЕ зарплаты, делим на общее количество в выборке
Медиана — находим число, слева и справ от которого равное КОЛИЧЕСТВО элементов выборки.
Первый квартиль — 25% от общего КОЛИЧЕСТВА ниже этого значения. 3й квартиль(верхний) — всего 25% выше, 75 соответсвенно ниже.
Также перед вычислением выполняется удаление всплесков и шумов. Тоесть единичных значений, которые однозначно написаны поприколу. В случае с зарплатами это зарплаты в 10 долларов и в 100000 в месяц.

Пример. Есть у вас 5 человек с зарплатами 500, 600, 2000, 8000,50000(два джуна, мидл, сеньйор-звезда и приколист либо человек написавший годовую зарплату). 50000 выкидываем, иначе цифры получаются бессмысленными вообще. Сумма — 11100. Среднее 11000/4=2,775. Не сильно полезно, правда?
Первый квартиль (500+600)/2=550. третий квартель (2000+8000)/2=6000, медиана (600+2000)/2=1300 — более полезно, чем 2775, не?
формулы упрощены, в реале для большого количества значений считается доверительный и медианный интервал(чтото типа усреднения).

Есть еще социологически-значимая цифра — верхние 5%. Это количество гениев и выдающихся людей. Если вы в них попадаете по зарплате, это означает, что практически все имеют ниже вас зарплату. соответсвует уровню призеров школьных областных олимпиад в случае знаний.
Ну и статистически значимое — верхняя граница, это верхние X% по значению человек, где X — точность выборки или соцопроса.

А вообще любой айтишник должен иметь азы матстатистики, ну как минимум понимать определения(посчитать можно в программах специальных или погуглить).

Доповню.
Крім квартилів (четвертушок) ще практикують квінтілі (восьмушки) та децилі (десяті частини). Для складних розподілів розбиття на інтервали може бути і більш дрібним.

І, щоби два рази не вставати, додам, що крім середнього та медіани є ще така штука, як мода.

децилі (десяті частини).

Это уже для пятидесятников и прочих адептов церкви возрождения.

Все залежить від вимог. Когось влаштовує на півсигмочки, а до когось менше, ніж з п’ятьма сигмами не підходь.

не, ну, для зп мода — то точно перебор :)

Ну, росстат вже перейшов від середніх значень до медіанних, і ми чудово розуміємо, чому :) Щось мені підказує, що і до моди діло дійде.

вот, с этим удивили. по мне, это реально правильное решение, повышающее репрезентативность. правда, так как это Росстат, думаю, они стали заодно отбрасывать нижние 10% просто потому что «а чё это они?».

Для несиметричних розподілів (скажімо, альфа- чи бета-розподілу) значення середнього, медіани та моди не співпадають. І очевидно, що з трьох значень обрали більше, аби цифри виглядали більш оптимістично. Нічого «правильного» тут немає, суттєвим значенням є середньозважене, і його, якраз, відкинули.

И это вопрос на форуме посвящённому айти... остановите Землю я сойду

Можеш сходить куда хочеш...
Читал конечно кучу разных комментариев и видел, что наш брат лучше обосрет, чем поможет, ну не думал, что меня коснется...
Если ты такой умный, то объясни пожалуйста. Если не знаешь — то ничего не пиши лучше. Чем тебе не нравится этот вопрос??? На этом сайте, в разделе «зарплаты», пишется 1 квартиль, медиана и 3 квартиль. Я ж не с воздуха взял...

Мне не нравится этот вопрос тем что он свидельствует об отсутствии у тебя какого угодно математического технического образования

Да, у меня другое совсем образование! Или тут только можно тем ,кто с тех или мат образованием?!?
Если не нравится вопрос, то либо не отвечай на него, либо отвечай по сути. Всё!!! Не надо делать из себя самого умного.

что такое «медиана» должны знать люди любого образования. Это уровень школьной программы

я не спрашивал, что такое «медиана»!!! Я попросил объяснить, что означает, что зарплаты тут на сайте описываются в квартилях и медианах!!!

Я же нормально спросил именно тут, людей, которые больше знают, чем я, а не прохожих людей на улице. Так сложно помочь, если знаешь?!? Проще же показать, что ты самый умный

Те, що використовуються терміни «квартиль» та «медіана» означають, що зарплати описуються в термінах теорії імовірностей та матстатистики.

боже все програмисти общаются на таких странных наборов слов или же обозначений ?
,просто решил изучить питон сам ,и там чел с нуля всё показал ,основы так сказать ,как говорится нихуя не понял но очень интересно (

у меня гуманитарное образование, но в школу я ходил

Или тут только можно тем ,кто с тех или мат образованием?!?

Давайте представим, что вы зашли на медицинский форум и спросили о том, что такое артериальное давление?

С вашим вопросом две проблемы.

Первая: подразумевается, что у человека, который работает в ИТ, таки есть техническое образование.

Вторая: подразумевается, что Google пока все еще функционирует (а если вдруг поломается, то есть Bing) и там можно найти ответ на этот вопрос буквально за две минуты.

Правильный аналог не артериальное давление, а что такое ладонь

А так же не понимания позорности этого факта и не умения даже просто погуглить!

Ещё один умный... К чему этот комментарий???

Первый раз прочитал «Аж сыр с монитора закапал»

Сыр низшей и средней ценовой категории — при нагревании так себя и поведёт, потому что сделан из чего попало.

Сыр низшей и средней ценовой категории — при нагревании так себя и поведёт, потому что сделан из чего попало.

Я би сказав, що це радше залежить від способу приготування сиру. В цінових категоріях не розбираюсь, але далі згадані чеддар і пармезан на слуху — мабуть не такі вже погані.

First, at around 90F, the milk fat melts, which makes the cheese more supple, and often brings little beads of melted fat to the surface. Then at higher temperatures—around 130F/55C for soft cheeses,
150F/65C for Cheddar and Swiss types, 180F/82C for Parmesan and pecorino— enough of the bonds holding the casein proteins together are broken that the protein matrix collapses, and the piece sags and flows as a thick liquid.

Неплавкими є сири, що готуються в кислому середовищі

Nonmelting Cheeses. There are several kinds of cheese that do not melt on heating: they simply get drier and stiffer. These include Indian paneer and Latin queso blanco, Italian ricotta, and most fresh goat cheeses; all of them are curdled exclusively or primarily by means of acid, not rennet. Rennet creates a malleable structure of large casein micelles held together by relatively few calcium atoms and hydrophobic bonds, so this structure is readily weakened by heat. Acid, on the other hand, dissolves the calcium glue that holds the casein proteins together in micelles, and it eliminates each protein’s negative electrical charge, which would otherwise cause the proteins to repel each other. The proteins are free to flock together and bond extensively into microscopic clumps. So when an acid curd is heated, the first thing to be shaken loose is not the proteins, but water: the water boils away, and this simply dries out and concentrates the protein even further. This is why firm paneer and queso blanco can be simmered or fried like meat, and goat cheeses and ricotta maintain their shape on pizzas or in pasta stuffings.

Цитати взято з McGee H., On food and cooking. The science and lore of the kitchen

«Хочу получать 3 штуцера в долларах сразу после курсов!» — говорили они. «Совковое устаревшее образование не нужно!» — говорили они ...

Для програмування взагалі не треба освіту!!!

Достатачно запомнить читыре цыфры, пин код, чтобы сваи штуцеры снимать.

і мозгі тож ))

I квартиль

Промежуток с нового года по конец марта. Обычно на финишной прямой выпадает много снег,а к которому коммунальные службы не готовы. На дорогах заторы и аварии, так как водители попрятали зимнюю резину в гараж.

III квартиль

Конец жаркого лета, завершается первыми неделями учебного года, пробками, толпами людей и комарами, которые особо злые и кусючие.

Медиана

Была певица такая, её клипы крутили на мониторах над кассами в сильпо. Участвовала в Х-факторе с песней «Я буду любить тебя»
На уроке физкультуры слева и справа от неё в шеренге стояло одинаковое количество девочек.

Не помешало бы чуть больше такого академ.языка в учебных заведениях, а то заучивают, что перпендикуляром называется отрезок, опущенный...

перпендикуляром называется отрезок, опущенный...

Беспредел в школе! Отрезка опустили прямо на уроке математики!

Наступила осень. Холодно. Идет дождь...
Спасибо за ответ к вопросу!

Вот же ж зараза, а я ведь реально полез гуглить певицу Медиану, думая, что что-то пропустил :(

Да, а ещё её уволили из Виагры посреди исп.срока за домогательства к Константину Меладзе. Наверное, даже для него это было чересчур — девочка настолько хотела покорить Киев с его новостройками.

🕹 Пока мы искали, чья-то сестра/жена/любовница уже застолбила этот домен ник.

вместо того, шоб играться со средним арифметическим(шутка про «а в среднем мы едим голубцы») список зп сортируется и выбирается значения в позициях 1/4, ровно посередине(медиана) и на 3/4 от общей длины.
это позволяет нивелировать влияние аномальных значений(типа, одна огромная зп «ради шутки» или копеечные зп в каком-то НИИ), которые бы задели расчет среднего арифметического.

вообще, немного обидно выступать в роли гугла :(

Спорили о необходимости алгоритмов/структур данных для кодерка, коллеги? Получите и распишитесь.

Может он вайтишник, и оценивает перспективы входа и денежность вопроса?
А тут какие-то непонятные слова.

Граждане «вот сегодня проснулся и понял, что айти смысл всей моей жизни, всегда это нравилось» ©™®, другими не бывают.

Это же не про структуры данных даже, это вообще за гранью добра и зла, когда в школе рассказывают про то, что такое медиана? Мне кажется, класс пятый где-то.

медиана ≠ среднее арифметическое, если шо

Да ладно? спасибо за необходимое пояснение, коллега :)
На самом деле мне кажется что и про медиану и про среднее арифметическое рассказывали примерно одновременно.

и про кривую распределения?

Про криву розподілу щільності імовірності, да :)

Не, медиана это явно старшие классы были

Ну вот кстати по-моему нет. Я таки слово медиана впервые услышал в институте. А так математический класс, все дела.

Мода, медиана, еще какая вундервафля, все в университете. Хз, про какие школы тут рассказывают, в моем физмате такое не проходили.
Ватишники про 5 класс какие-то глупости заливают, скорее всего еще и школу прогуливали, страница 232: vshkole.com/...​b-polonskij-ms-yakir-2018

ммм, круто. прогрессирует программа-то

хм, я че-то думал, это задачник

Не все учились по дефолтным учебникам.
Нас, например, ещё в начальной школе по математике гоняли по задачнику Петерсон. А там и множества и еще куча всего, чего третьеклассникам вроде как не положено.

5 класс — ещё рано такое давать детям, разве что объяснение дать, как с шеренгой на уроке физкультуры. Есть ещё другой пример с пошлостями для детей младшего подросткового возраста.

Хотя нынешние дети в этом возрасте уже понимают проценты в практическом смысле этого слова, но определение из учебника дать не смогут.
Это как работать на работе и проходить собеседования: два разных навыка, две разных ветки талантов качать.

У нас в 8 класі комбінаторика була — перестановки, розміщення, комбінації, факторіали, рекурсію, навіть, згадували. Фізмат клас, звісно, але як на мене, то тема досить проста, бо по суті є прикладною. Та ж сама похідна, інтеграли і, особливо, дифури значно важче давалися.

дифури значно важче давалися.

к.м.к. в дифурах тяжёлая для восприятия сама концепция что результатом решения есть не конкретное чисто но функция

Расслабься

Я і не напрягався ніколи. Особливо, в школі.

Это же не про структуры данных даже, это вообще за гранью добра и зла

Ну так я это и имел в виду — что пока пипл спорит о том, нужна ли кодеркам хоть какая-то база CS, тут уже даже школьная база опасносте.

Про «не ту» я тоже помню, но я говорил именно о той :) пусть и с пятым классом гиперболизация вышла

каким боком матстатистика к алгоритмам? 0_0

Каким боком прикладная статистика к матстатистике? 0_0

«прикладная статистика» ⊆ матстатистика

Ну да, в прикладників свій хі-квадрат і сігми теж свої, вузьконаціональні.

Насчёт квартилей соглашусь. Но медиана в алгоритмах рассматривается.

в каких? только не говорите, что бинарный поиск :)

в каких?

Например en.wikipedia.org/wiki/Selection_algorithm
Я пишу на C++, и в его стандартной библиотеке есть такой замечательный алгоритм как nth_element (как раз реализация алгоритма по ссылке) — мне не раз приходилось использовать его в работе именно для поиска медианы в массиве.

Плюс, если человек изучал такой классический алгоритм как Quicksort, он наверняка видел одну из стратегий выбора опорного элемента, заключающуюся в нахождении медианы из трёх значений.

Это так, первое что пришло в голову. Уверен, таких примеров можно найти больше.

только не говорите, что бинарный поиск :)

Ой, а как связаны медиана и бинарный поиск? Чот не соображу (мб ещё утренний тупняк не прошёл), просветите.
Вроде ж бинарный поиск имеет смысл только с отсортированными последовательностями — но если последовательность уже отсортирована, там медиана находится тривиально без использования каких-либо специальных алгоритмов.

Підписатись на коментарі