Статистика формула медианы: Медиана в статистике — statanaliz.info

9. Медиана и мода. Асимметрия распределения. Статистика. Ответы на экзаменационные билеты

Медианой М е называется варианта, которая делит ранжированный вариационный ряд на две равные части, из которых значение одной половины меньше медианы, а значения другой – больше медианы.

Медиана для несгруппированных данных при нечетном числе вариантов ( n = 2k+ 1 ), определяется как M e = x k + 1, а при четном числе вариантов (n = 2k ), медиана определяется по формуле:

Медиана для сгруппированных данных рассчитывается по формуле:

где х 0 – это нижняя граница медианного интервала;

/– величина медианного интервала;

em  / 2 – полусумма всех частот;

S Me – накопленная частота, предшествующая медианному интервалу;

m Ме – частота медианного интервала.

Медиана рассчитывают наряду со средней величиной или вместо нее, когда в ряду данных присутствуют открытые или неравные интервалы.

Это не влияет на точность медианы, однако, влияет на точность величины.

Модой М 0 называется варианта, которая имеет наибольшую частоту по сравнению с другими частотами. В дискретно-вариационном ряду мода – это та варианта, которой соответствует наибольшая частота.

В интервальном вариационном ряду с равными интервалами моду определяют по формуле:

где х 0 – это нижняя граница модального интервала;

h – величина модального интервала;

d 1 – разность между частотами модального и предмодального интервалов;

d 2 – разность между частотами модального и послемодального интервалов.

Мода рассчитывается в тех случаях, когда невозможно или нецелесообразно рассчитывать среднюю величину по обычным формулам.

Асимметрией распределения называется несоразмерность, т. е. нарушение соответствия в расположении частей одного целого относительно средней линии или центра.

На графике асимметрия распределения определяется как вытянутость одной из ветвей распределения. Асимметрия распределения возникает в связи с различной частотой появления вариант больших или меньших моды (т. к. мода соответствует вершине распределения) под влиянием преобладающего действия определенных факторов. Таким образом, наличие асимметрии говорит о неустойчивости распределения совокупности в связи с преобладающим воздействием какой-либо группы факторов.

Асимметрия распределения легко обнаруживается и измеряется на основе разницы между средней величиной и модой. В умеренно асимметричных распределениях мода и средняя образуют интервал, в пределах которого находится медиана. Если разделить этот интервал на 3, то медиана отстоит от моды на 2/3, а от средней – на 1/3.

Для измерения асимметрии рядов распределения применяется эмпирический коэффициент асимметрии:

где x— – простая средняя;

М о– мода;

G – среднеквадратическое отклонение.

Численное описание данных — Questionstar

5.5.1 Описательная статистика: Основные виды представления данных

5.1.3 Численное описание данных

 

Меры центральной тенденции

Среднее (арифметическое)

 

 

 

Среднее это «центр тяжести», как точка баланса

 

Преимущества:

— удобная мера для получения представления о наборах данных, которые легко объединяются

— легко рассчитать: просто сложить и разделить

— Интуитивно – это число в середине, которое «тянут вверх» большие числа и «тянут вниз» маленькие числа.

Недостатки:

— среднее может быть легко отклонено нетипичными (выпадающими, экстремальными) значениями – плохо характеризует выборки с большой дисперсией.

— среднее значение 100, 200 и -300 = 0, что не интуитивно

 

Медиана

 

 

Медиана это элемент в середине

 

Преимущества:

— нечувствительна к экстремальным значениям, часто описывает группу более точно

— разбивает данные на две группы с равным количеством элементов

 

Недостатки:

— сложнее вычислить: надо сначала отсортировать данные

— менее известна; если сказать «медиана», многие подумают, что Вы имеете ввиду «среднее»

 

 

Мода

Формула моды имеет следующий вид.

Где Мо – мода,

x0 – значение начала модального интервала,

h – размер модального интервала,

fМо – частота модального интервала,

fМо-1 – частота интервала, находящего перед модальным,

fМо1 – частота интервала, находящего после модального.

 

Мода это самое частое наблюдение

 

Преимущества:

— хорошо подходит для ситуаций однозначного выбора типа «голосования» (что выбрать – то или это?), в особенности для номинальных шкал

— показывает выбор большинства респондентов (в то время как среднее может указывать на элемент, который никто не предпочитает).

— легка для понимания

 

Недостатки:

— требует больше усилий для вычисления (придется подсчитывать голоса за каждый элемент)

— «победитель получает все» – среднего не дано, нет компромиссного пути

 

 

Меры центральной тенденции:


как среднее и медиана описывают форму распределения

Левосторонняя асимметрия

 

Симметричное распределение

 

Правосторонняя асимметрия

 

Меры рассеяния

Дисперсия среднее значение квадрата отклонения от среднего

 

Дисперсия генеральной совокупности:

 

Дисперсия выборки:

 

 

Рост членов олимпийской команды США по баскетболу (2008г)

 

Почему дисперсия?

 

Среднее – это точка баланса. Поэтому среднее отклонение от среднего всегда равно нулю.

При вычислении дисперсии все отклонения возводятся в квадрат, чтобы положительные отклонения не компенсировали отрицательные отклонения.

 

Меры рассеяния

Стандартное отклонение:

 

Стандартное (среднеквадратическое) отклонение сохраняет единицы измерения исходной величины

 

У какого набора данных стандартное отклонение больше?

 

Взаимосвязь между стандартным отклонением и формой нормального распределения

Медианные понятия и определения

По вашему доходу вы входите в верхнюю половину всех получателей дохода? Вы можете найти ответ, сравнив свой доход со средним доходом.
 

Но что такое медиана? Это «среднее значение» в группе после того, как все наблюдения расположены в порядке возрастания, т. е. от меньшего к большему. По крайней мере половина наблюдений равна или меньше медианы, и по крайней мере половина измерений равна или больше медианы. Медиана отделяет нижнюю половину наблюдений от верхней половины.

Как найти медиану?

Шаг 1: Имея набор данных (например, заработную плату), расположите числа в порядке возрастания , т. е. от меньшего к большему.

 

Шаг 2:

Если количество наблюдений нечетное , число в середине списка является медианой. Это можно найти, взяв значение (n+1)/2 -го члена, где n — количество наблюдений.

В противном случае, если число наблюдений равно даже , то медиана представляет собой простое среднее двух средних чисел. В расчетах медиана представляет собой простое среднее n/2 -го и (n/2 + 1) -го членов.

 

 

Поскольку имеется четыре наблюдения (т. е. четное число), медиана представляет собой простое среднее 2-го и 3-го самых низких заработных плат людей. Следовательно,

Медиана = ½ (заработная плата лица D + заработная плата лица C)

= ½ (3400 + 5000) = 4200 долларов США.

 

Пример 1: Кто посередине? (Нечетное число наблюдений)

 

Чтобы сравнить возрастной профиль своих сотрудников с возрастным профилем других компаний отрасли, ваша компания Middle World Co. попросила вас рассчитать средний возраст ваших коллег по работе.

 

 

Каков средний возраст этих девяти рабочих?

 

Решение: Поскольку число наблюдений нечетное, а возраст расположен от самого младшего к самому старшему (т. не нанимает новых рабочих и ни один рабочий не увольняется, возраст Люциуса всегда будет средним, независимо от того, сколько лет прошло.


Пример 2: Сравнение заработной платы (четное число наблюдений)

 

Предположим, у нас есть месячная заработная плата 10 сотрудников компании. Как бы вы нашли медианную заработную плату?

 

 

Решение: Обратите внимание, что мы расположили их заработную плату от самой низкой к самой высокой. Этот рейтинг поможет нам определить медиану. Используя метод, введенный ранее, медиана вычисляется путем взятия простого среднего из (n/2)-го = (10/2)-го = 5-го и (n/2 + 1)-го = (10/2+). 1)-е = 6-е наблюдения.

 

Следовательно, медиана равна 

 

Чем медиана отличается от среднего?

Обратите внимание, что среднее значение составляет 7 214 долларов США, что намного выше среднего значения. Эта разница в значениях показывает, что на медиану не влияет небольшое количество экстремальных значений. (Экстремальные значения здесь, или выбросы, составляют 20 000 и 25 000 долларов США.) 

Медиана — Определение, Формула, Как найти медиану, Пример

Медиана — это центральное или среднее значение в заданном наборе чисел или данных. В математике используются три меры, чтобы найти среднее значение для данного набора чисел. Это среднее, медиана и мода. Эти три меры называются мерами центральной тенденции. Среднее значение дает среднее значение предоставленных данных. Медиана определяет среднее значение данных. Режим определяет повторяющееся значение заданных данных. Здесь мы обсудим одну из мер, называемую «медианой». Объясняется определение медианы, ее формула и примеры.

Содержание
  • Что такое медиана?
  • Определение
  • Формула медианы для сгруппированных данных
  • Как найти медиану?
  • Необработанные данные медианы
  • Преимущества медианы
  • Недостатки медианы
  • Использование медианы
  • Решенный пример
  • Часто задаваемые вопросы (FAQ)

Медиана — это одна из трех мер центральной тенденции. При описании набора данных определяется среднее положение данного набора данных. Это определяется как мера центральной тенденции. Тремя наиболее распространенными показателями центральной тенденции являются среднее значение, медиана и мода.

Определение

В математике медиана определяется как среднее значение упорядоченного списка чисел. Найдите среднее число, выстроив числа в ряд. Числа отсортированы в порядке возрастания. После того, как числа расположены, среднее число называется медианой набора данных.

Медианная формула для сгруппированных данных

Медиана рассчитывается с использованием следующих шагов, когда данные непрерывны и представлены в виде частотного распределения.

  • Шаг 1: Найдите общее число. наблюдений обозначим через n.
  • Шаг 2: Определите размер класса (h), а затем разделите данные на разные классы.
  • Шаг 3: Найдите суммарную частоту каждого класса.
  • Шаг 4: Определите класс, к которому относится медиана. (Средний класс — это класс, в котором находится n/2.)
  • Шаг 5: Найдите нижнюю границу среднего класса (l) и кумулятивную частоту класса, предшествующего среднему классу (c).

Как найти медиану?

Мы используем формулу медианы, чтобы найти среднее значение данных. Мы можем найти среднее значение для набора разгруппированных данных, выполнив следующие шаги.

  • Шаг 1: Разместите указанные данные в порядке возрастания.
  • Шаг 2:
    Подсчитайте общее количество наблюдений.
  • Шаг 3: Если заданное количество наблюдений нечетное, используйте формулу: Медиана = [(n + 1)/2]-й член
  • Шаг 4: Если заданное количество наблюдений четное, используйте формулу: Медиана = [(n/2)-й член + (n/2 + 1)-й член]/2

Необработанные данные медианы

  1. Расположите данные в порядке возрастания.
  2. Подсчитайте нет. наблюдения (Пусть будет n наблюдений)
  • Если n нечетно, то медиана = значение наблюдения.
  • Если n четно, то медиана — это среднее арифметическое (n/2) наблюдения и наблюдения.

Преимущества медианы

  1. Он жестко определен, легко разбирается и вычисляется.
  2. Не все зависит от экстремальных значений.
  3. Его можно расположить графически, даже если класс — интервалы неравны.
  4. В некоторых случаях это можно определить даже при осмотре.

Недостатки медианы

  1. В случае четного числа наблюдений медиана не может быть точно определена.
  2. Он не основан на всех наблюдениях.
  3. Он не подлежит алгебраической обработке.
  4. На него сильно влияют колебания выборки.

Использование медианы

  1. Медиана — это единственное среднее значение, которое можно использовать при работе с качественными данными, которые не могут быть измерены количественно, но могут быть расположены в порядке возрастания или убывания величины.
  2. Он используется для определения типичного значения в задачах, касающихся заработной платы, распределения богатства и т. д.

Решенный пример

Q1. Ниже приведены сроки службы в часах 15 компонентов авиационного двигателя. Найдите медиану:

715, 724, 725, 710, 729, 745, 649, 699, 696, 712, 734, 728, 716, 705, 719

Ответ. Расположение данных в порядке возрастания

644. 696, 705, 710, 712, 715, 716, 719, 724, 725, 728, 729, 734, 745

N = 15

Итак, медиана = наблюдение

= (15 + 1/2) й наблюдение

= 716.

Медиана интервальных данных (сгруппировано)

Медиана = l + [(n/2−c)/f] × h

l = нижний предел среднего класса,

N = общее количество наблюдений

C = кумулятивная частота класса, предшествующего среднему классу

h = размер среднего класса

f = частота среднего класса.

Q2. Найдите медианную заработную плату рабочего на указанную дату.

Поденная заработная плата (в рупиях) Число рабочих Суммарная частота
125 6 6
130 20 26
135 24 50
140 28 78
145 15 93
150 4 97
160 2 99
180 1 100

N = 100 (четное)

= 137,50

Часто задаваемые вопросы (FAQ)

Q1. Что представляет собой n в медианной формуле?

Ответ.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *