Межквартильный размах (IQR)
Когда в наборе данных есть выбросы или экстремальные значения, мы суммируем типичное значение, используя медиану , а не среднее значение. Когда в наборе данных есть выбросы, изменчивость часто обобщается статистикой, называемой межквартильный диапазон , который представляет собой разницу между первым и третьим квартилями. Первый квартиль, обозначенный Q 1 , представляет собой значение в наборе данных, которое содержит 25% значений ниже ит. Третий квартиль, обозначенный Q 3 , представляет собой значение в наборе данных, которое содержит 25% значений выше it. Квартили можно определить, используя тот же подход, который мы использовали для определения медианы, но теперь мы рассматриваем каждую половину набора данных отдельно. Межквартильный размах определяется следующим образом:
Межквартильный размах = Q 3 -Q
При четном размере выборки:
Для выборки (n=10) медиана диастолического артериального давления составляет 71 (50 %). значений выше 71 и 50% ниже). Квартили можно определить так же, как мы определили медиану, за исключением того, что мы рассматриваем каждую половину набора данных отдельно.
Рис. 9. Межквартильный размах при четном размере выборки
Ниже медианы находятся 5 значений (нижняя половина), среднее значение равно 64, что соответствует первому квартилю. Есть 5 значений выше медианы (верхняя половина), среднее значение равно 77, что является третьим квартилем. Межквартильный диапазон 77 – 64 = 13; межквартильный диапазон представляет собой диапазон средних 50% данных.
———————————————— ————————————————— ————————————————— ————
При нечетном размере выборки:
При нечетном размере выборки медиана и квартили определяются таким же образом. Предположим, что в предыдущем примере самое низкое значение (62) было исключено, а размер выборки был n=9. Медиана и квартили указаны ниже.
Рисунок 10. Межквартильный размах при нечетном размере выборки
Когда размер выборки равен 9, медианой является среднее число 72. Квартили определяются таким же образом, рассматривая нижнюю и верхнюю половины соответственно. В нижней половине 4 значения, первый квартиль является средним из 2 средних значений в нижней половине ((64+64)/2=64). Тот же подход используется в верхней половине для определения третьего квартиля ((77+81)/2=79).).
Если в выборке нет выбросов, среднее значение и стандартное отклонение используются для суммирования типичного значения и изменчивости в выборке соответственно. Когда в выборке есть выбросы, медиана и межквартильный размах используются для суммирования типичного значения и изменчивости в выборке соответственно.
Заборы Тьюки Существует несколько методов определения выбросов в выборке. Очень популярный метод основан на следующем:
Выбросами являются значения ниже Q 1 -1,5(Q 3 -Q 1 ) или выше Q 3 +1,5(Q 3 -Q 1 7 ) или эквивалентно, значения ниже 1 7 19010 -1,5 IQR или выше Q 3 +1,5 IQR.Их называют заборами Тьюки. 6 Для диастолического артериального давления нижний предел составляет 64 — 1,5 (77–64) = 44,5, а верхний предел составляет 77 + 1,5 (77–64) = 96,5. Диастолическое артериальное давление колеблется от 62 до 81. Следовательно, нет никаких выбросов. Наилучшей сводкой типичного диастолического артериального давления является среднее значение (в данном случае 71,3), а наилучшей сводкой вариабельности является стандартное отклонение (s=7,2). |
В таблице 13 представлены средние значения, стандартные отклонения, медианы, квартили и межквартильные диапазоны для каждой из непрерывных переменных в подвыборке из n = 10 участников, присутствовавших на седьмом обследовании Framingham Offspring Study.
Таблица 13 – Сводная статистика по n=10 участникам
Характеристика | Среднее | Стандартное отклонение | медиана | Q1 | 3 кв. | иракских рупий |
---|---|---|---|---|---|---|
Систолическое кровяное давление | 121,2 | 11.1 | 122,5 | 113,0 | 127,0 | 14,0 |
Диастолическое кровяное давление | 71,3 | 7,2 | 71,0 | 64,0 | 77,0 | 13,0 |
Общий сывороточный холестерин | 202,3 | 37,7 | 206,5 | 163,0 | 227,0 | 64,0 |
Вес | 176,0 | 33,0 | 169,5 | 151,0 | 206,0 | 55,0 |
Высота | 67,175 | 4. 205 | 69.375 | 63,0 | 70,0 | 7,0 |
Индекс массы тела | 27,26 | 3.10 | 26,60 | 24,9 | 29,6 | 4,7 |
В таблице 14 показаны наблюдаемые минимальные и максимальные значения вместе с пределами для определения выбросов с использованием правила квартилей для каждой из переменных в подвыборке из n = 10 участников. Есть ли выбросы в какой-либо из переменных? Какие статистические данные наиболее подходят для обобщения среднего или типичного значения и дисперсии?
Таблица 14 – Пределы оценки выбросов в характеристиках, измеренных у n=10 участников
Характеристика | Минимум | Максимум | Нижний предел 1 | Верхний предел 2 |
---|---|---|---|---|
Систолическое кровяное давление | 105 | 141 | 92 | 148 |
Диастолическое кровяное давление | 62 | 81 | 44,5 | 96,5 |
Общий сывороточный холестерин | 150 | 275 | 67 | 323 |
Вес | 138 | 235 | 68,5 | 288,5 |
Высота | 60,75 | 72,00 | 52,5 | 80,5 |
Индекс массы тела | 22,8 | 31,9 | 17,85 | 36,65 |
1 Определяется Q 1 -1,5 (Q 3 -Q 1 )
2 Определено Q 3 +1,5 (Q 3 -Q 1 )
С тех пор. подвыборки из n = 10 участников, среднее значение и стандартное отклонение являются наиболее подходящими статистическими данными для суммирования средних значений и дисперсии, соответственно, каждой из этих характеристик.
Полная когорта Framingham
Для ясности мы до сих пор использовали очень маленькое подмножество когорты Framingham Offspring для иллюстрации расчетов сводной статистики и определения выбросов. Для вашего интереса в Таблице 15 показаны средние значения, стандартные отклонения, медианы, квартили и межквартильные диапазоны для каждой из непрерывных переменных, показанных в Таблице 13 в
Таблица 15 – Сводная статистика по выборке (n=3539) участников
Характеристика | Среднее
| Стандартное отклонение (с) | медиана | 1 кв. | 3 кв. | IQR |
Систолическое кровяное давление | 127,3 | 19,0 | 125,0 | 114,0 | 138,0 | 24,0 |
Диастолическое кровяное давление | 74,0 | 9,9 | 74,0 | 67,0 | 80,0 | 13,0 |
Общий сывороточный холестерин | 200,3 | 36,8 | 198,0 | 175,0 | 223,0 | 48,0 |
Вес | 174,4 | 38,7 | 170,0 | 146,0 | 198,0 | 52,0 |
Высота | 65,957 | 3,749 | 65. 750 | 63.000 | 68.750 | 5,75 |
Индекс массы тела | 28.15 | 5,32 | 27,40 | 24,5 | 30,8 | 6,3 |
Основываясь исключительно на сравнении средних и медианных значений в таблице 15 выше, есть ли свидетельства того, что одна или несколько характеристик имеют выбросы?
Верно
Ложно
В таблице 16 показаны наблюдаемые минимальные и максимальные значения, а также пределы для определения выбросов с использованием правила квартилей для каждой из переменных в полной выборке (n = 3539).).
Таблица 16 – Пределы оценки выбросов в характеристиках, представленных в таблице 15
|
|
| Заборы Тьюки | |
Характеристика | Минимум | Максимум | Нижний предел 1 | Верхний предел 2 |
---|---|---|---|---|
Систолическое кровяное давление | 81,0 | 216,0 | 78 | 174 |
Диастолическое кровяное давление | 41,0 | 114,0 | 47,5 | 99,5 |
Общий сывороточный холестерин | 83,0 | 357,0 | 103 | 295 |
Вес | 90,0 | 375,0 | 68,0 | 276,0 |
Высота | 55,00 | 78,75 | 54,4 | 77,4 |
Индекс массы тела | 15,8 | 64,0 | 15. 05 | 40,25 |
1 Determined byQ 1 -1.5(Q 3 -Q 1 )
2 Determined by Q 3 +1.5(Q 3 -Q 1 )
Щелкните под вопросом, чтобы просмотреть ответ. | |
Для этого содержимого требуется включенный JavaScript. |
вернуться наверх | предыдущая страница | следующая страница
Как обозначить диапазон из ячейки в Excel?
Индия — в Excel, где один обозначает диапазон отв excel, который обозначает диапазон от — Мы собираемся начать обсуждение того, ЧТО В EXCEL ОБОЗНАЧАЕТ ДИАПАЗОН ОТ, в соответствии с требованиями и комментариями наших читателей. Если вы хотите узнать об этой теме Индии, продолжайте читать и узнайте больше.
- О том, какой из них обозначает диапазон от до
- Сколько раз Сабха и Самити упоминаются в Ригведе?
- Сколько раз Сабха и Самити упоминаются в Ригведе?
- Что такое В Excel, какой из них обозначает диапазон от B1 до E5?
- Как в Excel, какой из них обозначает диапазон от A1 до D6
- Нажмите здесь, чтобы посетить домашнюю страницу
- Связано с тем, как обозначить диапазон из ячейки в Excel?
О том, что в excel обозначает диапазон от
Диапазон — это группа или блок ячеек на листе, которые выделены или выделены. Кроме того, диапазон может быть группой или блоком ссылок на ячейки, которые вводятся в качестве аргумента функции, используются для создания графика или используются для добавления данных в закладки.
Люди также читают:
Сколько раз Сабха и Самити упоминаются в Ригведе?
Создать именованный диапазон легко и быстро. Просто выберите диапазон ячеек и введите имя в поле имени.
Люди также читают:
Сколько раз Сабха и Самити упоминаются в Ригведе?
Какая функция в Excel сообщает, сколько имеется числовых записей.
Что такое В Excel, какой из них обозначает диапазон от B1 до E5?
В Excel B1: E5 используется для обозначения диапазона от B1 до E5. Объяснение: Диапазон используется для отображения данных, которые распределяются между двумя полями, т.е.
Вопрос : В Excel какой из них обозначает диапазон от B1 до E5 Тема : MS Excel.
MCQ: В Excel, какой из них обозначает диапазон от B1 до E5 – (A) B1 – E5 – (B) B1:E5.
Как в Excel, какой из них обозначает диапазон от A1 до D6
Ответ: Выберите диапазон, для которого вы хотите создать именованный диапазон в Excel. В диалоговом окне «Новое имя» введите имя, которое вы хотите присвоить выбранному диапазону данных.
В Excel какой из них обозначает диапазон от a1 до d6 См. ответ Advertisement Advertisement kings01 kings01 Ответ: Пожалуйста, сделайте как список брейнлистов.