Дисперсия формула excel: Как рассчитать выборку и дисперсию населения в Excel

Содержание

Как рассчитать дисперсию в Excel (с шагами и примерами) • BUOM

Microsoft Excel предоставляет широкий спектр инструментов и функций для анализа данных и статистической оценки. Одной из распространенных функций является дисперсия, которую можно вычислить с помощью команд VAR.P и VAR.S в зависимости от типа измеряемых данных.

При применении формул дисперсии в Excel важно применять правильную формулу либо для выборки, либо для всей совокупности. В этой статье мы обсудим, что представляет собой дисперсия в статистике, общие функции, которые вы можете использовать в Excel, и как рассчитать дисперсию в Excel с примерами, которые помогут вам.

Что представляет собой дисперсия в статистике?

Дисперсия является мерой вариации в статистике и показывает, насколько далеко друг от друга находится каждая точка в наборе данных. Измерение дисперсии также может сказать вам, насколько далеко значения данных от среднего значения, которое представляет собой среднее значение для описания определенного параметра выборки или генеральной совокупности. В математике вы возводите в квадрат разности значений данных и среднего значения и берете среднее значение этих квадратов разностей, чтобы получить дисперсию.

Типы дисперсии

Вы можете измерить дисперсию для всей совокупности или для выборки совокупности, и каждый тип метрики дисперсии использует свою собственную функцию в Excel:

Программы для Windows, мобильные приложения, игры — ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале — Подписывайтесь:)

  • Дисперсия населения: Дисперсия населения измеряет всю совокупность и использует командную функцию VAR.P() в Excel для расчета дисперсии, игнорируя текстовые и логические данные.

  • Выборочная дисперсия. Выборочная дисперсия представляет собой вариацию выборки генеральной совокупности и использует командную функцию VAR.S() в Excel для расчета дисперсии без учета текстовых и логических данных.

  • Измерения дисперсии для логических и текстовых входных данных. Вы можете измерить выборочную дисперсию и дисперсию для генеральной совокупности, в которой вы также хотите оценить текстовые и логические аргументы. Excel использует VARA() для дисперсии выборки и VARPA() для дисперсии генеральной совокупности, где у вас есть логические и текстовые входные данные, такие как «Истина = 1, Ложь = 0» или «Ввод = ноль».

Как рассчитать дисперсию в Excel для населения

В приведенных ниже шагах показано, как рассчитать дисперсию в Excel при оценке всей совокупности:

1. Введите и упорядочите данные

Импортируйте свои данные на пустой лист Excel и организуйте их в соответствии с вашими потребностями в оценке.

Например, предположим, что профессор вводит классные оценки за задание. Класс представляет все население, и профессор организует столбец A для имен учащихся и столбец B для оценок. Исследователь данных, изучающий алгоритмы машинного обучения, может использовать различные входные и организационные методы для анализа дисперсии, поскольку их совокупность данных может быть большой.

В обоих примерах функция VAR.P необходима, поскольку она вычисляет дисперсию для всего населения.

2. Создайте отдельную ячейку для формулы

Используйте отдельный столбец и ячейку для ввода функциональной команды. В примере с экзаменационными баллами профессора они могут использовать ячейку в столбце C или D для перечисления расчета дисперсии. После выбора ячейки, которую вы хотите использовать для командной функции, пометьте столбец для вашего расчета «Дисперсия» для пояснения.

3. Введите функцию VAR.P

В столбце, который вы называете «Дисперсия», выберите ячейку и введите командную функцию для дисперсии населения. Введите имена ячеек, используя синтаксис =VAR.P(ячейка:ячейка).

В качестве примера предположим, что результаты предыдущих экзаменов отображаются в ячейках с B2 по B207. Если профессор вводит формулу в ячейку C2, синтаксис приводит к =VAR.P(B2:B207).

4. Оцените результаты

В зависимости от типа проводимого анализа данных оценка дисперсии генеральной совокупности может указывать на несколько факторов. Если дисперсия больше, это указывает на то, что данные дальше от среднего. Меньшее значение указывает на то, что данные ближе к среднему значению. Нулевая дисперсия показывает, что точки данных имеют значение, равное среднему значению.

Как рассчитать выборочную дисперсию в Excel

Используйте следующие шаги для расчета выборочной дисперсии в Excel:

1. Выберите выборку населения

Для использования функции VAR.S требуется меньшая выборка из совокупности.

Например, в старшей школе с 1500 учениками старшего класса учитель может выбрать случайную выборку из 150 экзаменационных баллов, чтобы оценить тенденции в тестировании. Когда вы выбираете группу образцов, введите данные в новый лист Excel.

2. Расположите данные в электронной таблице

Отсортируйте данные образца в электронной таблице, используя соответствующие столбцы, ячейки и метки. Используя предыдущий пример, преподаватели могут упорядочить 150 выборочных оценок, используя только один столбец для анонимности или два столбца для перечисления имен учащихся и соответствующих им оценок. Вы также можете расположить свои данные в порядке возрастания или убывания с помощью функций сортировки Excel.

3. Выберите отдельную ячейку для формулы

Под новым столбцом выберите ячейку для командной функции.

В выборке из 150 баллов учителя выбирают ячейку в столбце D, чтобы ввести формулу. Назовите новый столбец «Дисперсия», чтобы отличить функцию от остальных ваших данных.

4. Войдите в функцию VAR.S.

Используя синтаксис =VAR.S(ячейка:ячейка), введите командную функцию для ячеек, которые вы оцениваете.

Например, предположим, что вы отслеживаете дневную температуру в течение одного года и хотите получить дисперсию за два конкретных месяца. Если данные за один из месяцев находятся в ячейках с B2 по B32, а данные за другой месяц находятся в ячейках с C2 по C33, вы должны ввести формулу команды как =VAR.S(B2:B32;C2:C33)**.

5. Оцените выборочную дисперсию

Выборочная дисперсия является интегральной при изучении очень больших популяций, поскольку она обеспечивает оценку параметров, которые могут быть справедливы для всей популяции. Таким образом, оценка выборочной дисперсии может дать вам подробное представление о закономерностях и поведении переменных, которые вы изучаете в совокупности.

Как и в случае с дисперсией генеральной совокупности, меньшая дисперсия предполагает, что данные выборки ближе к среднему значению выборки, а большая дисперсия указывает на то, что данные выборки дальше от среднего значения выборки. Нулевая дисперсия по-прежнему показывает значения данных, равные выборочному среднему.

Важность расчетов дисперсии

Дисперсия является важным статистическим показателем, поскольку она предоставляет информацию для различных тем анализа данных и полезна, когда:

  • Измерение частоты ошибок: дисперсия важна для понимания частоты ошибок при оценке статистических данных. Коэффициент ошибки показывает, насколько вероятно, что нулевая гипотеза неверна.

  • Выявление причин вариации. Расчет вариации также важен для понимания того, что вызывает большие вариации в наборе данных. Например, определение того, что такие факторы, как возраст и пол, влияют на рост взрослого человека, может помочь организовать выборочные данные для дополнительного анализа.

  • Расчет коэффициента вариации. Дисперсия дает результат, который можно использовать для определения коэффициента вариации. Этот показатель важен для понимания связи между переменными в разных наборах данных.

  • Оценка различий между переменными: расчеты дисперсии также могут иметь решающее значение для понимания того, чем отличаются разные группы населения. Многие аналитики используют дисперсию, чтобы понять различия в финансовых показателях, эффективности продаж и операционной производительности в бизнес-среде.

  • Установление однородности для параметрической оценки: дисперсия — это измерение, которое применяется к логической статистике, поэтому для ее установления не требуются параметры. Хотя дисперсия является непараметрическим вычислением, ее можно использовать для установления критериев для выполнения параметрических оценок в разных группах.

Примеры

Рассмотрим следующие примеры расчета дисперсии с использованием команд функции VAR.P и VAR.S:

Пример дисперсии населения

Учитель хочет рассчитать дисперсию экзаменационных баллов своего класса. Класс представляет все население, поэтому учитель использует функцию VAR.P в своей электронной таблице Excel. Вводя имена учащихся в столбец A, 9 баллов в столбец B и формулу в столбец C, она вычисляет дисперсию следующим образом:

A B C Студент 1 95 =VAR.P(B2:B10) = 58,09876543 Студент 2 88 Студент 3 73 Студент 4 79 Студент 5 84 Студент 6 98 Студент 7 92 Студент 8 86 Студент 9 80

Образец примера отклонения

Ученый-эколог хочет оценить изменения рН воды за последние шесть месяцев. Поскольку данные о населении содержат примерно 182 дня значений pH, ученый берет образец одного значения для каждого из месяцев, в которые они отслеживали качество воды.

Ученый вводит свои данные в электронную таблицу и использует функцию VAR.S для расчета дисперсии выборочных данных. С месяцами в столбце A, данными pH в столбце B и функцией дисперсии в столбце C расчет приводит к следующему результату:

Проба Месяц Отклонение рН Март 5,5 =VAR.S(B2:B7) = 0,224 Апрель 6,1 Май 6,8 Июнь 6,6 Июль 5,9 Август 6,3

Обратите внимание, что ни одна из компаний, упомянутых в этой статье, не связана с компанией Indeed.

Как найти дисперсию в Excel

Выборка данных часто суммируется с использованием двух статистических данных: ее среднего значения и показателя ее разброса. Дисперсия и стандартное отклонение являются показателями того, насколько они распространены. В Excel есть несколько функций для расчета дисперсии и стандартного отклонения. Ниже мы объясним, как решить, какой из них использовать, и как найти отклонение в Excel .

Инструкции в этой статье относятся к Excel 2019, 2016, 2013, 2010, 2007, Excel для Office 365 и Excel Online.

Обобщающие данные: центральная тенденция и разброс

Центральная тенденция говорит вам, где находится середина данных, или среднее значение. Некоторые общие показатели центральной тенденции включают среднее значение, медиану и моду.

Распространение данных означает, насколько отдельные результаты отличаются от средних. Простейшей мерой разброса является диапазон, но он не очень полезен, потому что он имеет тенденцию к увеличению по мере того, как вы выбираете больше данных. Дисперсия и стандартное отклонение являются гораздо лучшими показателями разброса. Дисперсия — это просто квадрат стандартного отклонения. 

Формула стандартного отклонения и дисперсии

Как стандартное отклонение, так и дисперсия являются способом измерения того, как далеко в среднем каждая точка данных от среднего значения.

Если бы вы рассчитывали их вручную, вы бы начали с определения среднего значения для всех ваших данных. Затем вы найдете разницу между каждым наблюдением и средним, возведите в квадрат все эти различия, сложите их все вместе, а затем разделите на число наблюдений.

Это даст дисперсию, своего рода среднее для всех квадратов различий. Взятие квадратного корня из дисперсии — это способ исправить тот факт, что все различия были возведены в квадрат. Это называется стандартным отклонением, и это то, что вы обычно будете использовать для измерения разброса данных. Если это сбивает с толку, не волнуйтесь, поэтому мы собираемся заставить Excel выполнить фактические вычисления.

Образец или Население?

Часто ваши данные будут выборкой, взятой у некоторого более крупного населения. Вы хотите использовать эту выборку для оценки дисперсии или стандартного отклонения для совокупности в целом. В этом случае вместо деления на число наблюдений ( n ) вы делите на n -1. Эти два разных типа расчета имеют разные функции в Excel:

  • Функции с P : дает стандартное отклонение для фактических значений, которые вы ввели. Они предполагают, что ваши данные — это целое население (делится на n ).
  • Функции с S : дает стандартное отклонение для всей совокупности, предполагая, что ваши данные являются выборкой, взятой из нее (делением на n -1). Это может сбивать с толку, так как эта формула дает вам оценку дисперсии для населения; S указывает, что набор данных является выборкой, но результат для населения.

Использование формулы стандартного отклонения в Excel

Чтобы рассчитать стандартное отклонение в Excel, выполните следующие действия.

  1. Введите свои данные в Excel. Прежде чем вы сможете использовать функции статистики в Excel, вам нужно, чтобы все ваши данные были в диапазоне Excel: столбец, строка или групповая матрица столбцов и строк. Вы должны быть в состоянии выбрать все данные без выбора других значений.

    Для остальной части этого примера предполагается, что ваши данные находятся в диапазоне A1: A20.

  2. Если ваши данные представляют всю совокупность, введите формулу » = STDEV.P (A1: A20) «. В качестве альтернативы, если ваши данные представляют собой выборку из какой-то более многочисленной группы населения, введите формулу » = STDEV.P (A1: A20) «.

    Если вы используете Excel 2007 или более раннюю версию или хотите, чтобы ваш файл был совместим с этими версиями, используйте формулы «= STDEVP (A1: A20)», если ваши данные относятся ко всему населению; «= STDEV (A1: A20)», если ваши данные являются выборкой из большей части населения.

  3. Стандартное отклонение будет отображаться в ячейке.

Как рассчитать дисперсию в Excel

Расчет дисперсии очень похож на расчет стандартного отклонения.

  1. Убедитесь, что ваши данные находятся в одном диапазоне ячеек в Excel.

  2. Если ваши данные представляют всю совокупность, введите формулу » = VAR.P (A1: A20) «. В качестве альтернативы, если ваши данные представляют собой выборку из какой-то более многочисленной группы населения, введите формулу » = VAR.S (A1: A20) «.

    Если вы используете Excel 2007 или более раннюю версию или хотите, чтобы ваш файл был совместим с этими версиями, используются следующие формулы: «= VARP (A1: A20)», если ваши данные относятся ко всему населению, или «= VAR (A1 : A20), «если ваши данные являются выборкой из более крупного населения.

  3. Дисперсия для ваших данных будет отображаться в ячейке.

Дисперсия

в Excel: как рассчитать

Дисперсия — это измерение разброса между числами в наборе данных. Дисперсия измеряет, насколько далеко каждое число в наборе от среднего. Вы можете использовать Microsoft Excel для расчета дисперсии данных, которые вы ввели в электронную таблицу.

Как рассчитать дисперсию в Excel

Чтобы рассчитать дисперсию в Excel, вам необходимо иметь набор данных, уже введенный в программное обеспечение. Получив данные, вы можете выбрать формулу в зависимости от типа имеющегося у вас набора данных и типа дисперсии, которую необходимо рассчитать.

Существует несколько различных вариантов формулы для расчета дисперсии в Excel:

  • =VAR.S(выбрать данные)
  • =VARA(выбрать данные)
  • =VAR.P(выбрать данные)

Для каждого из них вы должны выбрать диапазон ячеек, которые вы хотите использовать после круглых скобок. Например, вы можете ввести =VAR.S(B12:B32), чтобы найти дисперсию данных в ячейках с B12 по B32.

Важно

Вы должны начать с «=», чтобы Excel знал, что вы вводите формулу.

Важно знать, с каким типом данных вы работаете, чтобы выбрать правильную форму. Например, если ваш набор данных содержит какие-либо текстовые значения, VARA будет интерпретировать текст как 0, ИСТИНА как 1 и ЛОЖЬ как 0, тогда как VAR.S игнорирует все значения, кроме чисел. Это изменит результат вашего расчета дисперсии.

VAR.P, с другой стороны, предназначен для расчета дисперсии в популяции на основе всего набора чисел. Если у вас нет всей совокупности данных для использования, вы должны использовать VAR.S в своей формуле.

В общем, VAR.S — это формула, на которую чаще всего следует полагаться при расчете дисперсии в Excel.

Что такое дисперсия?

Что вы на самом деле рассчитываете, когда используете Excel для поиска дисперсии набора данных?

Используя диаграмму набора данных, мы можем наблюдать, какова линейная связь различных точек данных или чисел.

Мы делаем это, рисуя линию регрессии, которая пытается минимизировать расстояние любой отдельной точки данных от самой линии. На приведенной ниже диаграмме точки данных — это синие точки, а оранжевая линия — это линия регрессии. Красные стрелки — это расстояние от наблюдаемых данных и линии регрессии.

Изображение Джули Бэнг © Investopedia 2020

Когда мы вычисляем дисперсию, мы спрашиваем, учитывая взаимосвязь всех этих точек данных, какое расстояние мы ожидаем от следующей точки данных? Это «расстояние» называется ошибкой, и именно его измеряет дисперсия.

Сама по себе дисперсия не всегда полезна, потому что у нее нет единицы измерения, что затрудняет ее измерение и сравнение. Однако квадратный корень из дисперсии — это стандартное отклонение, и это практично и полезно в качестве измерения.

Пример расчета дисперсии в Excel

В приведенном ниже примере мы рассчитаем дисперсию 20-дневной ежедневной доходности в очень популярном биржевом фонде (ETF) под названием SPY, который инвестирует в S&P 500. Мы будем использовать следующую формулу:

=VAR.S(выберите данные)

В этом случае, если бы у нас была вся доходность в истории SPY ETF в нашей таблице, мы могли бы использовать измерение населения VAR.P. Однако, поскольку мы измеряем только последние 20 дней, чтобы проиллюстрировать концепцию, мы будем использовать VAR.S.

Как видите, рассчитанное значение дисперсии 0,000018674 само по себе мало что говорит нам о наборе данных. Если бы мы извлекли из этого значения квадратный корень, чтобы получить стандартное отклонение доходности, это было бы более полезно.

Функция VAR — служба поддержки Microsoft

Excel для Microsoft 365 Excel для Microsoft 365 для Mac Excel для Интернета Excel 2021 Excel 2021 для Mac Excel 2019 Excel 2019 для Mac Excel 2016 Excel 2016 для Mac Excel 2013 Excel 2010 Excel 2007 Excel для Mac 2011 Excel Starter 2010 Дополнительно… Меньше

Оценивает дисперсию на основе выборки.

Важно: Эта функция была заменена одной или несколькими новыми функциями, которые могут обеспечить повышенную точность и имена которых лучше отражают их использование. Хотя эта функция по-прежнему доступна для обратной совместимости, вам следует рассмотреть возможность использования новых функций с этого момента, так как эта функция может быть недоступна в будущих версиях Excel.

Дополнительные сведения о новой функции см. в разделе Функция VAR.S.

Синтаксис

ВАР(число1,[число2],…)

Синтаксис функции VAR имеет следующие аргументы:

Замечания

  • VAR предполагает, что его аргументы являются выборкой генеральной совокупности. Если ваши данные представляют всю совокупность, вычислите дисперсию с помощью VARP.

  • Аргументы могут быть либо числами, либо именами, массивами или ссылками, содержащими числа.

  • Подсчитываются логические значения и текстовые представления чисел, которые вы вводите непосредственно в список аргументов.

  • Если аргумент является массивом или ссылкой, учитываются только числа в этом массиве или ссылке. Пустые ячейки, логические значения, текст или значения ошибок в массиве или ссылке игнорируются.

  • Аргументы, которые являются значениями ошибок или текстом, который не может быть преобразован в числа, вызывают ошибки.

  • Если вы хотите включить логические значения и текстовые представления чисел в ссылку как часть вычисления, используйте функцию VARA.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *