Рассчитать коэффициент корреляции: Как рассчитать коэффициент корреляции Пирсона вручную

Содержание

формула и шаги • BUOM

30 августа 2021 г.

Если вы работаете в сфере финансов или экономики, расчет коэффициента корреляции может помочь вам лучше проанализировать и понять набор переменных. Если вы владелец бизнеса, определение этого значения может помочь вам определить будущие продажи вашей компании, а также общие тенденции рынка. В этой статье мы определяем, что такое коэффициент корреляции, и представляем вам шаги для его расчета.

Что такое коэффициент корреляции?

Коэффициент корреляции относится к измерению силы между двумя отдельными переменными. В то время как корреляция определяет отношение между этими двумя переменными, коэффициент корреляции связан с состоянием отношения. Коэффициент корреляции часто обозначается как r. Как только вы узнаете, какие переменные или данные вы используете, вы сможете выбрать наиболее подходящий тип коэффициента корреляции. Существует три типа коэффициентов корреляции, и они следующие:

  • Корреляция Пирсона: эта корреляция измеряет линейную связь между двумя переменными. Тем не менее, он не может определить разницу между независимыми и зависимыми переменными. Чем сильнее корреляция между этими двумя наборами данных, тем ближе она будет к +1 или -1. Это наиболее часто используемый тип коэффициента корреляции.

  • Корреляция Спирмена: корреляция Спирмена используется для определения монотонной связи между двумя наборами данных. Это измерение основано на ранжированных значениях для каждого набора данных и использует искаженные или порядковые переменные, а не те, которые имеют нормальное распределение.

  • Корреляция Кендалла: Корреляция Кендалла измеряет силу зависимости между двумя наборами данных.

Когда вы начнете понимать коэффициент корреляции, важно рассмотреть значение его значений как таковых:

Программы для Windows, мобильные приложения, игры — ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале — Подписывайтесь:)

  • Коэффициент корреляции представляет собой значение от -1 до 1.

  • Когда коэффициент корреляции близок к нулю, связь между этими переменными считается слабой.

  • Если значения положительные, корреляция положительная.

  • Аналогично, если значения отрицательные, корреляция отрицательна.

  • Корреляция -1 и корреляция 1 считаются идеальными корреляциями.

Как рассчитать коэффициент корреляции

Если вы хотите измерить силу связи между двумя переменными, вы можете сделать это с помощью расширенного или онлайн-калькулятора. Вы также можете использовать свои математические способности и вычислить его вручную. При расчете коэффициента корреляции вручную следует иметь в виду следующие представления:

  • (x(i), y(i)) = пара данных

  • x̅ = среднее значение x (i)

  • ȳ = среднее значение y (i)

  • s(x) = стандартное отклонение первых координат x(i)

  • s(y) = стандартное отклонение второй координаты y(i)

Вот шаги, которые необходимо предпринять для расчета коэффициента корреляции:

  1. Определите свои наборы данных.

  2. Рассчитайте стандартизированное значение для ваших переменных x.

  3. Рассчитайте стандартизированное значение для ваших переменных y.

  4. Умножьте и найдите сумму.

  5. Разделите сумму и определите коэффициент корреляции.

1. Определите наборы данных.

Начните расчет с определения того, какими будут ваши переменные. Как только вы узнаете свои наборы данных, вы сможете включить эти значения в свое уравнение. Разделите эти значения переменными x и y.

2. Рассчитайте стандартизированное значение для ваших переменных x.

После того, как вы определили свои наборы данных, используйте следующее уравнение для расчета стандартизированного значения для каждой переменной x(i):

(z(x))(i) = (x(i) — x̅) / s(x)

3. Рассчитайте стандартизированное значение для ваших переменных y.

Теперь, когда вы определили стандартизированное значение для каждого x(i), сделайте то же самое для каждого y(i) со следующим уравнением:

(z(y))(i) = (y(i) — ȳ) / s(y)

4. Умножьте и найдите сумму.

Теперь, когда у вас есть стандартизированные значения, перемножьте их. Например:

(г(х))(я) * (г(у))(я)

После того, как вы умножили значения, сложите их вместе, чтобы найти сумму.

5. Разделить сумму и определить коэффициент корреляции.

На следующем шаге мы будем использовать n для представления общего количества точек в этой паре данных. Разделите сумму из четвертого шага на n — 1. Получится коэффициент корреляции.

Пример коэффициента корреляции

Чтобы лучше понять коэффициент корреляции, рассмотрим следующий пример:

Допустим, у вас есть магазин одежды, и вы пытаетесь определить, будете ли вы продавать больше купальных костюмов летом. Хотя ваш магазин открыт круглый год, вы можете предположить, что в более жаркие дни купальных костюмов будет продано больше. С другой стороны, покупатели могут быть более склонны покупать купальные костюмы зимой, когда на них, скорее всего, будет скидка. Чтобы рассчитать коэффициент корреляции, вам нужно определить набор данных о среднем количестве продаж купальных костюмов и самых высоких температурах в течение лета. Тем не менее, продажи купальных костюмов и температура будут двумя переменными, которые вы будете использовать в своих расчетах.

Теперь, когда мы знаем наши переменные, рассмотрим следующие данные:

  • Вы совершили 5 продаж купальных костюмов при температуре 70 градусов.

  • Вы совершили 10 продаж купальных костюмов, когда температура достигла 80 градусов.

  • Вы совершили 15 продаж купальных костюмов, когда температура достигла 90 градусов.

  • Вы продали 20 купальных костюмов, когда температура достигла 100 градусов.

  • Вы продали 15 купальных костюмов при температуре 110 градусов.

Вы можете назначить x для продаж купальных костюмов и y для температурных переменных. Среднее значение ваших значений x в этом примере равно 15, а среднее значение ваших значений y равно 90. После вычисления коэффициента корреляции вы обнаружите, что r равно 1. Это означает, что если вы должны были создать точечную диаграмму , точки будут постепенно подниматься вверх по склону. Это свидетельствует о сильной положительной и «идеальной» корреляции.

Основываясь на этом расчете, вы можете определить, что по мере повышения температуры будет расти и количество продаж ваших купальных костюмов.

Коэффициент корреляции в Excel (и корреляционная матрица)

Друзья, приветствую вас на WiFiGid! Буквально на днях разрабатывал модель для одной рыночно-нейтральной торговой стратегии, где как раз и нужно было рассчитывать коэффициенты корреляции (на самом деле корреляционную матрицу). Лично я сделал это на «питоне» – все равно потом ее как-то же надо обрабатывать, ведь миллионы ячеек глазом не просмотришь. Но на этапе предварительного анализа кому-то может быть проще использовать именно Excel. Поэтому в этой статье я и покажу вам основные варианты расчета коэффициента корреляции в Excel.

А если вдруг останутся какие-то вопросы или дополнения – добро пожаловать в комментарии. По мере возможности буду отвечать.

И как дополнение, конечно, можно ввести стандартную формулу любой корреляции в Excel, и на ее основе рассчитать коэффициент. Но в этой статье предлагаю все-таки остановиться на уже встроенных способах в Excel.

Содержание

  1. Коротко про коэффициент корреляции
  2. Способ расчета 1 – Формула
  3. Способ 2 (корреляционная матрица) – Пакет анализа
  4. Видео по теме
  5. Задать вопрос автору статьи