Ранговая корреляция: Как рассчитать ранговую корреляцию Спирмена в Google Sheets

Как рассчитать ранговую корреляцию Спирмена в Google Sheets


В статистике корреляция относится к силе и направлению связи между двумя переменными. Значение коэффициента корреляции может варьироваться от -1 до 1 со следующими интерпретациями:

  • -1: идеальная отрицательная связь между двумя переменными
  • 0: нет связи между двумя переменными
  • 1: идеальная положительная связь между двумя переменными

Один особый тип корреляции называется ранговой корреляцией Спирмена и используется для измерения корреляции между двумя ранжированными переменными. (например, оценка балла учащегося на экзамене по математике и оценка его оценки на экзамене по естественным наукам в классе).

В этом руководстве объясняется, как рассчитать ранговую корреляцию Спирмена между двумя переменными в Google Таблицах.

Пример: ранговая корреляция Спирмена в Google Sheets

Выполните следующие шаги, чтобы вычислить ранговую корреляцию Спирмена между результатами экзамена по математике и результатами экзамена по естественным наукам 10 учащихся в определенном классе.

Шаг 1: Введите данные.

Введите экзаменационные баллы для каждого учащегося в два отдельных столбца:

Шаг 2: Рассчитайте ранги для каждого экзаменационного балла.

Далее мы рассчитаем рейтинг для каждого экзаменационного балла. Используйте следующие формулы в ячейках D2 и E2, чтобы вычислить рейтинги по математике и естественным наукам для первого учащегося:

Ячейка D2: =RANK.AVG(B2, $B$2:$B$11, 0)

Ячейка E2: =RANK.AVG(C2, $C$2:$C$11, 0)

Затем выделите оставшиеся ячейки для заполнения:

Затем нажмите Ctrl+D, чтобы заполнить ранги для каждого ученика:

Шаг 3: Рассчитайте коэффициент ранговой корреляции Спирмена.

Наконец, мы рассчитаем коэффициент ранговой корреляции Спирмена между оценками по математике и по естественным наукам с помощью функции CORREL() :

Ранговая корреляция Спирмена оказывается равной -0,41818 .

Шаг 4 (необязательно): Определите, является ли ранговая корреляция Спирмена статистически значимой.

На предыдущем шаге мы обнаружили, что ранговая корреляция Спирмена между результатами экзаменов по математике и естественным наукам составляет -0,41818 , что указывает на отрицательную корреляцию между двумя переменными.

Однако, чтобы определить, является ли эта корреляция статистически значимой, нам нужно будет обратиться к таблице ранговой корреляции Спирмена критических значений, которая показывает критические значения, связанные с различными размерами выборки (n) и уровнями значимости (α).

Если абсолютное значение нашего коэффициента корреляции больше критического значения в таблице, то корреляция между двумя переменными является статистически значимой.

В нашем примере размер выборки составлял n = 10 студентов. Используя уровень значимости 0,05, мы находим, что критическое значение равно 0,564 .

Поскольку рассчитанное нами абсолютное значение рангового коэффициента корреляции Спирмена ( 0,41818 ) не превышает этого критического значения, это означает, что корреляция между баллами по математике и естественным наукам не является статистически значимой.

Связанный: Как рассчитать ранговую корреляцию Спирмена в Excel

Ранговая корреляция и коэффициент ранговой корреляции Спирмена. Решение задач и контрольных работ по статистике онлайн

Краткая теория


Ранговая корреляция – это метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения.

Ранги — это порядковые номера единиц совокупности в ранжированном ряду. Если проранжировать совокупность по двум признакам, связь между которыми изучается, то полное совпадение рангов означает максимально тесную прямую связь, а полная противоположность рангов - максимально тесную обратную связь. Ранжировать оба признака необходимо в одном и том же порядке: либо от меньших значений признака к большим, либо наоборот.

Для практических целей использование ранговой корреляции весьма полезно. Например, если установлена высокая ранговая корреляция между двумя качественными признаками изделий, то достаточно контролировать изделия только по одному из признаков, что удешевляет и ускоряет контроль.

Коэффициент корреляции рангов, предложенный К. Спирменом, относится к непараметрическим показателям связи между переменными, измеренными в ранговой шкале. При расчете этого коэффициента не требуется никаких предположений о характере распределений признаков в генеральной совокупности. Этот коэффициент определяет степень тесноты связи порядковых признаков, которые в этом случае представляют собой ранги сравниваемых величин.

Величина коэффициента корреляции Спирмена лежит в интервале +1 и -1. Он может быть положительным и отрицательным, характеризуя направленность связи между двумя признаками, измеренными в ранговой шкале.

Ранговый коэффициент корреляции Спирмена подсчитывается по формуле:

 — разность между рангами по двум переменным

 – число сопоставляемых пар

Первым этапом расчета коэффициента ранговой корреляции является ранжирование рядов переменных.

Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречается несколько равных по значению переменных, им присваивается усредненный ранг.

Преимущество коэффициента корреляции рангов Спирмена состоит в том, что ранжировать можно и по таким признакам, которые нельзя выразить численно: можно проранжировать кандидатов на занятие определенной должности по профессиональному уровню, по умению руководить коллективом, по личному обаянию и т. п. При экспертных оценках можно ранжировать оценки разных экспертов и найти их корреляции друг с другом, чтобы затем исключить из рассмотрения оценки эксперта, слабо коррелированные с оценками других экспертов. Коэффициент корреляции рангов Спирмена применяется для оценки устойчивости тенденции динамики. Недостатком коэффициента корреляции рангов является то, что одинаковым разностям рангов могут соответствовать совершенно отличные разности значений признаков (в случае количественных признаков).

Поэтому для последних следует считать корреляцию рангов приближенной мерой тесноты связи, обладающей меньшей информативностью, чем коэффициент корреляции числовых значений признаков.

Пример решения задачи


Опрос случайно выбранных 10 студентов, проживающих в общежитии университета, позволяет выявить зависимость между средним баллом по результатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку.

Средний балл 4.7 4.4 3.8 3.7 4.2 4.3 3.6 4.0 3. 1 3.9
Число часов 26 22 8 12 15 30 20 31 10 17

Определите тесноту связи при помощи коэффициента ранговой корреляции Спирмена.

Решение

Если не находите примера, аналогичного вашему, если сами не успеваете выполнить работу, если впереди экзамен по предмету и нужна помощь — свяжитесь со мной:

ВКонтакте
WhatsApp
Telegram

Я буду работать с вами, над вашей проблемой, пока она не решится.

Рассчитаем коэффициент корреляции рангов. 

Вспомогательная расчетная таблица

Ранжирование
Сравнение рангов Разность рангов
1 26 4. 7 8 1 3.1 1 8 10 -2 4
2 22 4.4 10 2 3.6 2 7 9 -2 4
3 8 3.
8
12 3 3.7 3 1 4 -3 9
4 12 3.7 15 4 3.8 4 3 3 0 0
5 15 4. 2 17 5 3.9 5 4 7 -3 9
6 30 4.3 20 6 4 6 9
8
1 1
7 20 3. 6 22 7 4.2 7 6 2 4 16
8 31 4 26 8 4.3 8 10 6 4 16
9 10 3. 1 30 9 4.4 9 2 1 1 1
10 17 3.9 31 10 4.7 10 5 5 0 0
Сумма                   60

 

Коэффициент ранговой корреляции Спирмена вычисляется по формуле:

Подставляя числовые значения, получаем:

 

Вывод к задаче

Связь между средним баллом по результатам предыдущей сессии и числом часов в неделю, затраченных студентом на самостоятельную подготовку, умеренной тесноты.

Ранговая корреляция

Spearman’s Rank-Orrelation — руководство о том, когда ее использовать, что она делает и каковы предположения.

В этом руководстве рассказывается, когда следует использовать ранговую корреляцию Спирмена для анализа данных, какие допущения необходимо выполнить, как ее рассчитать и как сообщить об этом. Если вы хотите узнать, как запустить корреляцию Спирмена в SPSS Statistics, перейдите к нашему руководству по корреляции Спирмена в SPSS Statistics.

Когда следует использовать ранговую корреляцию Спирмена?

Ранговая корреляция Спирмена является непараметрической версией корреляции Пирсона произведение-момент. Коэффициент корреляции Спирмена (ρ, также обозначаемый как r s ) измеряет силу и направление связи между двумя ранжированными переменными.

Каковы предположения теста?

Вам нужны две переменные: порядковые, интервальные или относительные (см. наше руководство по типам переменных, если вам нужны разъяснения). Хотя обычно вы надеетесь использовать корреляцию Пирсона произведение-момент для интервальных или относительных данных, корреляцию Спирмена можно использовать, когда допущения корреляции Пирсона заметно нарушаются. Однако корреляция Спирмена определяет силу и направление 9.0015 монотонная связь между вашими двумя переменными, а не сила и направление линейной зависимости между вашими двумя переменными, которую определяет корреляция Пирсона.

Что такое монотонная связь?

Монотонная связь — это связь, которая выполняет одно из следующих действий: (1) по мере увеличения значения одной переменной увеличивается и значение другой переменной; или (2) по мере увеличения значения одной переменной значение другой переменной уменьшается. Примеры монотонных и немонотонных зависимостей представлены на диаграмме ниже:

Почему монотонные отношения важны для корреляции Спирмена?

Корреляция Спирмена измеряет силу и направление монотонной связи между двумя переменными. Монотонность «менее ограничительна», чем линейная зависимость. Например, на среднем изображении выше показана зависимость, которая является монотонной, но нелинейной.

Монотонная зависимость не является строго предположением о корреляции Спирмена. То есть вы можете запустить корреляцию Спирмена для немонотонного отношения, чтобы определить, существует ли монотонная составляющая к ассоциации. Однако обычно вы выбираете меру связи, такую ​​как корреляция Спирмена, которая соответствует шаблону наблюдаемых данных. То есть, если диаграмма рассеяния показывает, что взаимосвязь между двумя вашими переменными выглядит монотонной, вы должны запустить корреляцию Спирмена, потому что она затем будет измерять силу и направление этой монотонной взаимосвязи. С другой стороны, если, например, связь кажется линейной (оценивается с помощью диаграммы рассеяния), вы должны запустить корреляцию Пирсона, потому что она будет измерять силу и направление любой линейной зависимости. Вы не всегда сможете визуально проверить, есть ли у вас монотонная связь, поэтому в этом случае вы все равно можете запустить корреляцию Спирмена.

Как ранжировать данные?

В некоторых случаях ваши данные могут быть уже ранжированы, но часто вы обнаружите, что вам нужно ранжировать данные самостоятельно (или использовать SPSS Statistics, чтобы сделать это за вас). К счастью, ранжирование данных не является сложной задачей и легко выполняется путем обработки ваших данных в таблице. Рассмотрим следующий пример данных, касающихся оценок, полученных на экзамене по математике и английскому языку:

  Оценки
Английский 56 75 45 71 61 64 58 80 76 61
Математика 66 70 40 60 65 56 59 77 67 63

Процедура ранжирования этих баллов следующая:

Сначала создайте таблицу с четырьмя столбцами и пометьте их, как показано ниже: ) Разряд (математика) 56 66 9 4 75 70 3 2 45 40 10 10 71 60 4 7 . 0041 58 59 8 8 80 77 1 1 76 67 2 3 61 63 6.5 6

Вам необходимо ранжировать баллы по математике и английскому языку отдельно. Оценка с самым высоким значением должна быть помечена как «1», а самая низкая оценка должна быть помечена как «10» (если в вашем наборе данных более 10 случаев, то самый низкий балл будет равен количеству случаев, которые у вас есть). Посмотрите внимательно на двух человек, которые набрали 61 балл на экзамене по английскому языку (выделены жирным шрифтом). Обратите внимание на их общий рейтинг 6,5. Это связано с тем, что, когда у вас есть два одинаковых значения в данных (называемых «связью»), вам нужно взять среднее значение рангов, которые они в противном случае занимали бы. Мы делаем это, потому что в этом примере у нас нет способа узнать, какой балл должен быть помещен в ранг 6, а какой — в ранг 7. Таким образом, вы заметите, что ранги 6 и 7 не существуют для английского языка. Эти два ранга были усреднены ((6 + 7)/2 = 6,5) и присвоены каждой из этих «равных» оценок.

Каково определение ранговой корреляции Спирмена?

Существует два метода расчета корреляции Спирмена в зависимости от того, (1) ваши данные не имеют связанных рангов или (2) ваши данные имеют связанные ранги. Формула для случая, когда нет одинаковых рангов:

, где d i = разница в парных рангах и n = количество наблюдений. Формула для использования при равных рангах:

, где i = парный счет.

« предыдущая

1 2

следующая »

Главная О нас Свяжитесь с нами Условия и положения Ценности и файлы cookie © 2018 Lund Research Ltd

Корреляция рангов Спирмена: полное руководство для понимания

Корреляция — это статистическая мера, которая определяет, насколько сильно колеблются две переменные. Положительная корреляция показывает, в какой степени эти переменные увеличиваются или уменьшаются параллельно. Отрицательная корреляция показывает диапазон, в котором одна переменная увеличивается, а другая уменьшается. В этой статье мы обсудим одну из таких корреляций, а именно ранговую корреляцию Спирмена.

Что такое монотонная функция?

Чтобы понять ранговую корреляцию Спирмена, важно понять монотонную функцию. Монотонная функция — это функция, которая либо никогда не возрастает, либо никогда не убывает при изменении своей независимой переменной.

Следующий график иллюстрирует монотонную функцию:

  • Монотонно возрастающая: при увеличении переменной X переменная Y никогда не уменьшается.
  • Монотонно убывающее: при увеличении переменной X переменная Y никогда не увеличивается.
  • Не монотонно: по мере увеличения переменной X переменная Y иногда уменьшается, а иногда увеличивается.

Корреляция ранга Спирмена

Ранговая корреляция Спирмена измеряет силу и направление связи между двумя ранжированными переменными. По сути, он дает меру монотонности отношения между двумя переменными, то есть насколько хорошо отношение между двумя переменными может быть представлено с использованием монотонной функции.

Формула рангового коэффициента Спирмена:

𝝆 = коэффициент ранговой корреляции Спирмена

di = разница между двумя рангами каждого наблюдения

n = количество наблюдений

Ранговая корреляция Спирмена может принимать значения от +1 до -1, где

  • Значение +1 означает идеальную ассоциацию ранга
  • Значение 0 означает отсутствие связи между рангами
  • Значение -1 означает идеальную отрицательную ассоциацию ранга

Давайте лучше разберемся с концепцией на примере.

Пример ранговой корреляции Спирмена

Оцените баллы 5 учащихся по математике и естественным наукам, упомянутых в таблице.

Шаг 1: Создайте таблицу для заданных данных.

Шаг 2: Расположите оба данных в порядке убывания. Самые высокие оценки получат ранг 1, а самые низкие оценки получат ранг 5.

Шаг 3: Рассчитайте разницу между рангами (d) и квадратным значением d.

Шаг 4: Добавьте все значения d-квадрата.

Шаг 5: Вставьте эти значения в формулу.

= 1 — (6 * 14) / 5 (25 — 1)

= 0,3

Ранговая корреляция Спирмена для данных данных составляет 0,3. Значение близко к 0, что означает слабую корреляцию между двумя рангами.

Получите широкий доступ к ключевым технологиям и навыкам, используемым в аналитике данных и науке о данных, включая статистику, с Программой сертификации аналитики данных.

Заключение

В этом руководстве «Полное руководство по пониманию ранговой корреляции Спирмена» вы познакомились с концепцией ранговой корреляции Спирмена и тем, как найти ее ранговый коэффициент.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *