Построить поле корреляции и сформулировать гипотезу о форме связи: Поле корреляции и формулирование гипотезы о форме связи

Содержание

Постройте поле корреляции и сформулируйте гипотезу о форме связи

 

Задание 

  1. Постройте поле корреляции и сформулируйте  гипотезу о форме связи.
  2. Рассчитайте параметры уравнений линейной, степенной и гиперболической парной регрессии.
  3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
  4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
  5. Оцените с помощью средней ошибки аппроксимации качество уравнений.
  6. Оцените с помощью F— критерии Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
  7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня.
    Определите доверительный интервал прогноза для уровня значимости .
  8. Оцените полученные результаты, выводы оформите в аналитической записке.
  1. Построим  поле корреляции по исходным данным

 

XY
17,5286
28,4300
36,2258
46,4262
55,1237
68,4300
79,0311
85,4243
97,3279
108,2296
118,6303

 

      Построив  поле корреляции, можно выдвинуть  гипотезу о том, что связь между  фактором и результатом описывается  линейной функцией.  

2. Рассчитаем параметры  уравнений: 

 

а) линейной регрессии (y=a+bx) 

  •  18,97 140,66  0,99

0,9984  0,4968  0,19314

  • 75,111  0,252  1,16337
  • 75,299   1,87

 
 

Все расчеты  были произведены с помощью Excel:

 XYXYX2Y2(x-xср)2yрас(yрас-yср)2(у-уср)2(y-рас)2|y-рас|/y
17,5286214556,25817960,1818182833,450386,4545453,004170,010504
28,4300252070,5690000
1,081818
300,120,529720,45455-0,07520,000251
36,22581599,638,4466564-1,118182258,3-21,2198-21,5455-0,32560,001262
46,42621676,840,9668644-0,918182262,1-17,4244-17,5455-0,12110,000462
55,12371208,726,0156169-2,218182237,5-42,0946-42,5455-0,45090,001902
68,4300252070,56900001,081818300,120,529720,45455-0,07520,000251
79311279981967211,681818311,531,91631,45455-0,46140,001484
85,42431312,229,1659049-1,918182243,1-36,4015-36,5455-0,1440,000593
97,32792036,753,2977841-0,018182279,2-0,34504-0,54545-0,20040,000718
108,22962427,267,24876160,881818296,316,734316,45455-0,27980,000945
118,63032605,873,96918091,281818303,924,325223,45455-0,87060,002873
Сумма Сумкв80,5307522851607,439E+0518,316369E+056596,266606,72710,47040,021245
Ср. знач.7,322802077,455,22178746     0,001931

 

b
a
R2rxyS2S2bS2aSaSbtatbfнаблЭ
18,98140,70,99840,99921,1630,0643,5071,8730,25275,1175,35669,90,497

 

tкр(0,05;9)Fкритt*Sat*Sbдов.
интервал(а)
дов.интервал(b)A
2,2625,124,244,7827136,43<140,67<144,904118,41<19,97<19,547150,19314

 

Данные параметры  можно было определить по функциям («Регрессия»):

Регрессионная статистика     
Множественный R0,999207284     
R-квадрат0,998415196     
Нормированный R-квадрат0,998239106     
Стандартная ошибка1,078598333     
Наблюдения11     
       
Дисперсионный анализ     
 dfSSMSFЗначимость F 
Регрессия16596,2569036596,2569035669,93496,50057E-14 
Остаток910,470369271,163374363   
Итого106606,727273    
 КоэффициентыСтанд. ошибкаt-статистикаP-ЗначениеНижние 95%Верхние 95%
Y-пересечение140,66780821,87280211975,110876266,6483E-14136,4312355144,9043809
X18,977069680,25202296575,298970126,5006E-1418,4069541319,54718524

Уравнение линейной регрессии:

140,66+18,98*x 

Выводы: Линейный коэффициент парной корреляции  0,9992 означает, что связь между фактором и результатом прямая, очень тесная. Средняя ошибка аппроксимации показывает, что расчетные значения отклоняются от фактических на  0,193%.  Так как полученное фактическое значение (F=5669,9) больше, чем Fтабл = 5,12, то уравнение статистически значимо. Также статистически значимы и коэффициенты регрессии, так как по абсолютному значению (ta=75,11 и tb=75,29) они превышают табличное значение Стюдента t=2,262.

б) степенной  регрессии 

      Логарифмируем уравнение и получим уравнение  линейной регрессии: . Заменяя значения фактора и результата на логарифмированные, рассчитаем параметры: b=0,479 c=4,68 отсюда Уравнение регрессии примет вид:

.

Рассчитаем параметры  качества уравнения регрессии:

№ п/пXYlnYlnXlnY*lnX(lnX)2YрасA
17,52865,655992,01490311,39634,0598342284,0210,00692083
28,43005,703782,12823212,1394,5293702299,8980,000338706
36,22585,552961,82454910,13163,3289801259,220,004730343
46,42625,568341,85629810,33653,4458422263,2010,004583846
55,12375,468061,6292418,908792,6544247236,0240,004119373
68,43005,703782,12823212,1394,5293702299,8980,000338706
793115,739792,19722512,61164,8277958309,9960,003227997
85,42435,493061,6863999,263492,8439414242,5890,001692205
97,32795,631211,98787411,19413,9516444280,360,004873447
108,22965,690362,10413411,97334,4273805296,450,001518793
118,63035,713732,15176212,29464,6300806303,3050,001005847
Сумма80,53075     0,033350091
Ср. знач.7,32280     0,303

 

bcaЭ
0,4794,68107,970,479

 

Параметры, определенные по функциям («Регрессия»):

ВЫВОД ИТОГОВ     
Регрессионная статистика     
Множественный R0,99916262     
R-квадрат0,99832593     
Норм. R-квадрат0,99813992     
Станд. ошибка0,00406828     
Наблюдения11     
       
Дисперс. анализ      
 dfSSMSFЗначимость F 
Регрессия10,088830790,088835367,1248,3E-14 
Остаток90,000148951,7E-05   
Итого100,08897975    
 Коэфф. Станд. ошибкаt-стат-каP-ЗначениеНижние 95%Верхние 95%
Y-пересечение4,681910870,01298829360,4724,95E-204,652534,711292
lnX0,479991370,0065518373,26078,32E-140,465170,494812
exp107,976204     

Задача 1. Построить поле корреляции и сформулировать гипотезу о форме связи.

  1. Главная страница 🏠
  2. org/ListItem»> 📚 Библиотека
  3. 👉 Эконометрика 👈
  4. Решение практических задач по курсу: «Эконометрика»
  5. Задача 1. Построить поле корреляции и сформулировать гипотезу о форме связи.

Нужна помощь в написании работы?

Узнать стоимость

Гипотеза о форме связи: Визуальный анализ полученного графика показывает, что точки поля корреляции располагаются вдоль некоторой воображаемой прямой линии, но не очень плотно, рассеиваясь около неё. Можно предположить, что связь прожиточного минимума и среднего размера назначенных ежемесячных пенсий обратная, не очень тесная.

Анализируя расположение точек поля корреляции, предполагаем, что связь между признаками х и у может быть нелинейной вида:.

Поможем написать любую работу на аналогичную тему

  • Реферат

    Задача 1. Построить поле корреляции и сформулировать гипотезу о форме связи.

    От 250 руб

  • Контрольная работа

    Задача 1. Построить поле корреляции и сформулировать гипотезу о форме связи.

    От 250 руб

  • Курсовая работа

    Задача 1. Построить поле корреляции и сформулировать гипотезу о форме связи.

    От 700 руб

Получить выполненную работу или консультацию специалиста по вашему учебному проекту

Узнать стоимость

Поделись с друзьями

  • Содержание
  • Меню

Задача 1.
Исходные данные
Задача 1. Построить поле корреляции и сформулировать гипотезу о форме связи.
Задача 1. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессий.

Задача 1. Оценка тесноты связи с помощью показателей корреляции и детерминации
Задача 1. С помощью среднего (общего) коэффициента эластичности дайте сравнительную оценку силы связи фактора с результатом.
Задача 1.
Оценка качества уравнений с помощью средней ошибки аппроксимации.

Задача 1. Оценить с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования.
Задача 1. Рассчитаем прогнозное значение результата по линейному уравнению регрессии
Задача 2. Исходные данные

Добавить в избранное (необходима авторизация)

Как написать гипотезу для корреляции

••• Thinkstock/Comstock/Getty Images

Обновлено 25 апреля 2017 г. В то время как некоторые гипотезы предсказывают причинно-следственную связь между двумя переменными, другие гипотезы предсказывают корреляцию между ними. Согласно базе знаний по методам исследования, корреляция — это одно число, описывающее взаимосвязь между двумя переменными. Если вы не предсказываете причинно-следственную связь или не можете ее объективно измерить, четко укажите в своей гипотезе, что вы просто прогнозируете корреляцию.

    Тщательно изучите тему, прежде чем выдвигать гипотезу. Без адекватных знаний о предмете вы не сможете решить, писать ли гипотезу о корреляции или причинно-следственной связи. Прочтите результаты подобных экспериментов, прежде чем выдвигать собственную гипотезу.

    Определите независимую переменную и зависимую переменную. Ваша гипотеза будет касаться того, что происходит с зависимой переменной при изменении независимой переменной. При корреляции две переменные изменяются одновременно в значительном числе случаев. Однако это не означает, что изменение независимой переменной вызывает изменение зависимой переменной.

    Проведите эксперимент, чтобы проверить свою гипотезу. В корреляционном эксперименте вы должны быть в состоянии измерить точное соотношение между двумя переменными. Это означает, что вам нужно будет выяснить, как часто происходит изменение обеих переменных с точки зрения определенного процента.

    Установить требования эксперимента в отношении статистической значимости. Проинструктируйте читателей, как часто переменные должны коррелировать, чтобы достичь достаточно высокого уровня статистической значимости. Это число будет значительно варьироваться в зависимости от области. Например, в высокотехнологичном научном исследовании переменные могут нуждаться в корреляции 98 процентов времени; но в социологическом исследовании может быть достаточно 90-процентной корреляции. Посмотрите другие исследования в вашей конкретной области, чтобы определить требования к статистической значимости.

    Сформулируйте нулевую гипотезу. Нулевая гипотеза дает точное значение, которое подразумевает отсутствие корреляции между двумя переменными. Если результаты показывают процент, равный или меньший, чем значение нулевой гипотезы, то корреляция переменных не доказана.

    Запишите и подведите итоги вашего эксперимента. Укажите, соответствовал ли эксперимент минимальным требованиям вашей гипотезы как в процентном отношении, так и в отношении значимости.

Связанные статьи

Ссылки

  • Университет Новой Англии; Этапы проверки гипотез на корреляцию; 2000
  • База знаний по методам исследования; корреляция; Уильям М.К. Трохим; 2006
  • Друзья по науке; Гипотеза

Об авторе

Брайан Гэбриел с 2009 года пишет и ведет блог, сотрудничает с различными интернет-публикациями. Он получил степень бакалавра искусств по истории в Университете Уитворта.

Photo Credits

Thinkstock/Comstock/Getty Images

Тест гипотез на корреляцию: объяснение и пример гипотеза для корреляционного теста.

Что такое проверка гипотезы для коэффициента корреляции?

При наличии выборки двумерных данных (данных, включающих две переменные) можно рассчитать, насколько линейно коррелированы данные, используя коэффициент корреляции.

Коэффициент корреляции момента продукта (PMCC) описывает степень, в которой одна переменная коррелирует с другой. Другими словами, сила корреляции между двумя переменными. PMCC для выборки данных обозначается как r , тогда как PMCC для совокупности обозначается как ρ.

PMCC ограничен значениями от -1 до 1 (включительно).

  • Если существует совершенная положительная линейная корреляция. Все точки лежат на прямой с положительным градиентом, и чем выше одна из переменных, тем выше другая.

  • Если нет линейной корреляции между переменными.

  • При наличии идеальной отрицательной линейной корреляции. Все точки лежат на прямой с отрицательным градиентом, и чем выше одна из переменных, тем ниже другая.

Корреляция не эквивалентна причинно-следственной связи, но PMCC, близкий к 1 или -1, может указывать на более высокую вероятность того, что две переменные связаны.

Двумерные данные без корреляции, положительной корреляции и отрицательной корреляции

PMCC должна быть рассчитана с помощью графического калькулятора путем нахождения линии регрессии y на x и, следовательно, нахождения r (это значение автоматически рассчитывается калькулятором) или с помощью формулы, которая находится в формуле буклет. Чем ближе r к 1 или -1, тем сильнее корреляция между переменными и, следовательно, тем теснее связаны переменные. Вы должны иметь возможность проводить проверку гипотез на выборке двумерных данных, чтобы определить, можем ли мы установить линейную зависимость для всей совокупности. Вычисляя PMCC и сравнивая его с критическим значением, можно определить вероятность существования линейной зависимости.

Что такое проверка гипотезы об отрицательной корреляции?

Чтобы провести проверку гипотезы, необходимо понять ряд ключевых слов:

  • Нулевая гипотеза ( ) : гипотеза считается правильной, пока не доказано обратное

  • Альтернативная гипотеза ( ) : сделанный вывод если отвергнут.

  • Проверка гипотезы: математическая процедура проверки значения параметра совокупности, предложенного нулевой гипотезой, по сравнению с альтернативной гипотезой.

  • Статистика теста: рассчитывается по выборке и проверяется в таблицах кумулятивных вероятностей или с использованием нормального распределения в качестве последней части теста значимости.

  • Критическая область: диапазон значений, который приводит к отклонению нулевой гипотезы.

  • Уровень значимости: фактический уровень значимости — это вероятность отклонения, когда это действительно так.

Нулевая гипотеза также известна как «рабочая гипотеза». Это то, что мы считаем верным для целей теста или до тех пор, пока не будет доказано обратное.

Альтернативная гипотеза — это вывод, сделанный в случае отклонения нулевой гипотезы. Он также определяет, является ли тест односторонним или двусторонним.

Односторонний тест допускает возможность воздействия в одном направлении, а двусторонний тест допускает возможность воздействия в двух направлениях, другими словами, как в положительном, так и в отрицательном направлениях. Метод: Необходимо выполнить ряд шагов, чтобы определить наличие линейной зависимости между двумя переменными. 1 . Запишите нулевую и альтернативную гипотезы (). Нулевая гипотеза всегда, в то время как альтернативная гипотеза зависит от того, что задано в вопросе. Обе гипотезы должны быть выражены только символами (не словами).

2 . С помощью калькулятора вычислите значение PMCC выборочных данных, r .

3 . Используйте уровень значимости и размер выборки, чтобы определить критическое значение. Это можно найти в таблице PMCC в буклете с формулами.

4 . Возьмите абсолютное значение PMCC и r и сравните их с критическим значением. Если абсолютное значение больше критического значения, нулевая гипотеза должна быть отвергнута. В противном случае следует принять нулевую гипотезу.

5 . Напишите полный вывод в контексте вопроса. Вывод должен быть изложен полностью: как статистическим языком, так и словами, отражающими контекст вопроса. Отрицательная корреляция означает, что альтернативная гипотеза отвергнута: отсутствие одной переменной коррелирует с более сильным присутствием другой переменной, тогда как при положительной корреляции присутствие одной переменной коррелирует с присутствием другой.

Как интерпретировать результаты, основанные на нулевой гипотезе

На основании наблюдаемых результатов (тестовой статистики) необходимо принять решение, определяющее, отклонять нулевую гипотезу или нет.

Изображение: Repapetilto CC BY-SA 3.0,

Двусторонний тест применяется к нормальному распределению. Изображение: общественное достояние

И односторонний, и двусторонний тест показаны на уровне значимости 5%. Однако 5% распределяются как в положительную, так и в отрицательную сторону в двустороннем тесте и только в положительную сторону в одностороннем тесте.

Из нулевой гипотезы результат может лежать где угодно на графике. Если наблюдаемый результат лежит в заштрихованной области, статистика теста значима на уровне 5%, другими словами, мы отвергаем. Следовательно, на самом деле может быть правдой, но все равно отвергается. Следовательно, уровень значимости 5% — это вероятность, которая отвергается, даже если она верна, другими словами, вероятность, которая отвергается неправильно. Когда отвергается, (альтернативная гипотеза) используется для написания заключения.

Мы можем определить нулевую и альтернативную гипотезы для односторонних и двусторонних тестов:

Для одностороннего теста:

Для двустороннего теста:

28

9 Давайте рассмотрим пример проверки корреляции.

12 студентов сдали два экзамена по биологии: теоретический и практический. Результаты приведены в таблице.

Score in theoretical test, t

5

9

7

11

20

4

6

17

12

10

15

16

. Стоимость практического теста,

. 0053 p

6

8

9

13

20

9

8

17

14

8

9 17

9 17

17

17

17

17

17

9000 2

0190

18

а) Найдите коэффициент корреляции момента продукта для этих данных с точностью до 3 значащих цифр.

b) Учитель утверждает, что учащиеся, которые хорошо справляются с теоретическим тестом, как правило, хорошо справляются с практическим тестом. Проверьте это утверждение на уровне значимости 0,05, четко изложив свои гипотезы.

а) С помощью калькулятора находим ПМКЦ (вносим данные в два списка и вычисляем линию регрессии. появится ПМКК). r = от 0,935 до 3 знаков. цифры

б) Мы проверяем наличие положительной корреляции, поскольку утверждается, что более высокий балл в теоретическом тесте связан с более высоким баллом в практическом тесте. Теперь мы будем использовать пять шагов, которые мы рассмотрели ранее.

1. Сформулируйте нулевую и альтернативную гипотезы. : ρ = 0 и : ρ > 0

2. Рассчитайте PMCC. Из части а) р = 0,935

3. Определите критическое значение исходя из размера выборки и уровня значимости. Размер выборки n равен 12. Уровень значимости 5%. Гипотеза односторонняя, поскольку мы проверяем только положительную корреляцию. Используя таблицу из брошюры с формулами, показано, что критическое значение равно cv = 0,4973

4. Абсолютное значение PMCC равно 0,935, что больше, чем 0,4973. Поскольку PMCC больше критического значения на уровне значимости 5%, мы можем сделать вывод.

5. Поскольку PMCC больше критического значения, мы отклоняем нулевую гипотезу. Мы можем заключить, что имеются существенные доказательства в поддержку утверждения о том, что учащиеся, которые хорошо справляются с тестом по теоретической биологии, также, как правило, хорошо справляются с тестом по практической биологии.

Давайте посмотрим на второй пример.

Четырехгранный кубик (четыре грани) бросают 40 раз и наблюдают 6 «единиц». Есть ли какие-либо доказательства на уровне 10%, что вероятность получения 1 балла меньше четверти?

Ожидаемое среднее значение равно 10 . Вопрос спрашивает, является ли наблюдаемый результат (критерий статистики 6 необычно низким.

Теперь мы повторяем ту же серию шагов.

1. Сформулируем нулевую и альтернативную гипотезы. : ρ = 0 и : ρ <0,25

2. Мы не можем рассчитать PMCC, так как нам даны данные только о частоте «единиц»

3. Требуется односторонний тест ( ρ < 0,25) при 10% уровне значимости. Мы можем преобразовать это в биномиальное распределение, в котором X — это количество «единиц», поэтому мы затем используем кумулятивные биномиальные таблицы. Наблюдаемое значение X = 6. К .

4. Поскольку 0,0962, или 9,62% <10%, наблюдаемый результат лежит в критической области.

5. Отклоняем и принимаем альтернативную гипотезу. Мы заключаем, что есть доказательства того, что вероятность выпадения единицы меньше 9.0003

Проверка гипотезы на корреляцию – основные выводы

  • Коэффициент корреляции момента продукта (PMCC), или r , является мерой того, насколько сильно связаны две переменные. Он находится в диапазоне от -1 до 1, что указывает на силу корреляции.
  • Чем ближе r к 1 или -1, тем сильнее корреляция (положительная или отрицательная) между двумя переменными.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *