Таблица хи квадрат распределения – —

Хи квадрат-распределение. Распределение Пирсона. Квантили хи-квадрат распределения

-распределение. Распределение Пирсона.

В таблице приведены значения квантилей Χ21-α(m) в зависимости от числа степеней свободы m и вероятности α

m/α

0,99

0,98

0,95

0,90

0,80

0,20

0,10

0,05

0,02

0,01

0,001

1 0,00016 0,00063 0,00393 0,0158 0,0642 1,642 2,706 3,841
5,412
6,635 10,827
2 0,0201 0,0404 0,103 0,211 0,446 3,219 4,605 5,991 7,824 9,210 13,815
3 0,115 0,185 0,352 0,584 1,005 4,642 6,251 7,815 9,837 11,341 16,268
4 0,297 0,429 0,711 1,064 1,649 5,989 7,779 9,488 11,668 13,277 18,465
5 0,554 0,752 1,145 1,610 2,343 7,289 9,236 11,070 13,388 15,086 20,517
6 0,872 1,134 1,635 2,204 3,070 8,558 10,645
12,592
15,033 16,812 22,457
7 1,239 1,564 2,167 2,833 3,822 9,803 12,017 14,067 16,622 18,475 24,322
8 1,646 2,032 2,733 3,490 4,594 11,030 13,362 15,507 18,679 20,090 26,125
9
2,088
2,532 3,325 4,168 5,380 12,242 14,684 16,919 19,679 21,666 27,877
10 2,588 3,059 3,940 4,865 6,179 13,442 15,987 18,307 21,161 23,209 29,588
11 3,053 3,609 4,575 5,578 6,989 14,631
17,275
19,675 22,618 24,725 31,264
12 3,571 4,178 5,226 6,304 7,807 15,812 18,549 21,026 24,054 26,217 32,909
13 4,107 4,765 5,892 7,042 8,634 16,985 19,812 22,362 25,472 27,688 34,528
14 4,660 5,368 6,571 7,790 9,467 18,151 21,064 23,685 26,873 29,141 36,123
15 5,229 5,985 7,262 8,547 10,307 19,311 22,307 24,996 28,259 30,578 37,697
16 5,812 6,614 7,962 9,312
11,152
20,465 23,542 26,296 29,633 32,000 39,252
17 6,408 7,255 8,672 10,085 12,002 21,615 24,769 27,587 30,995 33,409 40,790
18 7,015 7,906 9,390 10,865 12,857 22,760 25,989 28,869 32,346 34,805 42,312
19 7,633 8,567 10,117 11,651 13,716 23,900 27,204 30,144 33,687 36,191 43,820
20 8,260 9,237 10,851 12,443 14,578 25,038 28,412 31,410 35,020 37,566 45,315
21 8,897 9,915 11,591 13,240 15,445 26,171 29,615 32,671 36,343 38,932 46,797
22 9,542 10,600 12,338 14,041 16,314 27,301 30,813 33,924 37,659 40,289 48,268
23 10,196 11,298 13,091 14,848 17,187 28,429 32,007 35,172 38,968 41,638 49,728
24 10,856 11,992 13,848 15,659 18,062 29,553 33,196 36,415 40,270 42,980 51,179
25 11,542 12,697 14,611 16,473 18,940 30,675 34,382 37,652 41,566 44,314 52,620
26 12,198 13,409 15,379 17,292 19,820 31,795 35,563 38,885 42,856 45,642 54,052
27 12,879 14,125 16,151 18,114 20,703 32,912 86,741 40,113 44,140 46,963 55,476
28 13,565 14,847 16,928 18,939 21,588 34,027 37,916 41,337 45,419 48,278 56,893
29 14,256 15,574 17,708 19,768 22,475 35,139 39,087 42,557 46,693 49,588 58,302
30 14,953 16,306 18,493 20,599 23,364 36,250 40,256 43,773 47,962 50,892 59,703

tehtab.ru

Таблица критических точек распределения χ2 (хи-квадрат) критерия Пирсона

Ниже представлена таблица значений критических точек распределения χ2 (хи-квадрат) критерия Пирсона, широко используемые в задачах математической статистики, таких как построение доверительных интервалов, проверка статистических гипотез и непараметрическое оценивание.

Число степеней свободы k Уровень значимости α
0,01 0,025 0,05 0,95 0,975 0,99
1 6,6 5 3,8 0,0039 0,00098 0,00016
2 9,2 7,4 6 0,103 0,051 0,02
3 11,3 9,4 7,8 0,352 0,216 0,115
4 13,3 11,1 9,5 0,711 0,484 0,297
5 15,1 12,8 11,1 1,15 0,831 0,554
6 16,8 14,4 12,6 1,64 1,24 0,872
7 18,5 16 14,1 2,17 1,69 1,24
8 20,1 17,5 15,5 2,73 2,18 1,65
9 21,7 19 16,9 3,33 2,7 2,09
10 23,2 20,5 18,3 3,94 3,25 2,56
11 24,7 21,9 19,7 4,57 3,82 3,05
12 26,2 23,3 21 ,0 5,23 4,4 3,57
13 27,7 24,7 22,4 5,89 5,01 4,11
14 29,1 26,1 23,7 6,57 5,63 4,66
15 30,6 27,5 25 7,26 6,26 5,23
16 32 28,8 26,3 7,96 6,91 5,81
17 33,4 30,2 27,6 8,67 7,56 6,41
18 34,8 31,5 28,9 9,39 8,23 7,01
19 36,2 32,9 30,1 10,1 8,91 7,63
20 37,6 34,2 31,4 10,9 9,59 8,26
21 38,9 35,5 32,7 11,6 10,3 8,9
22 40,3 36,8 33,9 12,3 11 9,54
23 41,6 38,1 35,2 13,1 11,7 10,2
24 43 39,4 36,4 13,8 12,4 10,9
25 44,3 40,6 37,7 14,6 13,1 11,5
26 45,6 41,9 38,9 15,4 13,8 12,2
27 47 43,2 40,1 16,2 14,6 12,9
28 48,3 44,5 41,3 16,9 15,3 13,6
29 49,6 45,7 42,6 17,7 16 14,3
30 50,9 47 43,8 18,5 16,8 15

Задача

Имеется три независимых реализации нормальной случайной величины: 0.6, 3.4, 2.0.

Проверить гипотезу : дисперсия равна 10.0.

Используются таблицы распределения хи-квадрат.

Задали объемную контрольную? Скоро важный зачет/экзамен? Нет времени на выполнение работы или подготовку к зачету/экзамену, но есть деньги? На сайте 100task.ru можно заказать решение или онлайн-помощь на зачете/экзамене 〉〉

Решение

Вычислим среднее и исправленную дисперсию:

Для того, чтобы при заданном уровне значимости  проверить нулевую гипотезу  о равенстве неизвестной генеральной дисперсии гипотетическому значению  при конкурирующей гипотезе  вычисляем наблюдаемое значение критерия:

При уровне значимости  находим:

 — нет оснований отвергнуть нулевую гипотезу

К оглавлению решебника по теории вероятностей и математической статистике

100task.ru

Решим задачи, контрольные, курсовые… — Таблица критических точек распределения Пирсона (хи-квадрат).

k /α

0,01

0,025

0,05

0,95

0,975

0,99

1

6,63

5,02

3,84

0,00

0,00

0,00

2

9,21

7,38

5,99

0,10

0,05

0,02

3

11,34

9,35

7,81

0,35

0,22

0,11

4

13,28

11,14

9,49

0,71

0,48

0,30

5

15,09

12,83

11,07

1,15

0,83

0,55

6

16,81

14,45

12,59

1,64

1,24

0,87

7

18,48

16,01

14,07

2,17

1,69

1,24

8

20,09

17,53

15,51

2,73

2,18

1,65

9

21,67

19,02

16,92

3,33

2,70

2,09

10

23,21

20,48

18,31

3,94

3,25

2,56

11

24,72

21,92

19,68

4,57

3,82

3,05

12

26,22

23,34

21,03

5,23

4,40

3,57

13

27,69

24,74

22,36

5,89

5,01

4,11

14

29,14

26,12

23,68

6,57

5,63

4,66

15

30,58

27,49

25,00

7,26

6,26

5,23

16

32,00

28,85

26,30

7,96

6,91

5,81

17

33,41

30,19

27,59

8,67

7,56

6,41

18

34,81

31,53

28,87

9,39

8,23

7,01

19

36,19

32,85

30,14

10,12

8,91

7,63

20

37,57

34,17

31,41

10,85

9,59

8,26

21

38,93

35,48

32,67

11,59

10,28

8,90

22

40,29

36,78

33,92

12,34

10,98

9,54

23

41,64

38,08

35,17

13,09

11,69

10,20

24

42,98

39,36

36,42

13,85

12,40

10,86

25

44,31

40,65

37,65

14,61

13,12

11,52

26

45,64

41,92

38,89

15,38

13,84

12,20

27

46,96

43,19

40,11

16,15

14,57

12,88

28

48,28

44,46

41,34

16,93

15,31

13,56

29

49,59

45,72

42,56

17,71

16,05

14,26

30

50,89

46,98

43,77

18,49

16,79

14,95

31

52,19

48,23

44,99

19,28

17,54

15,66

32

53,49

49,48

46,19

20,07

18,29

16,36

33

54,78

50,73

47,40

20,87

19,05

17,07

34

56,06

51,97

48,60

21,66

19,81

17,79

35

57,34

53,20

49,80

22,47

20,57

18,51

36

58,62

54,44

51,00

23,27

21,34

19,23

37

59,89

55,67

52,19

24,07

22,11

19,96

38

61,16

56,90

53,38

24,88

22,88

20,69

39

62,43

58,12

54,57

25,70

23,65

21,43

40

63,69

59,34

55,76

26,51

24,43

22,16

41

64,95

60,56

56,94

27,33

25,21

22,91

42

66,21

61,78

58,12

28,14

26,00

23,65

43

67,46

62,99

59,30

28,96

26,79

24,40

44

68,71

64,20

60,48

29,79

27,57

25,15

45

69,96

65,41

61,66

30,61

28,37

25,90

46

71,20

66,62

62,83

31,44

29,16

26,66

47

72,44

67,82

64,00

32,27

29,96

27,42

48

73,68

69,02

65,17

33,10

30,75

28,18

49

74,92

70,22

66,34

33,93

31,55

28,94

50

76,15

71,42

67,50

34,76

32,36

29,71

 

О распределении Пирсона а Excel

Критические точки распределения Пирсона (хи-квадрат) можно вычислить в Excel по формуле =ХИ2ОБР(α; k)
где α — уровень значимости, k — число степеней свободы
Допустим, вам нужно вычислить значение при α = 0,1, k = 15. Забиваем в ячейку формулу
=ХИ2ОБР(0,1; 15). Получаем результат 22,307.

 

 

www.reshim.su

Квантили распределения хи-квадрат


Кванти́ли распределе́ния хи-квадра́т — числовые характеристики, широко используемые в задачах математической статистики таких как построение доверительных интервалов, проверка статистических гипотез и непараметрическое оценивание

Квантиль хи-квадрат — это число величина хи-квадрат, при котором функция распределения хи-квадрат равна заданной затребованной вероятности а

Равенство функции распределения хи-квадрат вероятности а означает, что с вероятностью а будут наблюдаться значения хи-квадрат, не большие, чем найденный определенный согласно функции распределения квантиль хи-квадрат Таким образом, найти квантиль означает разграничить распределения хи-квадрат согласно заданной вероятности а

Содержание

  • 1 Определение
  • 2 Замечания
  • 3 Аппроксимация квантилей
  • 4 Таблица квантилей
  • 5 См также
  • 6 Примечания

Определение

Пусть F n }  — функция распределения хи-квадрат χ 2 n n} с n степенями свободы, и α ∈ [ 0 , 1 ] Тогда α -квантилем этого распределения называется число χ α , n 2 ^} такое, что

F n χ α , n 2 = α \left\chi _^\right=\alpha }

Замечания

  • Прямо из определения следует, что случайная величина, имеющая распределение хи-квадрат с n степенями свободы, не превышает значение χ α , n 2 ^} с вероятностью α и превышает его с вероятностью 1 − α
  • Функция F n } строго возрастает для любого n ∈ N } Следовательно, определена её обратная функция F n − 1 ^} , и
F n − 1 α = χ α , n 2 ^\alpha =\chi _^}
  • Функция F n − 1 ^} не имеет простого представления Однако, возможно вычислить её значения численно

Аппроксимация квантилей

Для получения приближенных значений квантилей распределения хи-квадрат χ α , n 2 ^} существуют аппроксимации

  • Аппроксимация Корниша-Фишера

χ α , n 2 = n + A n + B + C n + D n + E n n ^=n+A}+B+}}+}+}}}} ,

где:

A = d 2 }} ,

B = 2 3 d 2 − 1 }\left^}-1\right}

C = d ⋅ d 2 − 7 9 2 ^}-7}}}}}

D = − 6 d 4 + 14 d 2 − 32 405 ^}+14^}-32}}}

E = d ⋅ 9 d 4 + 256 d 2 − 433 4860 2 ^}+256^}-433}}}}}

d = 20637 ⋅ ln ⁡ 1 1 − α − 016 04274 − 15774 }-016\right}^}-15774} при 05 ≤ α ≤ 0999

d = − 20637 ⋅ ln ⁡ 1 α − 016 04274 + 15774 }-016\right}^}+15774} при 0001 ≤ α < 05

  • Аппроксимация Голдштейна

χ α , n 2 = n ⋅ [ ∑ i = 0 6 n − i 2 ⋅ d i ⋅ a i + b i n + c i n 2 ] 3 ^=n\cdot ^^}}}\cdot ^}\cdot \left_}+_}}+_}^}}\right}\right]}^}} ,

где d определяется аналогично, а коэффициенты a, b,c приведены в таблице

abc
10000886-02237368-001513904
04713941002607083-0008986007
00001348028001128186002277679
-0008553069-001153761-001323293
0003125580005169654-0006950356
-000084268120002530010001060438
000009780499-00014501170001565326

Таблица квантилей

Нижеприведённая таблица получена с помощью функции chi2inv пакета MATLAB

Также квантили можно получить с помощью других программных средств:

  • пакет LibreOffice, электронная таблица Calc, функция CHIINV
  • библиотека scipy для языка python, функция scipystatsdistributionschi2ppf
  • встроенная функция в электронной таблице Excel : ХИ2ОБР или ХИ2ОБР
  • библиотека MathNet для Net и Mono, метод MathNetNumericsDistributionsChiSquaredInvCDFn,a
  • встроенная функция языка R: qchisqp, df

Чтобы получить значение χ α , n 2 ^} , необходимо найти строку, соответствующую нужному n , и колонку, соответствующую нужному α Искомое число находится в таблице на их пересечении
Например:

χ 0025 , 10 2 = 20483 ^=20483} ; χ 0975 , 10 2 = 3247 ^=3247} Квантили χ α , n 2 ^}
0,010,0250,050,10,20,30,40,50,60,70,80,90,950,9750,99
16,63495,02393,84152,70551,64241,07420,70830,45490,2750,14850,06420,01580,00390,0010,0002
29,21037,37785,99154,60523,21892,40791,83261,38631,02170,71330,44630,21070,10260,05060,0201
311,3459,34847,81476,25144,64163,66492,94622,3661,86921,42371,00520,58440,35180,21580,1148
413,27711,1439,48777,77945,98864,87844,04463,35672,75282,19471,64881,06360,71070,48440,2971
515,08612,83311,079,23647,28936,06445,13194,35153,65552,99992,34251,61031,14550,83120,5543
616,81214,44912,59210,6458,55817,23116,21085,34814,57023,82763,07012,20411,63541,23730,8721
718,47516,01314,06712,0179,80328,38347,28326,34585,49324,67133,82232,83312,16731,68991,239
820,0917,53515,50713,36211,039,52458,35057,34416,42265,52744,59363,48952,73262,17971,6465
921,66619,02316,91914,68412,24210,6569,41368,34287,3576,39335,38014,16823,32512,70042,0879
1023,20920,48318,30715,98713,44211,78110,4739,34188,29557,26726,17914,86523,94033,2472,5582
1124,72521,9219,67517,27514,63112,89911,5310,3419,23738,14796,98875,57784,57483,81573,0535
1226,21723,33721,02618,54915,81214,01112,58411,3410,1829,03437,80736,30385,2264,40383,5706
1327,68824,73622,36219,81216,98515,11913,63612,3411,1299,92578,63397,04155,89195,00884,1069
1429,14126,11923,68521,06418,15116,22214,68513,33912,07810,8219,46737,78956,57065,62874,6604
1530,57827,48824,99622,30719,31117,32215,73314,33913,0311,72110,3078,54687,26096,26215,2293
163228,84526,29623,54220,46518,41816,7815,33813,98312,62411,1529,31227,96166,90775,8122
1733,40930,19127,58724,76921,61519,51117,82416,33814,93713,53112,00210,0858,67187,56426,4078
1834,80531,52628,86925,98922,7620,60118,86817,33815,89314,4412,85710,8659,39058,23077,0149
1936,19132,85230,14427,20423,921,68919,9118,33816,8515,35213,71611,65110,1178,90657,6327
2037,56634,1731,4128,41225,03822,77520,95119,33717,80916,26614,57812,44310,8519,59088,2604
2138,93235,47932,67129,61526,17123,85821,99120,33718,76817,18215,44513,2411,59110,2838,8972
2240,28936,78133,92430,81327,30124,93923,03121,33719,72918,10116,31414,04112,33810,9829,5425
2341,63838,07635,17232,00728,42926,01824,06922,33720,6919,02117,18714,84813,09111,68910,196
2442,9839,36436,41533,19629,55327,09625,10623,33721,65219,94318,06215,65913,84812,40110,856
2544,31440,64637,65234,38230,67528,17226,14324,33722,61620,86718,9416,47314,61113,1211,524
2645,64241,92338,88535,56331,79529,24627,17925,33623,57921,79219,8217,29215,37913,84412,198
2746,96343,19540,11336,74132,91230,31928,21426,33624,54422,71920,70318,11416,15114,57312,879
2848,27844,46141,33737,91634,02731,39129,24927,33625,50923,64721,58818,93916,92815,30813,565
2949,58845,72242,55739,08735,13932,46130,28328,33626,47524,57722,47519,76817,70816,04714,256
3050,89246,97943,77340,25636,2533,5331,31629,33627,44225,50823,36420,59918,49316,79114,953
3152,19148,23244,98541,42237,35934,59832,34930,33628,40926,4424,25521,43419,28117,53915,655
3253,48649,4846,19442,58538,46635,66533,38131,33629,37627,37325,14822,27120,07218,29116,362
3354,77650,72547,443,74539,57236,73134,41332,33630,34428,30726,04223,1120,86719,04717,074
3456,06151,96648,60244,90340,67637,79535,44433,33631,31329,24226,93823,95221,66419,80617,789
3557,34253,20349,80246,05941,77838,85936,47534,33632,28230,17827,83624,79722,46520,56918,509
3658,61954,43750,99847,21242,87939,92237,50535,33633,25231,11528,73525,64323,26921,33619,233
3759,89355,66852,19248,36343,97840,98438,53536,33634,22232,05329,63526,49224,07522,10619,96
3861,16256,89653,38449,51345,07642,04539,56437,33535,19232,99230,53727,34324,88422,87820,691
3962,42858,1254,57250,6646,17343,10540,59338,33536,16333,93231,44128,19625,69523,65421,426
4063,69159,34255,75851,80547,26944,16541,62239,33537,13434,87232,34529,05126,50924,43322,164
4164,9560,56156,94252,94948,36345,22442,65140,33538,10535,81333,25129,90727,32625,21522,906
4266,20661,77758,12454,0949,45646,28243,67941,33539,07736,75534,15730,76528,14425,99923,65
4367,45962,9959,30455,2350,54847,33944,70642,33540,0537,69835,06531,62528,96526,78524,398
4468,7164,20160,48156,36951,63948,39645,73443,33541,02238,64135,97432,48729,78727,57525,148
4569,95765,4161,65657,50552,72949,45246,76144,33541,99539,58536,88433,3530,61228,36625,901
4671,20166,61762,8358,64153,81850,50747,78745,33542,96840,52937,79534,21531,43929,1626,657
4772,44367,82164,00159,77454,90651,56248,81446,33543,94241,47438,70835,08132,26829,95627,416
4873,68369,02365,17160,90755,99352,61649,8447,33544,91542,4239,62135,94933,09830,75528,177
4974,91970,22266,33962,03857,07953,6750,86648,33545,88943,36640,53436,81833,9331,55528,941
5076,15471,4267,50563,16758,16454,72351,89249,33546,86444,31341,44937,68934,76432,35729,707

См также

  • Доверительный интервал для дисперсии нормальной выборки

Примечания

  1. Goldberg H, Levine H Approximate formulas for the percentage points and normalization of t and χ 2 } // AMS 1945 V17 P 216—225
  2. Goldstein RB Chi-square quantiles, Algorithm 451 // Commun Assoc Comp 1973 V 16 P 483—485

Квантили распределения хи-квадрат Информацию О




Квантили распределения хи-квадрат Комментарии

Квантили распределения хи-квадрат
Квантили распределения хи-квадрат
Квантили распределения хи-квадрат Вы просматриваете субъект

Квантили распределения хи-квадрат что, Квантили распределения хи-квадрат кто, Квантили распределения хи-квадрат описание

There are excerpts from wikipedia on this article and video

www.turkaramamotoru.com

Критерий согласия Пирсона χ2 (Хи-квадрат)

До конца XIX века нормальное распределение считалась всеобщим законом вариации данных. Однако К. Пирсон заметил, что эмпирические частоты могут сильно отличаться от нормального распределения. Встал вопрос, как это доказать. Требовалось не только графическое сопоставление, которое имеет субъективный характер, но и строгое количественное обоснование.

Так был изобретен критерий χ2 (хи-квадрат), который проверяет значимость расхождения эмпирических (наблюдаемых) и теоретических (ожидаемых) частот. Это произошло в далеком 1900 году, однако критерий и сегодня на ходу. Более того, его приспособили для решения широкого круга задач. Прежде всего, это анализ номинальных данных, т.е. таких, которые выражаются не количеством, а принадлежностью к какой-то категории. Например, класс автомобиля, пол участника эксперимента, вид растения и т.д. К таким данным нельзя применять математические операции вроде сложения и умножения, для них можно только подсчитать частоты.

Наблюдаемые частоты обозначим О (Observed), ожидаемые – E (Expected). В качестве примера возьмем результат 60-кратного бросания игральной кости. Если она симметрична и однородна, вероятность выпадения любой стороны равна 1/6 и, следовательно, ожидаемое количество выпадения каждой из сторон равна 10 (1/6∙60). Наблюдаемые и ожидаемые частоты запишем в таблицу и нарисуем гистограмму.

Нулевая гипотеза заключается в том, что частоты согласованы, то есть фактические данные не противоречат ожидаемым. Альтернативная гипотеза – отклонения в частотах выходят за рамки случайных колебаний, то есть расхождения статистически значимы. Чтобы сделать строгий вывод, нам потребуется.

  1. Обобщающая мера расхождения между наблюдаемыми и ожидаемыми частотами.
  2. Распределение этой меры при справедливости гипотезы о том, что различий нет.

Начнем с расстояния между частотами. Если взять просто разницу О — E, то такая мера будет зависеть от масштаба данных (частот). Например, 20 — 5 =15 и 1020 – 1005 = 15. В обоих случаях разница составляет 15. Но в первом случае ожидаемые частоты в 3 раза меньше наблюдаемых, а во втором случае – лишь на 1,5%. Нужна относительная мера, не зависящая от масштаба.

Обратим внимание на следующие факты. В общем случае количество градаций, по которым измеряются частоты, может быть гораздо больше, поэтому вероятность того, что отдельно взятое наблюдение попадет в ту или иную категорию, довольно мала. Раз так, то, распределение такой случайной величины будет подчинятся закону редких событий, известному под названием закон Пуассона. В законе Пуассона, как известно, значение математического ожидания и дисперсии совпадают (параметр λ). Значит, ожидаемая частота для некоторой категории номинальной переменной Ei будет являться одновременное и ее дисперсией. Далее, закон Пуассона при большом количестве наблюдений стремится к нормальному. Соединяя эти два факта, получаем, что, если гипотеза о согласии наблюдаемых и ожидаемых частот верна, то, при большом количестве наблюдений, выражение


будет иметь стандартное нормальное распределение.

Важно помнить, что нормальность будет проявляться только при достаточно больших частотах. В статистике принято считать, что общее количество наблюдений (сумма частот) должна быть не менее 50 и ожидаемая частота в каждой градации должна быть не менее 5. Только в этом случае величина, показанная выше, будет иметь стандартное нормальное распределение. Предположим, что это условие выполнено.

У стандартного нормального распределения почти все значение находятся в пределах ±3 (правило трех сигм). Таким образом, мы получили относительную разность в частотах для одной градации. Нам нужна обобщающая мера. Просто сложить все отклонения нельзя – получим 0 (догадайтесь почему). Пирсон предложил сложить квадраты этих отклонений.

Это и есть знамений критерий χ2 Пирсона. Если частоты действительно соответствуют ожидаемым, то значение критерия будет относительно не большим (т.к. большинство отклонений находится около нуля). Но если критерий оказывается большим, то это свидетельствует в пользу существенных различий между частотами.

«Большим» критерий становится тогда, когда появление такого или еще большего значения становится маловероятным. И чтобы рассчитать такую вероятность, необходимо знать распределение критерия при многократном повторении эксперимента, когда гипотеза о согласии частот верна.

Как нетрудно заметить, величина хи-квадрат также зависит от количества слагаемых. Чем их больше, тем большее значение должно быть у критерия, ведь каждое слагаемое внесет свой вклад в общую сумму. Следовательно, для каждого количества независимых слагаемых, будет собственное распределение. Получается, что χ2 – это целое семейство распределений.

И здесь мы подошли к одному щекотливому моменту. Что такое число независимых слагаемых? Вроде как любое слагаемое (т.е. отклонение) независимо. К. Пирсон тоже так думал, но оказался неправ. На самом деле число независимых слагаемых будет на один меньше, чем количество градаций номинальной переменной n. Почему? Потому что, если мы имеем выборку, по которой уже посчитана сумма частот, то одну из частот всегда можно определить, как разность общего количества и суммой всех остальных. Отсюда и вариация будет несколько меньше. Данный факт Рональд Фишер заметил лет через 20 после разработки Пирсоном своего критерия. Даже таблицы пришлось переделывать.

По этому поводу Фишер ввел в статистику новое понятие – степень свободы (degrees of freedom), которое и представляет собой количество независимых слагаемых в сумме. Понятие степеней свободы имеет математическое объяснение и проявляется только в распределениях, связанных с нормальным (Стьюдента, Фишера-Снедекора и сам хи-квадрат).

Чтобы лучше уловить смысл степеней свободы, обратимся к физическому аналогу. Представим точку, свободно движущуюся в пространстве. Она имеет 3 степени свободы, т.к. может перемещаться в любом направлении трехмерного пространства. Если точка движется по какой-либо поверхности, то у нее уже две степени свободы (вперед-назад, вправо-влево), хотя и продолжает находиться в трехмерном пространстве. Точка, перемещающаяся по пружине, снова находится в трехмерном пространстве, но имеет лишь одну степень свободы, т.к. может двигаться либо вперед, либо назад. Как видно, пространство, где находится объект, не всегда соответствует реальной свободе перемещения.

Примерно также распределение статистического критерия может зависеть от меньшего количества элементов, чем нужно слагаемых для его расчета. В общем случае количество степеней свободы меньше наблюдений на число имеющихся зависимостей. Это чистая математика, никакой магии.

Таким образом, распределение χ2 – это семейство распределений, каждое из которых зависит от параметра степеней свободы. А формальное определение критерия хи-квадрат следующее. Распределение χ2 (хи-квадрат) с k степенями свободы — это распределение суммы квадратов k независимых стандартных нормальных случайных величин.

Далее можно было бы перейти к самой формуле, по которой вычисляется функция распределения хи-квадрат, но, к счастью, все давно подсчитано за нас. Чтобы получить интересующую вероятность, можно воспользоваться либо соответствующей статистической таблицей, либо готовой функцией в специализированном ПО, которая есть даже в Excel.

Интересно посмотреть, как меняется форма распределения хи-квадрат в зависимости от количества степеней свободы.

С увеличением степеней свободы распределение хи-квадрат стремится к нормальному. Это объясняется действием центральной предельной теоремы, согласно которой сумма большого количества независимых случайных величин имеет нормальное распределение. Про квадраты там ничего не сказано )).

Проверка гипотезы по критерию хи-квадрат

{module 111}

Вот мы и подошли к проверке гипотез по методу хи-квадрат. В целом техника остается прежней. Выдвигается нулевая гипотеза о том, что наблюдаемые частоты соответствуют ожидаемым (т.е. между ними нет разницы, т.к. они взяты из той же генеральной совокупности). Если этот так, то разброс будет относительно небольшим, в пределах случайных колебаний. Меру разброса определяют по критерию хи-квадрат. Далее либо сам критерий сравнивают с критическим значением (для соответствующего уровня значимости и степеней свободы), либо, что более правильно, рассчитывают наблюдаемый p-value, т.е. вероятность получить такое или еще больше значение критерия при справедливости нулевой гипотезы.

Т.к. нас интересует согласие частот, то отклонение гипотезы произойдет, когда критерий окажется больше критического уровня. Т.е. критерий является односторонним. Однако иногда (иногда) требуется проверить левостороннюю гипотезу. Например, когда эмпирические данные уж оооочень сильно похожи на теоретические. Тогда критерий может попасть в маловероятную область, но уже слева. Дело в том, что в естественных условиях, маловероятно получить частоты, практически совпадающие с теоретическими. Всегда есть некоторая случайность, которая дает погрешность. А вот если такой погрешности нет, то, возможно, данные были сфальсифицированы. Но все же обычно проверяют правостороннюю гипотезу.

Вернемся к задаче с игральным кубиком. Рассчитаем по имеющимся данным значение критерия хи-квадрат.

Теперь найдем табличное значение критерия при 5-ти степенях свободы (k) и уровне значимости 0,05 (α).

То есть χ20,05; 5 = 11,1.

Сравним фактическое и табличное значение. 3,4 (χ2) < 11,1 (χ20,05; 5). Расчетный критерий оказался меньшим, значит гипотеза о равенстве (согласии) частот не отклоняется. На рисунке ситуация выглядит вот так.

Если бы расчетное значение попало в критическую область, то нулевая гипотеза была бы отклонена.

Более правильным будет рассчитать еще и p-value. Для этого нужно в таблице найти ближайшее значение для заданного количества степеней свободы и посмотреть соответствующий ему уровень значимости. Но это прошлый век. Воспользуемся ПЭВМ, в частности MS Excel. В эксель есть несколько функций, связанных с хи-квадрат.

Ниже их краткое описание.

ХИ2.ОБР – критическое значение критерия при заданной вероятности слева (как в статистических таблицах)

ХИ2.ОБР.ПХ – критическое значение критерия при заданной вероятности справа. Функция по сути дублирует предыдущую. Но здесь можно сразу указывать уровень α, а не вычитать его из 1. Это более удобно, т.к. в большинстве случаев нужен именно правый хвост распределения.

ХИ2.РАСП – p-value слева (можно рассчитать плотность).

ХИ2.РАСП.ПХ – p-value справа.

ХИ2.ТЕСТ – по двум заданным диапазонам частот сразу проводит тест хи-квадрат. Количество степеней свободы берется на одну меньше, чем количество частот в столбце (так и должно быть), возвращая значение p-value.

Давайте пока рассчитаем для нашего эксперимента критическое (табличное) значение для 5-ти степеней свободы и альфа 0,05. Формула Excel будет выглядеть так:

=ХИ2.ОБР(0,95;5)

Или так

=ХИ2.ОБР.ПХ(0,05;5)

Результат будет одинаковым – 11,0705. Именно это значение мы видим в таблице (округленное до 1 знака после запятой).

Рассчитаем, наконец, p-value для 5-ти степеней свободы критерия χ2 = 3,4. Нужна вероятность справа, поэтому берем функцию с добавкой ПХ (правый хвост)

=ХИ2.РАСП.ПХ(3,4;5) = 0,63857

Значит, при 5-ти степенях свободы вероятность получить значение критерия χ2 = 3,4 и больше равна почти 64%. Естественно, гипотеза не отклоняется (p-value больше 5%), частоты очень хорошо согласуются.

А теперь проверим гипотезу о согласии частот с помощью функции ХИ2.ТЕСТ.

Проверка гипотезы с помощью функции эксель ХИ2.ТЕСТ

Никаких таблиц, никаких громоздких расчетов. Указав в качестве аргументов функции столбцы с наблюдаемыми и ожидаемыми частотами, сразу получаем p-value. Красота.

Представим теперь, что вы играете в кости с подозрительным типом. Распределение очков от 1 до 5 остается прежним, но он выкидывает 26 шестерок (количество всех бросков становится 78).

p-value в этом случае оказывается 0,003, что гораздо меньше чем, 0,05. Есть серьезные основания сомневаться в правильности игральной кости. Вот, как выглядит эта вероятность на диаграмме распределения хи-квадрат.

Сам критерий хи-квадрат здесь получается 17,8, что, естественно, больше табличного (11,1).

Надеюсь, мне удалось объяснить, что такое критерий согласия χ2 (хи-квадрат) Пирсона и как с его помощью проверяются статистические гипотезы.

Напоследок еще раз о важном условии! Критерий хи-квадрат исправно работает только в случае, когда количество всех частот превышает 50, а минимальное ожидаемое значение для каждой градации не меньше 5. Если в какой-либо категории ожидаемая частота менее 5, но при этом сумма всех частот превышает 50, то такую категорию объединяют с ближайшей, чтобы их общая часта превысила 5. Если это сделать невозможно, или сумма частот меньше 50, то следует использовать более точные методы проверки гипотез. О них поговорим в другой раз.

Ниже находится видео ролик о том, как в Excel проверить гипотезу с помощью критерия хи-квадрат.

Скачать файл с примером.

Поделиться в социальных сетях:

statanaliz.info

Таблица критических точек распределения Пирсона хи-квадрат

Таблица критических точек распределения Пирсона «хи-квадрат»)

k /α0,010,0250,050,950,9750,99
16,634905,023893,841460,003930,000980,00016
29,210347,377765,991460,102590,050640,02010
311,344879,348407,814730,351850,215800,11483
413,276711,143299,487730,710720,484420,29711
515,0862712,832511,07051,145480,831210,55430
616,8118914,4493812,591591,635381,237340,87209
718,4753116,0127614,067142,167351,689871,23904
820,0902417,5345515,507312,732642,179731,64650
921,6659919,0227716,918983,325112,700392,08790
1023,2092520,4831818,307043,940303,246972,55821
1124,7249721,9200519,675144,574813,815753,05348
1226,2169723,3366621,026075,226034,403793,57057
1327,6882524,735622,362035,891865,008754,10692
1429,1412426,1189523,684796,570635,628734,66043
1530,5779127,4883924,995797,260946,262145,22935
1631,9999328,8453526,296237,961656,907665,81221
1733,4086630,1910127,587118,671767,564196,40776
1834,8053131,5263828,869309,390468,230757,01491
1936,1908732,8523330,1435310,117018,906527,63273
2037,5662334,1696131,4104310,850819,590788,26040
2138,9321735,4788832,6705711,5913110,28298,89720
2240,2893636,7807133,9244412,3380110,982329,54249
2341,6384038,0756335,1724613,0905111,6885510,19572
2442,9798239,3640836,4150313,8484312,4011510,85636
2544,3141040,6464737,6524814,6114113,1197211,52398
2645,6416841,9231738,8851415,3791613,8439112,19815
2746,9629443,1945140,1132716,1514014,5733812,87850
2848,2782444,4607941,3371416,9278815,3078613,56471
2949,5878845,7222942,5569717,7083716,0470714,25645
3050,8921846,9792443,7729718,4926616,7907714,95346
3152,1913948,2318944,9853419,2805717,5387415,65546
3253,4857749,4804446,1942620,0719118,2907616,36222
3354,7755450,7250847,3998820,8665319,0466617,07351
3456,0609151,9660048,6023721,6642819,8062517,78915
3557,3420753,2033549,8018522,4650220,5693818,50893
3658,6192154,4372950,9984623,2686121,3358819,23268
3759,8925055,6679752,1923224,0749422,1056319,96023
3861,1620956,8955253,3835424,883922,8784820,69144
3962,4281258,1200654,5722325,6953923,6543221,42616
4063,6907459,3417155,7584826,509324,4330422,16426
4164,9500760,5605756,9423927,3255525,2145222,90561
4266,2062461,7767658,1240428,1440525,9986623,65009
4367,4593562,9903659,3035128,9647226,7853724,39760
4468,7095164,2014660,4808929,7874827,5745725,14803
4569,9568365,4101661,6562330,6122628,3661525,90127
4671,2014066,6165362,8296231,4390029,1600526,65724
4772,4433167,8206564,0011132,2676229,9562027,41585
4873,6826469,0225965,1707733,0980830,7545128,17701
4974,9194770,2224166,3386533,9303131,5549228,94065
5076,1538971,4202067,5048134,7642532,3573629,70668


Обычно такая точность (5 знаков после запятой) не требуется. Достаточно 1-2 знаков после запятой.

 

www.matem96.ru

Распределение «хи-квадрат» и его применение

Распределение вероятных значений случайной величины χ2 непрерывно и ассиметрично. Оно зависит от числа степеней свободы (n) и приближается к нормальному распределению по мере увеличения числа наблюдений. Поэтому применение критерия χ2 к оценке дискретных распределений сопряжено с некоторыми погрешностями, которые сказываются на его величине, особенно на малочисленных выборках. Для получения более точных оценок выборка, распределяемая в вариационный ряд, должна иметь не менее 50 вариантов. Правильное применение критерия χ2 требует также, чтобы частоты вариантов в крайних классах не были бы меньше 5; если их меньше 5, то они объединяются с частотами соседних классов, чтобы в сумме составляли величину большую или равную 5. Соответственно объединению частот уменьшается и число классов (N). Число степеней свободы устанавливается по вторичному числу классов с учетом числа ограничений свободы вариации.

Так как точность определения критерия χ2 в значительной степени зависит от точности расчета теоретических частот (Т), для получения разности между эмпирическими и вычисленными частотами следует использовать неокругленные теоретические частоты.

В качестве примера возьмем исследование, опубликованное на сайте, который посвящен применению статистических методов в гуманитарных науках.

Критерий «Хи-квадрат» позволяет сравнивать распределения частот вне зависимости от того, распределены они нормально или нет.

Под частотой понимается количество появлений какого-либо события. Обычно, с частотой появления события имеют дело, когда переменные измерены в шкале наименований и другой их характеристики, кроме частоты подобрать невозможно или проблематично. Другими словами, когда переменная имеет качественные характеристики. Так же многие исследователи склонны переводить баллы теста в уровни (высокий, средний, низкий) и строить таблицы распределений баллов, чтобы узнать количество человек по этим уровням. Чтобы доказать, что в одном из уровней (в одной из категорий) количество человек действительно больше (меньше) так же используется коэффициент Хи-квадрат.

Разберем самый простой пример.

Среди младших подростков был проведён тест для выявления самооценки. Баллы теста были переведены в три уровня: высокий, средний, низкий. Частоты распределились следующим образом:

Высокий (В) 27 чел.

Средний (С) 12 чел.

Низкий (Н) 11 чел.

Очевидно, что детей с высокой самооценкой большинство, однако это нужно доказать статистически. Для этого используем критерий Хи-квадрат.

Наша задача проверить, отличаются ли полученные эмпирические данные от теоретически равновероятных. Для этого необходимо найти теоретические частоты. В нашем случае, теоретические частоты – это равновероятные частоты, которые находятся путём сложения всех частот и деления на количество категорий.

В нашем случае:

(В + С + Н)/3 = (27+12+11)/3 = 16,6

Формула для расчета критерия хи-квадрат:

χ2 = ∑(Э — Т)² / Т

Для обработки полученных данных используем критерий хи-квадрат.

Для этого построим таблицу распределения эмпирических частот, т.е. тех частот, которые мы наблюдаем:

Теоретически, мы ожидаем, что частоты распределятся равновероятно, т.е. частота распределится пропорционально между мальчиками и девочками. Построим таблицу теоретических частот. Для этого умножим сумму по строке на сумму по столбцу и разделим получившееся число на общую сумму (s).

Итоговая таблица для вычислений будет выглядеть так:

χ2 = ∑(Э — Т)² / Т

n = (R — 1), где R – количество строк в таблице.

В нашем случае хи-квадрат = 4,21; n = 2.

По таблице критических значений критерия находим: при n = 2 и уровне ошибки 0,05 критическое значение χ2 = 5,99.

Полученное значение меньше критического, а значит принимается нулевая гипотеза.

Вывод: учителя не придают значение полу ребенка при написании ему характеристики.

Таблица 1

Студенты почти всех специальностей изучают в конце курса высшей математики раздел «теория вероятностей и математическая статистика», реально они знакомятся лишь с некоторыми основными понятиями и результатами, которых явно не достаточно для практической работы. С некоторыми математическими методами исследования студенты встречаются в специальных курсах (например, таких, как «Прогнозирование и технико-экономическое планирование», «Технико-экономический анализ», «Контроль качества продукции», «Маркетинг», «Контроллинг», «Математические методы прогнозирования», «Статистика» и др. – в случае студентов экономических специальностей), однако изложение в большинстве случаев носит весьма сокращенный и рецептурный характер. В результате знаний у специалистов по прикладной статистике недостаточно.

Поэтому большое значение имеет курс «Прикладная статистика» в технических вузах, а в экономических вузах – курса «Эконометрика», поскольку эконометрика – это, как известно, статистический анализ конкретных экономических данных.

1. Орлов А.И. Прикладная статистика. М.: Издательство «Экзамен», 2004.

2. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1999. – 479с.

3. Айвозян С.А. Теория вероятностей и прикладная статистика, т.1. М.: Юнити, 2001. – 656с.

4. Хамитов Г.П., Ведерникова Т.И. Вероятности и статистика. Иркутск: БГУЭП, 2006 – 272с.

5. Ежова Л.Н. Эконометрика. Иркутск: БГУЭП, 2002. – 314с.

6. Мостеллер Ф. Пятьдесят занимательных вероятностных задач с решениями. М. : Наука, 1975. – 111с.

7. Мостеллер Ф. Вероятность. М. : Мир, 1969. – 428с.

8. Яглом А.М. Вероятность и информация. М. : Наука, 1973. – 511с.

9. Чистяков В.П. Курс теории вероятностей. М.: Наука, 1982. – 256с.

10. Кремер Н.Ш. Теория вероятностей и математическая статистика. М.: ЮНИТИ, 2000. – 543с.

11. Математическая энциклопедия, т.1. М.: Советская энциклопедия, 1976. – 655с.

12. http://psystat.at.ua/ — Статистика в психологии и педагогике. Статья Критерий Хи-квадрат. Автор: Попов О.А.

mirznanii.com

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *