Таблица т критериев стьюдента: Таблица значений критерия Стьюдента (t критерия)

Таблица значений критерия Стьюдента (t критерия)

Критические значения коэффициента Стьюдента (t-критерия) для различной доверительной вероятности

p и числа степеней свободы f:
f p
0.80 0.90 0.95 0.98 0.99 0.995 0.998 0.999
1 3.0770 6.
3130
12.7060 31.820 63.656 127.656 318.306 636.619
2 1.8850 2.9200 4.3020 6.964 9.924 14.089 22.327 31.599
3 1.6377 2.35340 3.182 4.540 5.840 7.458 10.214 12.924
4
1. 5332 2.13180 2.776 3.746 4.604 5.597 7.173 8.610
5 1.4759 2.01500 2.570 3.649 4.0321 4.773 5.893 6.863
6 1.4390 1.943 2.4460 3.1420 3.7070 4.316 5.2070 5.958
7 1. 4149 1.8946 2.3646 2.998 3.4995 4.2293 4.785 5.4079
8 1.3968 1.8596 2.3060 2.8965 3.3554 3.832 4.5008 5.0413
9
1.3830 1.8331 2.2622 2.8214 3.2498 3.6897 4.2968 4.780
10 1. 3720 1.8125 2.2281 2.7638 3.1693 3.5814 4.1437 4.5869
11 1.363 1.795 2.201 2.718
3.105
3.496 4.024 4.437
12 1.3562 1.7823 2.1788 2.6810 3.0845 3.4284 3.929 4.178
13 1. 3502 1.7709 2.1604 2.6503 3.1123 3.3725 3.852 4.220
14
1.3450
1.7613 2.1448 2.6245 2.976 3.3257 3.787 4.140
15 1.3406 1.7530 2.1314 2.6025 2.9467 3.2860 3.732 4.072
16 1. 3360 1.7450 2.1190 2.5830 2.9200 3.2520
3.6860
4.0150
17 1.3334 1.7396 2.1098 2.5668 2.8982 3.2224 3.6458 3.965
18 1.3304 1.7341 2.1009 2.5514 2.8784 3.1966 3.6105 3.9216
19 1. 3277
1.7291
2.0930 2.5395 2.8609 3.1737 3.5794 3.8834
20 1.3253 1.7247 2.08600 2.5280 2.8453 3.1534 3.5518 3.8495
21 1.3230 1.7200 2.2.0790 2.5170 2.8310 3.1350 3.5270 3.8190
22
1. 3212 1.7117 2.0739 2.5083 2.8188 3.1188 3.5050 3.7921
23 1.3195 1.7139 2.0687 2.4999 2.8073 3.1040 3.4850 3.7676
24 1.3178 1.7109 2.0639 2.4922 2.7969 3.0905 3.4668 3.7454
25 1. 3163 1.7081 2.0595 2.4851 2.7874 3.0782 3.4502 3.7251
26 1.315 1.705 2.059 2.478 2.778 3.0660 3.4360 3.7060
27
1.3137 1.7033 2.0518 2.4727 2.7707 3.0565 3.4210 3.6896
28 1. 3125 1.7011 2.0484 2.4671 2.7633 3.0469 3.4082 3.6739
29 1.3114 1.6991 2.0452 2.4620 2.7564 3.0360 3.3962 3.8494
30 1.3104 1.6973 2.0423 2.4573 2.7500 3.0298 3.3852 3.6460
32 1. 3080 1.6930 2.0360 2.4480 2.7380 3.0140 3.3650 3.6210
34 1.3070 1.6909 2.0322 2.4411 2.7284 3.9520 3.3479 3.6007
36 1.3050 1.6883 2.0281 2.4345 2.7195 9.490 3.3326 3.5821
38 1. 3042 1.6860 2.0244 2.4286 2.7116 3.9808 3.3190 3.5657
40 1.303 1.6839 2.0211 2.4233 2.7045 3.9712 3.3069 3.5510
42 1.320 1.682 2.018 2.418 2.6980 2.6930 3.2960 3.5370
44 1. 301 1.6802 2.0154 2.4141 2.6923 3.9555 3.2861 3.5258
46 1.300 1.6767 2.0129 2.4102 2.6870 3.9488 3.2771 3.5150
48 1.299 1.6772 2.0106 2.4056 2.6822 3.9426 3.2689 3.5051
50 1. 298 1.6759 2.0086 2.4033 2.6778 3.9370 3.2614 3.4060
55 1.2997 1.673 2.0040 2.3960 2.6680 2.9240 3.2560 3.4760
60 1.2958 1.6706 2.0003 2.3901 2.6603 3.9146 3.2317 3.4602
65 1. 2947 1.6686 1.997 2.3851 2.6536 3.9060 3.2204 3.4466
70 1.2938 1.6689 1.9944 2.3808 2.6479 3.8987 3.2108 3.4350
80 1.2820 1.6640 1.9900 2.3730 2.6380 2.8870 3.1950 3.4160
90 1. 2910 1.6620 1.9867 2.3885 2.6316 2.8779 3.1833 3.4019
100 1.2901 1.6602 1.9840 2.3642 2.6259 2.8707 3.1737 3.3905
120 1.2888 1.6577 1.9719 2.3578 2.6174 2.8598 3.1595 3.3735
150 1. 2872 1.6551 1.9759 2.3515 2.6090 2.8482 3.1455 3.3566
200 1.2858 1.6525 1.9719 2.3451 2.6006 2.8385 3.1315 3.3398
250 1.2849 1.6510 1.9695 2.3414 2.5966 2.8222 3.1232 3.3299
300 1. 2844 1.6499 1.9679 2.3388 2.5923 2.8279 3.1176 3.3233
400 1.2837 1.6487 1.9659 2.3357 2.5882 2.8227 3.1107 3.3150
500 1.2830 1.6470 1.9640 2.3330 2.7850 2.8190 3.1060 3.3100

Ссылки по теме:
— Он-лайн программа для расчета доверительного интервала по критерию Стьюдента
— Лекция 3. Доверительный интервал. Оценка случайной погрешности

По материалам книги «Статистика в аналитической хими». К. Дерффель, Москва, «Мир», 1994

Дата: 17 января 2012


 


Добавить комментарий

 

Таблица значений критерия Стьюдента (t-критерия)

Skip to content

Artman Таблицы

p — доверительной вероятности и f — числа степеней свободы

(коэффициент стьюдента находим по таблице)

fp
0.800.900.950. 980.990.9950.9980.999
13.07706.313012.706031.82063.656127.656318.306636.619
21.88502.92004.30206.9649.92414.08922.32731.599
31.63772.353403.1824.5405.8407. 45810.21412.924
41.53322.131802.7763.7464.6045.5977.1738.610
51.47592.015002.5703.6494.03214.7735.8936.863
61.43901.9432.44603.14203.70704.3165.20705.958
71. 41491.89462.36462.9983.49954.22934.7855.4079
81.39681.85962.30602.89653.35543.8324.50085.0413
91.38301.83312.26222.82143.24983.68974.29684.780
101.37201.81252.22812. 76383.16933.58144.14374.5869
111.3631.7952.2012.7183.1053.4964.0244.437
121.35621.78232.17882.68103.08453.42843.9294.178
131.35021.77092.16042.65033.11233.37253. 8524.220
141.34501.76132.14482.62452.9763.32573.7874.140
151.34061.75302.13142.60252.94673.28603.7324.072
161.33601.74502.11902.58302.92003.25203.68604.0150
171. 33341.73962.10982.56682.89823.22243.64583.965
181.33041.73412.10092.55142.87843.19663.61053.9216
191.32771.72912.09302.53952.86093.17373.57943.8834
201.32531.72472.086002. 52802.84533.15343.55183.8495
211.32301.72002.2.0792.51702.83103.13503.52703.8190
221.32121.71172.07392.50832.81883.11883.50503.7921
231.31951.71392.06872.49992.80733.10403. 48503.7676
241.31781.71092.06392.49222.79693.09053.46683.7454
251.31631.70812.05952.48512.78743.07823.45023.7251
261.3151.7052.0592.4782.7783.06603.43603.7060
271. 31371.70332.05182.47272.77073.05653.42103.6896
281.31251.70112.04842.46712.76333.04693.40823.6739
291.31141.69912.04522.46202.75643.03603.39623.8494
301.31041.69732.04232. 45732.75003.02983.38523.6460
321.30801.69302.03602.44802.73803.01403.36503.6210
341.30701.69092.03222.44112.72843.95203.34793.6007
361.30501.68832.02812.43452.71959.4903. 33263.5821
381.30421.68602.02442.42862.71163.98083.31903.5657
401.3031.68392.02112.42332.70453.97123.30693.5510
421.3201.6822.0182.4182.69802.69303.29603.5370
441. 3011.68022.01542.41412.69233.95553.28613.5258
461.3001.67672.01292.41022.68703.94883.27713.5150
481.2991.67722.01062.40562.68223.94263.26893.5051
501.2981.67592.00862. 40332.67783.93703.26143.4060
551.29971.6732.00402.39602.66802.92403.25603.4760
601.29581.67062.00032.39012.66033.91463.23173.4602
651.29471.66861.9972.38512.65363.90603. 22043.4466
701.29381.66891.99442.38082.64793.89873.21083.4350
801.28201.66401.99002.37302.63802.88703.19503.4160
901.29101.66201.98672.38852.63162.87793.18333.4019
1001. 29011.66021.98402.36422.62592.87073.17373.3905
1201.28881.65771.97192.35782.61742.85983.15953.3735
1501.28721.65511.97592.35152.60902.84823.14553.3566
2001.28581.65251.97192. 34512.60062.83853.13153.3398
2501.28491.65101.96952.34142.59662.82223.12323.3299
3001.28441.64991.96792.33882.59232.82793.11763.3233
4001.28371.64871.96592.33572.58822.82273. 11073.3150
5001.28301.64701.96402.33302.78502.81903.10603.3100

20715

t-критерий Стьюдента | Определение, формула и пример

Связанные темы:
проверка гипотезы Распределение Стьюдента

См. весь связанный контент →

Стьюдента t-критерий , в статистике метод проверки гипотез о среднем значении небольшой выборки, взятой из нормально распределенной совокупности, когда стандартное отклонение совокупности неизвестно.

В 1908 году Уильям Сили Госсет, англичанин, публикующийся под псевдонимом Студент, разработал т — тест и т раздача. (Госсет работал на пивоварне Guinness в Дублине и обнаружил, что существующие статистические методы, использующие большие выборки, бесполезны для малых размеров выборок, с которыми он столкнулся в своей работе.) Распределение t представляет собой семейство кривых, в которых число градусов свободы (количество независимых наблюдений в выборке минус одно) задает конкретную кривую. По мере увеличения размера выборки (и, следовательно, степеней свободы) 9Распределение 0015 t приближается к форме колокола стандартного нормального распределения. На практике для тестов, включающих среднее значение выборки размером более 30, обычно применяется нормальное распределение.

Обычно сначала формулируют нулевую гипотезу, которая утверждает, что нет эффективной разницы между наблюдаемым средним значением выборки и предполагаемым или заявленным средним значением генеральной совокупности, т. е. что любое измеренное различие обусловлено только случайностью. Например, в сельскохозяйственном исследовании нулевая гипотеза может заключаться в том, что применение удобрений не повлияло на урожайность, и будет проведен эксперимент, чтобы проверить, увеличило ли оно урожай. В общем t -критерий может быть либо двусторонним (также называемым двусторонним), просто утверждающим, что средние значения не эквивалентны, либо односторонним, определяющим, больше или меньше наблюдаемое среднее, чем предполагаемое среднее. Затем вычисляется тестовая статистика t . Если наблюдаемая t -статистика более экстремальна, чем критическое значение, определяемое соответствующим эталонным распределением, нулевая гипотеза отклоняется. Соответствующее эталонное распределение для t -статистики — это т раздача. Критическое значение зависит от уровня значимости теста (вероятность ошибочного отклонения нулевой гипотезы).

Например, предположим, что исследователь хочет проверить гипотезу о том, что выборка размером n = 25 со средним значением x = 79 и стандартным отклонением s = 10 была взята случайным образом из совокупности со средним значением μ = 75 и неизвестное стандартное отклонение. Используя формулу для t -статистики, вычисляем t равно 2. Для двустороннего теста при общем уровне значимости α = 0,05 критические значения из распределения t по 24 степеням свободы составляют −2,064 и 2,064. Вычисленное t не превышает этих значений, следовательно, нулевая гипотеза не может быть отвергнута с 95-процентной уверенностью. (Уровень достоверности равен 1 − α.)

Второе применение распределения t проверяет гипотезу о том, что две независимые случайные выборки имеют одно и то же среднее значение. 9Распределение 0015 t также можно использовать для построения доверительных интервалов для истинного среднего значения генеральной совокупности (первое приложение) или для разницы между средними значениями двух выборок (второе приложение). См. также интервальную оценку .

Редакторы Британской энциклопедии Эта статья была недавно отредактирована и обновлена ​​Эриком Грегерсеном.

SAS — одновыборочный t-критерий

SAS — одновыборочный t-тест

SAS — одновыборочный t-критерий


 


После успешного завершения этого модуля студент сможет:

  1. Описание компонентов статистического теста
  2. Объясните, что подразумевается под ошибками типа I и типа II
  3. Объясните и используйте стандартное нормальное распределение
  4. Объясните и используйте t-распределение
  5. Используйте z- и t-таблицы
  6. Выполнение и интерпретация одновыборочного t-критерия с использованием proc ttest
  7. Выполнение и интерпретация парного t-критерия с использованием proc ttest

 

 


Компоненты статистического теста

  1. Гипотезы: нулевая (H 0 ) и альтернативная (H 1 )
  2. Уровень значимости (α)
  3. Статистика теста
  4. Правило принятия решения
  5. Заключение

Перед просмотром данных следует сформулировать нулевую и альтернативную гипотезы, выбрать уровень значимости (α) (часто равный 0,05), а также выбрать тестовую статистику, которая будет суммировать информацию в выборке. Основываясь на гипотезах, тестовой статистике и выборочном распределении тестовой статистики, мы можем найти критическую область тестовой статистики, которая представляет собой набор значений для статистического теста, которые демонстрируют доказательства в пользу альтернативной гипотезы и против нулевой гипотезы. . Эта область выбирается таким образом, чтобы вероятность попадания тестовой статистики в критическую область при верности нулевой гипотезы (ошибка I рода) была равна ранее выбранному уровню значимости (α).

Затем вычисляется тестовая статистика:

  • если значение тестовой статистики попадает в критическую область, то нулевая гипотеза отвергается на выбранном уровне значимости.
  • , если значение тестовой статистики выходит за пределы критической области, то недостаточно доказательств для отклонения нулевой гипотезы на выбранном уровне значимости.

Также можно рассчитать p-значение, вероятность результата теста, по крайней мере столь же экстремального, как тот, который наблюдался, если нулевая гипотеза была верна.

Пример. Парный t-критерий изменения уровня холестерина с 1952 по 1962 год

d — разница в уровне холестерина у каждого человека с 1952 по 1962 год

 

Гипотезы:

H 0 : В среднем уровень холестерина не изменился с 1952 по 1962 год

( Н 0 : мк д = 0)

H 1 : Наблюдается среднее ненулевое изменение уровня холестерина с 1952 по 1962 год

( H 1 : μ d ≠ 0)

Статистика испытаний:

Правило принятия решения: Отклонить H 0 при α=0,05, если |t| > 2,093

Решающее правило построено на основе выборочного распределения для тестовой статистики t. В этом примере выборочное распределение тестовой статистики t является t-распределением Стьюдента с 19 степенями свободы. Критическое значение 2,093 можно прочитать из таблицы t-распределения.

Результаты:

.

Заключение:

Уровни холестерина снизились в среднем на 69,8 единиц с 1952 по 1962 год. Для уровня значимости 0,05 и 19степеней свободы, критическое значение для t-критерия равно 2,093. Поскольку абсолютное значение нашей тестовой статистики (6,70) больше критического значения (2,093), мы отвергаем нулевую гипотезу и заключаем, что в среднем имеется ненулевое изменение уровня холестерина с 1952 по 1962 год.

Обратите внимание, что эта сводка включает:

  • Выполняется тест. (Парный t-критерий в этом примере)
  • Формулировка нулевой гипотезы и альтернативной гипотезы с точки зрения интересующего параметра генеральной совокупности. (средняя разница в предыдущем примере)
  • Величина, направление и единицы измерения эффекта (наблюдаемая средняя разница).
    • среднее уменьшение на 69,8 единицы с 1952 по 1962 год
    • Обратите внимание, об этом следует сообщать независимо от того, является ли оно статистически значимым!
  • Тестовая статистика и степени свободы
  • Заявление о том, является ли эффект (наблюдаемое различие) статистически значимым, и уровень значимости (α)
  • Обратите внимание, что здесь мы сравнили тестовую статистику с критическим значением. Использование p-значения также удовлетворяет этому критерию.

 


В идеале оба типа ошибок (α и β) должны быть небольшими. Однако на практике мы фиксируем α и выбираем размер выборки n , достаточно большой, чтобы сохранить β небольшим (то есть сохранить большую мощность).

Пример:

Два препарата должны быть сравнены в клинических испытаниях для лечения болезни X. Препарат А дешевле, чем препарат В. Эффективность измеряется с использованием непрерывной переменной Y и .H 0 : μ 1 2 .

Ошибка типа I — возникает, если два препарата действительно одинаково эффективны, но мы заключаем, что препарат Б лучше. Следствие – финансовые потери.

Ошибка типа II — возникает, если препарат Б действительно более эффективен, но мы не можем отвергнуть нулевую гипотезу и сделать вывод, что нет существенных доказательств того, что два препарата различаются по эффективности. Каковы последствия в этом случае?


Характеристики стандартного нормального распределения

Нормальное распределение сосредоточено в среднем, μ. Степень, в которой значения данных населения отклоняются от среднего значения, определяется стандартным отклонением σ. 68% распределения находится в пределах 1 стандартного отклонения от среднего; 95% находится в пределах двух стандартных отклонений от среднего значения; и 99,9% лежат в пределах 3 стандартных отклонений от среднего значения. Площадь под кривой интерпретируется как вероятность, при этом общая площадь = 1. Нормальное распределение симметрично относительно μ. (то есть медиана и среднее совпадают).

Стандартное нормальное распределение — это нормальное распределение со средним значением, равным нулю, и стандартным отклонением, равным 1. Стандартное нормальное распределение симметрично относительно нуля: половина общей площади под кривой находится по обе стороны от нуля. Суммарная площадь под кривой равна единице.

Для более подробного обсуждения стандартного нормального распределения см. презентацию по этой концепции в онлайн-модуле «Вероятность» из BS704.

 

Площадь хвостов распределения

 

Суммарная площадь под кривой, удаленная от нуля более чем на 1,96 единицы, равна 5%. Поскольку кривая симметрична, в каждом хвосте 2,5%. Поскольку общая площадь под кривой = 1, кумулятивная вероятность Z > +1,96 = 0/025.

«Таблица Z» предоставляет площадь под нормальной кривой, связанной со значениями z.

В таблице ниже приведены кумулятивные вероятности для различных значений Z.

 

Использование z-таблицы

В таблице z приведены подробные соответствия P(Z>z) для значений z от 0 до 3 с точностью до 0,01 (0,00, 0,01, 0,02, 0,03,…2,99, 3,00).

Итак, если мы хотим узнать вероятность того, что Z больше 2,00, например, мы находим пересечение 2,0 в левом столбце и 0,00 в верхней строке и видим, что P(Z<2,00) = 0,0228 .

В качестве альтернативы мы можем вычислить критическое значение z, связанное с данной вероятностью хвоста. Так, например, если мы хотим найти критическое значение z, такое, что P(Z > z) = 0,025, мы заглянем внутрь таблицы и найдем, что оно связано с 1,9.в левом столбце и 0,06 в верхней строке, поэтому z=1,96. Таким образом, мы можем написать,

P(Z > 1,96) = 0,025.

 Поскольку распределение симметрично, мы можем просто перемножить односторонние вероятности, чтобы получить двустороннюю вероятность:

 

P(Z < -z ИЛИ Z > z) = P(|Z| > z) = 2 * P(Z > z)

Пример:

 

P(|Z| > 1,96) = 2 * P(Z > 1,96) = 2 * (0,025) = 0,05, или 5%

 

Пример:

 

Изучив таблицу Z, мы обнаружили, что около 0,0418 (4,18%) площади под кривой находится выше z = 1,73. Таким образом, для населения, которое следует стандартному нормальному распределению, примерно 4,18% наблюдений будут лежать выше 1,73. Общая площадь под кривой, удаленной от нуля более чем на 1,73 единицы, равна 2(0,0418), или 0,0836, или 8,36%.

 

 

 


Дана нормально распределенная переменная X со средним значением совокупности и стандартным отклонением совокупности σ

 

 

Пример:

Предположим, что нормально распределенная популяция имеет μ = 20, σ = 5, и мы хотим знать, какой процент распределения превышает X = 30.

 

Это эквивалентно вопросу о том, какая часть распределения превышает среднее значение более чем на 2 стандартных отклонения, или какова вероятность того, что X превышает среднее значение более чем на 2 стандартных отклонения.

Из таблицы Z видно, что 2,28% распределения лежит выше Z = 2,00. Таким образом, 2,28% популяции, имеющей нормальное распределение с μ, равным 20, и σ, равным 5, лежат выше X = 30,

.

Мы можем записать это как

P(X > 30) = P(Z > 2) = 0,0228 или 2,28%

 


Статистический показатель, используемый для оценки среднего значения совокупности, μ, представляет собой выборочное среднее, .

 

Если X имеет распределение со средним значением μ и стандартным отклонением σ и приблизительно нормально распределено или n велико, то имеет приблизительно нормальное распределение со средним значением μ и стандартной ошибкой ..

Когда известно σ

 

Если стандартное отклонение σ равно известному , мы можем преобразовать его в приблизительно стандартную нормальную переменную Z:

 

 

Пример:

Из предыдущего примера μ=20 и σ=5. Предположим, мы берем выборку размером n = 16 из этой совокупности и хотим знать, насколько вероятно, что мы увидим среднее значение выборки больше 22, то есть P( > 22)?

 

Таким образом, вероятность того, что среднее значение выборки будет > 22, равна вероятности того, что Z > 1,6. Мы используем таблицу Z, чтобы определить это:

P(> 22) = P(Z> 1,6) = 0,0548.

 

 

Упражнение. Предположим, что в приведенном выше примере мы должны выбрать размер выборки 49 вместо n=16. Как это повлияет на стандартную ошибку среднего? Как вы думаете, как это повлияет на вероятность того, что среднее значение выборки будет >22? Используйте таблицу Z, чтобы определить вероятность.

Ответ

 

Когда σ неизвестно

Если стандартное отклонение σ равно unknown , мы не можем преобразовать в стандартный нормальный. Однако мы можем оценить σ, используя стандартное отклонение выборки, s , и преобразовать в переменную с аналогичным распределением, распределение t . На самом деле существует множество распределений t, индексированных по степеням свободы (df). По мере увеличения степеней свободы распределение t приближается к стандартному нормальному распределению.

 

 

 

Если X примерно нормально распределено, то

имеет t-распределение с (n-1) степенями свободы (df)

 

Использование t-таблицы

Примечание: Если n велико, то t приблизительно нормально распределены.

 

 

 

В таблице z приведены подробные соответствия P(Z>z) для значений z от 0 до 3 с точностью до 0,01 (0,00, 0,01, 0,02, 0,03,…2,9).9. 3.00). (Односторонние) вероятности находятся внутри таблицы, а критические значения z — в первом столбце и верхней строке.

t-таблица представлена ​​по-разному, с отдельными строками для каждой df, со столбцами, представляющими двустороннюю вероятность, и с критическим значением внутри таблицы.

В t-таблице также содержится гораздо меньше деталей; вся информация в z-таблице суммируется в последней строке t-таблицы, индексируемой df = ∞.

Итак, если мы посмотрим на последнюю строку для z=1,96 и дойдем до верхней строки, мы обнаружим, что

 P(|Z| > 1,96) = 0,05

 

Упражнение. Какое критическое значение соответствует двусторонней вероятности 0,01?

Ответ

Теперь предположим, что мы хотим узнать вероятность того, что Z больше 2,00. t-таблица дает нам

P(|Z| > 1,96) = 0,05

и

P(|Z| > 2,326) = 0,02

 

Итак, все, что мы можем сказать, это то, что P(|Z| > 2.00) находится между 2% и 5%, возможно, ближе к 5%! Используя z-таблицу, мы нашли, что это ровно 4,56%.

Пример:

В предыдущем примере мы взяли выборку n=16 из совокупности с μ=20 и σ=5. Мы обнаружили, что вероятность того, что среднее значение выборки больше 22, составляет P(> 22) = 0,0548. Предположим, что это неизвестно, и нам нужно использовать s для его оценки. Мы находим, что s = 4. Затем мы вычисляем t, которое соответствует t-распределению с df = (n-1) = 24,9.0009

 

Из таблиц видно, что двусторонняя вероятность находится между 0,01 и 0,05.

P(|T| > 1,711) = 0,05

и

P(|T| > 2,064) = 0,01

 

Чтобы получить одностороннюю вероятность, разделите двустороннюю вероятность на 2.

 

P(T > 1,711) = ½ P(|T| > 1,711) = ½(0,05) = 0,025

и

P(T > 2,064) = ½ P(|T| > 2,064) = ½(0,01) = 0,005

Таким образом, вероятность того, что среднее значение выборки больше 22, составляет от 0,005 до 0,025 (или от 0,5% до 2,5%)

 

Упражнение: . Если µ=15, s=6 и n=16, какова вероятность того, что >18?

Ответ


Одновыборочная проверка средних значений сравнивает среднее значение выборки с предварительно заданным значением и проверяет отклонение от этого значения. Например, мы можем знать, что средний вес при рождении белых детей в США составляет 3410 граммов, и хотим сравнить средний вес при рождении выборки черных детей с этим значением.

 

Предположения

  • Независимые наблюдения.
  • Совокупность, из которой взяты данные, имеет нормальное распределение.

Гипотеза:

 

, где μ 0 — предварительно заданное значение (в нашем случае это будет 3410 грамм).

 

Статистика испытаний

  • Сначала вычислите , среднее значение выборки.
  • Мы выбираем уровень значимости α = 0,05

 

  • Если известно стандартное отклонение:

 

 Используя уровень значимости 0,05, мы отклоняем нулевую гипотезу, если z больше 1,96 или меньше -1,96.

 

  • Если стандартное отклонение неизвестно:

 

Используя уровень значимости 0,05, мы отвергаем нулевую гипотезу, если |t| больше критического значения из t-распределения с df = n-1.

 

Примечание. Заштрихованная область называется критической областью или областью отклонения.

 

Мы также можем рассчитать 95% доверительный интервал вокруг среднего значения. Общая форма доверительного интервала вокруг среднего, если σ неизвестно, равна

.

Для двустороннего 95% доверительного интервала используйте таблицу t-распределения (приведенную в конце раздела), чтобы выбрать подходящее критическое значение t для двустороннего α=0,05.

Пример: один образец t-критерия

Восстановить данные, использованные в модуле 3, в файле данных «dixonmassey».

 

данные dixonmassey;

ввод Обс хол52 хол62 возраст кор дхол агелт 50 $;

строк данных;

;

Многие врачи рекомендуют иметь уровень общего холестерина ниже 200 мг/дл. Мы проверим, отличается ли популяция 1952 г., из которой была собрана выборка Диксона и Мэсси, в среднем статистически от этого рекомендуемого уровня.

  • H 0 : μ = 200 по сравнению с H 1 : μ ≠ 200
  • α=0,05
  • Наша выборка из n = 20 имеет = 311,15 и s = 64,3929.
  • df = 19, поэтому отклонить H 0 если |t| > 2,093

Рассчитать:

 

|т| > 2,093, поэтому мы отвергаем H 0

95%-й доверительный интервал вокруг среднего составляет

 311,15 ± (2,093)(64,3929/√20)

311,15 ± 30,14

(281.01, 341.29)

 T-тест для одной выборки с использованием SAS:

 

 

proc ttest data=name h0=μ 0 альфа=α;

вар вар;

пробег;

SAS использует установленный α для уровня достоверности (например, α = 0,05 приведет к доверительным интервалам 95 %). Однако для проверки гипотез он не вычисляет критические значения, связанные с данным α, и не сравнивает t-статистику с критическим значением. Скорее, SAS предоставит p-значение, вероятность того, что T является более экстремальным, чем наблюдаемое t. Правило принятия решения «отклонить, если |t| > критического значения, связанного с α» эквивалентно «отклонить, если p < α».

 

SAS предоставит p-значение, вероятность того, что T является более экстремальным, чем наблюдаемое t. Правило принятия решения «отклонить, если |t| > критического значения, связанного с α», эквивалентно «отклонить, если p < α».

Пример:

 

proc ttest data=dixonmassey h0=200 альфа=0,05;

вар хол52;

заголовок «Одновыборочный t-тест с proc ttest»;

title2 ‘Проверка того, отличается ли образец уровня холестерина в 1952 году от 200’ ;

пробег;

 

Как и в наших ручных расчетах, t = 7,72, и мы отклоняем H 0 (поскольку p<0,0001, что <0,05, выбранный нами уровень α).

Среднее значение холестерина в 1952 г. составляло 311,2 с доверительным интервалом 95% (281,0, 341,3).

 


Парный t-критерий используется, когда нас интересует разница между двумя переменными для одного и того же субъекта.

Часто две переменные разделены временем. Например, в наборе данных Диксона и Мэсси у нас есть уровни холестерина в 1952 году и уровни холестерина в 1962 году для каждого субъекта. Нас может заинтересовать разница в уровне холестерина между этими двумя временными точками.

Однако иногда две переменные разделены чем-то другим, кроме времени. Например, субъектов с разрывами передней крестообразной связки h можно попросить балансировать на ноге с порванной передней крестообразной сцепкой, а затем снова балансировать на ноге без порванной передней крестообразной связки. Затем для каждого субъекта мы можем рассчитать разницу во времени балансировки между двумя ногами.

Поскольку нас, в конечном счете, интересует разница между двумя показателями в одной выборке, парный t-критерий сводится к t-критерию для одной выборки.

Нулевая гипотеза: H 0 : μ d = 0

Альтернативная гипотеза: H 1 : μ d ≠ 0

Оценка баллов: (разность выборочных средних) является точечной оценкой .μ d

 

Статистика испытаний:

 

Обратите внимание, что стандартная ошибка равна , где s d — стандартное отклонение разностей.

Как и прежде, мы сравниваем t-статистику с критическим значением t (которое можно найти в таблице, используя степени свободы и заранее выбранный уровень значимости α). Если абсолютное значение рассчитанной t-статистики больше критического значения t, мы отклоняем нулевую гипотезу.

 

Доверительные интервалы

Мы также можем рассчитать 95% доверительный интервал для разницы в средних. Общая форма доверительного интервала вокруг разницы в средних значениях:

.

 

Для двустороннего 95% доверительного интервала используйте таблицу t-распределения (приведенную в конце раздела), чтобы выбрать подходящее критическое значение t для двустороннего α=0,05. .

Пример:

Предположим, мы хотим определить, изменились ли уровни холестерина у мужчин в исследовании Диксона и Мэсси с 1952 по 1962 год. Мы будем использовать парный t-критерий.

  • H 0 : Средняя разница в уровне холестерина равна 0 с 1952 по 1962 год
  • H 1 : Средняя разница в уровне холестерина НЕ равна 0 с 1952 по 1962 год.
  • Наш уровень значимости α = 0,05.

 Для α = 0,05 и 19df критическое значение t равно 2,093. Поскольку | -6,7| > 2,093, мы отклоняем H 0 и заявляем, что у нас есть существенные доказательства того, что средняя разница в уровне холестерина с 1952 по 1962 год НЕ равна 0. В частности, с 1952 по 1962 год было среднее снижение на 69,8.

Парный t-тест с использованием SAS:

Чтобы выполнить парный t-тест в SAS, сравнивая переменные X1 и X2, измеренные на одних и тех же людях, вы можете сначала создать разницу, как мы сделали выше, и выполнить одновыборочный t-критерий:

данные парный тест; установить оригинал;

д=х1-х2;

пробег;

 

proc ttest data=pairedtest h0=0;

вар д;

пробег;

Гипотезы:

  • H 0 : Средняя разница в уровне холестерина равна 0 с 1952 по 1962 год
  • H 1 : Средняя разница в холестерине НЕ 0 из 1952 по 1962 год.

Сначала создайте разницу, dchol .

 

данные дм; установить диксонмасси;

дхол=хол62-хол52;

пробег;

 

proc ttest data=dm;

title ‘Парный t-тест с proc ttest, с использованием переменной dchol’;

вар дхол;

пробег;

Опять же, мы отклоняем H 0 (поскольку p<0,05) и заявляем, что у нас есть существенные доказательства того, что уровни холестерина изменились с 1952 по 1962 год со средним снижением на 69,8 единиц, с 95% доверительным интервалом (-91,6, - 48. 0).

 

В качестве альтернативы мы можем (только для теста H 0 : μ d = 0) использовать proc означает:

 

proc означает data=pairedtest n mean std t prt clm;

title ‘Парный t-критерий со средними значениями proc’;

вар дхол;

пробег;

Обратите внимание, что параметр t создает статистику t для проверки нулевой гипотезы о том, что среднее значение переменной равно нулю, а параметр prt дает соответствующее значение p. Опция clm дает 95% доверительный интервал для среднего значения. В этом случае, когда переменная представляет собой разницу, dchol, нулевая гипотеза состоит в том, что средняя разница равна нулю, а 95% доверительный интервал относится к средней разнице.

 

proc означает data=dm n mean std t prt clm;

title ‘Парный t-критерий со средними значениями proc’;

вар дхол;

пробег;

 

Третий метод заключается в использовании исходных данных с парным параметром в proc t-test:

 

proc ttest data=original;

title ‘Парный t-тест с proc ttest, парный оператор’;

в паре x1*x2;

пробег;

Это дает результат, идентичный t-критерию dchol.

 

Пример:

 

proc ttest data=work.dm;

title ‘Парный t-тест с proc ttest, парный оператор’;

парных хол62*хол52;

пробег;

 

Отчет о результатах

Мы провели парный t-критерий, чтобы определить, было ли в среднем изменение уровня холестерина с 1952 по 1962 год. 

  • H 0 : Холестерин в среднем не изменился с 1952 по 1962 г. ( H 0 : μ d = 0, где d = хол62 – хол52).
  • H 1 : Имеется среднее изменение холестерина с 1952 по 1962 г., т. е. H 0 : μ d ≠ 0 .
  • Уровень значимости: α=0,05
  • Холестерин снизился между 1952 и 1962 в среднем на 69,8. 95% доверительный интервал для μ d составляет (-91,6,-48,0).
  • Статистика теста: t = -6,70, 19 степеней свободы, p < 0,0001. Поскольку p-значение меньше α=0,05, мы отвергаем нулевую гипотезу и утверждаем, что существует разница в среднем в уровне холестерина между 1952 и 1962 годами.
  • Заключение: Имеются убедительные доказательства того, что уровень холестерина снизился с 1952 по 1962 год (p <0,0001). В среднем уровень холестерина в 1962 были на 69,8 мг/дл (95% ДИ: 48,0, 91,6) единиц ниже уровня холестерина в 1952 году.

Обратите внимание, что этот отчет включает:

  • Название используемого теста
  • Формулировка нулевой гипотезы и альтернативной гипотезы с точки зрения интересующего параметра генеральной совокупности.
  • Величина, направление и единицы измерения эффекта (наблюдаемая средняя разница).
    • среднее уменьшение на 69,8 единицы с 1952 по 1962 год
    • Обратите внимание, об этом следует сообщать независимо от того, является ли оно статистически значимым!
  • Статистика теста и соответствующие степени свободы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *