Коэффициент стьюдента для чего нужен: Коэффициенты Стьюдента | это… Что такое Коэффициенты Стьюдента?

Коэффициенты Стьюдента | это… Что такое Коэффициенты Стьюдента?

Толкование

Коэффициенты Стьюдента

Кванти́ли (проценти́ли) распределе́ния Стью́дента (коэффициенты Стьюдента) — числовые характеристики, широко используемые в задачах математической статистики таких как построение доверительных интервалов и проверка статистических гипотез.

Содержание

  • 1 Определение
  • 2 Замечания
  • 3 Таблица квантилей
    • 3.1 Пример
  • 4 См. также

Определение

Пусть Fn — функция распределения Стьюдента t(n) с n степенями свободы, и . Тогда α-квантилью этого распределения называется число tα,n такое, что

.

Замечания

  • Прямо из определения следует, что случайная величина, имеющая распределение Стьюдента с
    n
    степенями свободы, не превышает значение tα,n с вероятностью α и превышает его с вероятностью 1 − α.
  • Функция Fnстрого возрастает для любого . Следовательно, определена её обратная функция , и
.
  • Функция не имеет простого представления. Однако, возможно вычислить её значения численно.
  • Распределение t(n) симметрично. Следовательно,
t1 − α,n = − tα,n.

Таблица квантилей

Нижеприведённая таблица получена с помощью функции tinv пакета tα,n, необходимо найти строку, соответствующую нужному n, и колонку, соответствующую нужному α. Искомое число находится в таблице на их пересечении.

Пример

t0.2,4 = 0.2707;
t0.8,4 = − t0.2,4 = − 0.2707.

См. также

  • Распределение Стьюдента;
  • Доверительный интервал для математического ожидания нормальной выборки.

Квантили tα,n

two-tailed test1-0. 9/21-0.8/21-0.7/21-0.6/21-0.5/21-0.4/21-0.3/21-0.2/21-0.1/21-0.05/21-0.02/2
one-tailed test1-0.91-0.81-0.71-0.61-0.51-0.41-0.31-0.21-0.11-0.051-0.02
10.15840.32490.50950.72651.00001.37641.96263.07776.313812.706231.8205
20.14210.28870.4447
0.6172
0.81651.06071.38621.88562.92004.30276.9646
30.13660.27670.42420.58440.76490.97851.24981.63772.35343.18244.5407
40.13380. 27070.41420.56860.74070.94101.18961.53322.13182.77643.7469
50.13220.26720.40820.55940.72670.91951.15581.47592.01502.57063.3649
60.13110.26480.40430.55340.71760.90571.13421.43981.9432 2.44693.1427
70.13030.26320.40150.54910.71110.89601.11921.41491.89462.36462.9980
80.12970.26190.39950.54590.70640.88891.10811.39681.85952.30602.8965
90.12930.26100.39790. 54350.70270.88341.09971.38301.83312.26222.8214
100.12890.26020.39660.54150.69980.87911.09311.37221.81252.22812.7638
110.12860.25960.39560.53990.69740.87551.08771.36341.79592.20102.7181
120.12830.25900.39470.53860.69550.87261.08321.35621.78232.17882.6810
130.12810.25860.39400.53750.69380.87021.07951.35021.77092.16042.6503
140.12800.25820.39330.53660. 69240.86811.07631.34501.76132.14482.6245
150.12780.25790.39280.53570.69120.86621.07351.3406
1.7531
2.13142.6025
160.12770.25760.39230.53500.69010.86471.07111.33681.74592.11992.5835
170.12760.25730.39190.53440.68920.86331.06901.33341.73962.10982.5669
180.12740.25710.39150.53380.68840.86201.06721.33041.73412.10092.5524
190.12740.25690.39120.53330.68760. 86101.06551.32771.72912.09302.5395
200.12730.25670.39090.53290.68700.86001.06401.32531.72472.08602.5280
210.12720.25660.39060.53250.68640.85911.06271.32321.72072.07962.5176
220.12710.25640.39040.53210.68580.85831.06141.32121.71712.07392.5083
230.12710.25630.39020.53170.68530.85751.06031.31951.71392.06872.4999
240.12700.25620.39000.53140.68480.85691. 0593 1.31781.71092.06392.4922
250.12690.25610.38980.53120.68440.85621.05841.31631.70812.05952.4851
260.12690.25600.38960.53090.68400.85571.05751.31501.70562.05552.4786
270.12680.25590.38940.53060.68370.85511.05671.31371.70332.05182.4727
280.12680.25580.38930.53040.68340.85461.05601.31251.70112.04842.4671
290.12680.25570.38920.53020.68300.85421.05531.
3114
1.69912.04522.4620
300.12670.25560.38900.53000.68280.85381.05471.31041.69732.04232.4573
310.12670.25550.38890.52980.68250.85341.05411.30951.69552.03952.4528
320.12670.25550.38880.52970.68220.85301.05351.30861.69392.03692.4487
330.12660.25540.38870.52950.68200.85261.05301.30771.69242.03452.4448
340.1266
0.2553
0.38860.52940.68180.85231.05251.30701. 69092.03222.4411
350.12660.25530.38850.52920.68160.85201.05201.30621.68962.03012.4377
360.12660.25520.38840.52910.68140.85171.05161.30551.68832.02812.4345
370.12650.25520.38830.52890.68120.85141.05121.30491.68712.02622.4314
380.12650.25510.38820.52880.68100.85121.05081.30421.68602.02442.4286
390.12650.25510.38820.52870.68080.85091.05041.30361.68492. 02272.4258
400.12650.25500.38810.52860.68070.85071.05001.30311.68392.02112.4233
410.12640.25500.38800.52850.68050.85051.04971.30251.68292.01952.4208
420.12640.25500.38800.52840.68040.85031.04941.30201.68202.01812.4185
430.12640.25490.38790.52830.68020.85011.04911.30161.68112.01672.4163
440.12640.25490.38780.52820.68010.84991.04881.30111.68022.01542. 4141
450.12640.25490.38780.52810.68000.84971.04851.30061.67942.01412.4121
460.12640.25480.38770.52810.67990.84951.04831.30021.67872.01292.4102
470.12630.25480.38770.52800.67970.84931.04801.29981.67792.01172.4083
480.12630.25480.38760.52790.67960.84921.04781.29941.67722.01062.4066
490.12630.25470.38760.52780.67950.84901.04751.29911.67662.00962.4049
500. 12630.25470.38750.52780.67940.84891.04731.29871.67592.00862.4033
1000.12600.25400.38640.52610.67700.84521.04181.29011.66021.98402.3642
10000.12570.25340.38540.52460.67470.84201.03701.28241.64641.96232.3301

Wikimedia Foundation. 2010.

Игры ⚽ Поможем сделать НИР

  • Коэффициенты Ламэ
  • Коялович, Войцех

Полезное


Классические методы статистики: t-критерий Стьюдента


Начать, пожалуй, стоит с математических допущений, на которых основан критерий Стьюдента. Основных таких допущений, как известно, два:

Кроме того, в своей исходной форме, t-критерий предполагает независимость сравниваемых выборок.

Проверка указанных требований к данным должна всегда предшествовать формальному статистическому анализу, в котором задействован критерий Стьюдента (к сожалению, многие исследователи забывают об этом). Способы проверки этих требований я рассмотрю в будущих сообщениях. Сейчас же пока отметим, что условие нормальности распределения данных становится не таким жестким при «больших» объемах выборок, а для выборок с разными дисперсиями существует особая модификация t-критерия (критерий Уэлча; см. также ниже).

Этот вариант критерия Стьюдента служит для проверки нулевой гипотезы о равенстве среднего значения (\(mu_1\)) генеральной совокупности, из которой была взята выборка, некоторому известному значению (\(mu_0\)):

Рассчитанное значение критерия мы можем далее интерпретировать следующим образом, исходя из свойств t-распределения: если это значение попадает в т.н. область отклонения нулевой гипотезы (см. рисунок ниже), то мы вправе отклонить проверяемую нулевую гипотезу. Область отклонения нулевой гипотезы для критерия Стьюдента определяется заранее принятым уровнем значимости (например, \(\alpha=0.05\)) и числом степеней свободы.

Эквивалентным подходом к интерпретации результатов теста будет следующий: допустив, что нулевая гипотеза верна, мы можем рассчитать, насколько велика вероятность получить t-критерий, равный или превышающий то реальное значение, которое мы рассчитали по имеющимся выборочным данным. Если эта вероятность оказывается меньше, чем заранее принятый уровень значимости (например, \(P < 0.05\)), мы вправе отклонить проверяемую нулевую гипотезу. Именно такой подход сегодня используется чаще всего: исследователи приводят в своих работах P-значение, которое легко рассчитывается при помощи статистических программ. Рассмотрим, как это можно сделать в системе R.

Предположим, у нас имеются данные по суточному потреблению энергии, поступающей с пищей (кДж/сутки), для 11 женщин (пример заимствован из книги Altman D. G. (1981) Practical Statistics for Medical Research, Chapman & Hall, London):


d.intake <- c(5260, 5470, 5640,
  6180, 6390, 6515,
  6805, 7515, 7515,
  8230, 8770)

Среднее значение для этих 11 наблюдений составляет:

mean(d.intake)
[1] 6753.6

Вопрос: отличается ли это выборочное среднее значение от установленной нормы в 7725 кДж/сутки? Разница между нашим выборочным значением и этим нормативом довольно прилична: 7725 — 6753.6 = 971.4. Но насколько велика эта разница статистически? Ответить на этот вопрос поможет одновыборочный t-тест. Как и другие варианты t-теста, одновыборочный тест Стьюдента выполняется в R при помощи функции t.test():


t.test(d.intake, mu = 7725)
 
        One Sample t-test
 
data:  d.intake 
t = -2.8208, df = 10, p-value = 0.01814
alternative hypothesis: true mean is not equal to 7725 
95 percent confidence interval:
 5986.348 7520.925 
sample estimates:
mean of x 
 6753. 636

Видим, что для имеющихся выборочных данных t-критерий составляет -2.821 при 10 степенях свободы (df). Вероятность получить такое (либо большее) значение t при условии, что проверяемая нулевая гипотеза верна, оказалась весьма мала: p-value = 0.01814  (во всяком случае, это меньше 5%). Следовательно (см. выше), мы можем отклонить проверяемую нулевую гипотезу о равенстве выборочного среднего значения нормативу и принять альтернативную гипотезу (alternative hypothesis: true mean is not equal to 7725). Делая это, мы рискуем ошибиться с вероятностью менее 5%.

Помимо t-критерия, количества степеней свободы, Р-значения и выборочного среднего (sample estimates: mean of x), программа рассчитала также 95%-ный доверительный интервал (95 percent confidence interval) для истинной разницы между выборочным средним значением суточного потребления энергии и нормативом. Если бы мы повторили аналогичный тест много раз для разных групп из 11 женщин, то в 95% случаев эта разница оказалась бы в диапазоне от 5986. {2}\) — выборочные оценки дисперсии. При соблюдении условия о равенстве групповых дисперсий приведенная формула приобретает более простой вид (подробнее см. здесь). Интерпретация t-критерия, рассчитанного для двух выборок, выполняется точно так же, как и в случае с одной выборкой (см. выше).

Рассмотрим пример о суточном расходе энергии (expend) у худощавых женщин (lean) и женщин с избыточным весом (obese), приведенный в книге Питера Дальгаарда (Dalgaard P (2008) Introductory statistics with R. Springer). Данные из этого примера (подробнее см. ?energy) входят в состав пакета ISwR, сопровождающего книгу (если он у Вас не установлен, выполните команду install.packages(«ISwR»)):


library(ISwR)
data(energy)
attach(energy)
energy
   expend stature
1    9.21   obese
2    7.53    lean
3    7.48    lean
4    8.08    lean
5    8.09    lean
6   10.15    lean
7    8.40    lean
8   10.88    lean
9    6.13    lean
10   7.90    lean
11  11.51   obese
12  12.79   obese
13   7. 05    lean
14  11.85   obese
15   9.97   obese
16   7.48    lean
17   8.79   obese
18   9.69   obese
19   9.68   obese

Соответствующие средние значения потребления энергии в рассматриваемых группах пациенток составляют (подробнее о примененной ниже функции tapply() см. здесь):


tapply(expend, stature, mean)
lean obese 
8.07 10.30

Различаются ли эти средние значения статистически? Проверим гипотезу об отсутствии разницы при помощи t-теста:


t.test(expend ~ stature)
 
        Welch Two Sample t-test
 
data:  expend by stature 
t = -3.8555, df = 15.919, p-value = 0.001411
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -3.459167 -1.004081 
sample estimates:
 mean in group lean mean in group obese 
           8.066154           10.297778

Обратите внимание на использование знака ~ в вызове функции t.test(). Это стандартный для R способ записи формул, описывающих связь между переменными. В нашем случае выражение expend ~ stature можно расшифровать как «зависимость суточного потребления энергии (expend) от статуса пациентки (stature)».

Согласно полученному значению P (p-value = 0.001411), средние значения потребления энергии у женщин из  рассматриваемых весовых групп статистически значимо различаются. Отвергая нулевую гипотезу о равенстве этих средних значений, мы рискуем ошибиться с вероятностью лишь около 0.1%. При этом истинная разница между средними значениями с вероятностью 95% находится в диапазоне от -3.5 до -1.0 (см. 95 percent confidence interval).

Следует подчеркнуть, что при выполнении двухвыборочного t-теста R по умолчанию принимает, что дисперсии сравниваемых совокупностей не равны, и, как следствие, выполняет t-тест в модификации Уэлча (подробнее см. здесь). Мы можем изменить такое поведение программы, воспользовавшись аргументом var.equal = TRUE: (от variance — дисперсия, и equal — равный):


t. test(expend ~ stature, var.equal = TRUE)
 
        Two Sample t-test
 
data:  expend by stature 
t = -3.9456, df = 20, p-value = 0.000799
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -3.411451 -1.051796 
sample estimates:
 mean in group lean mean in group obese 
           8.066154           10.297778

Р-значение стало еще меньше, и мы так же, как и после теста в модификации Уэлча, можем сделать вывод о наличии существенной разницы между средними. Однако такое совпадение выводов будет иметь место не всегда и, следовательно, на разницу между групповыми дисперсиями (или ее отсутствие) следует обращать серьезное внимание при выборе и интерпретации того или иного варианта t-теста.



Сравнение двух зависимых (= парных) выборок


Зависимыми, или парными, являются две выборки, содержащие результаты измерений какого-либо количественного признака, выполненных на одних и тех же объектах. Во многих исследованиях какой-то определенный отклик измеряется у одних и тех же объектов до и после экспериментального воздействия. При такой схеме эксперимента исследователь более точно оценивает эффект воздействия именно потому, что прослеживает его у одних и тех же объектов.

Но как в таких случаях оценить наличие эффекта от воздействия статистически? В общем виде критерий Стьюдента можно представить как

\[t = \frac{\text{оценка параметра} — \text{истинное значение параметра}}{\text{ст. ошибка оценки параметра}}\]

Нас интересует «истинное значение параметра» — среднее изменение какого-либо количественного признака как результат экспериментального воздействия — обозначим его \(\delta\). Оценкой этого истинного параметра является наблюдаемое (выборочное) среднее изменение признака. Тогда t-критерий примет вид

\[t = \frac{\bar{d} — \delta}{S_{\bar{d}}} \]

Если нулевая гипотеза заключается в равенстве истинного эффекта нулю, формула для парного критерия Стьюдента примет вид

\[t = \frac{\bar{d}}{S_{\bar{d}}} \] 

В книге П. Дальгаарда (Dalgaard 2008) имеется пример о суточном потреблении энергии, измеренном у одних и тех же 11 женщин до и после периода менструаций:

data(intake) # из пакета ISwR
attach(intake)
intake
    pre post
1  5260 3910
2  5470 4220
3  5640 3885
4  6180 5160
5  6390 5645
6  6515 4680
7  6805 5265
8  7515 5975
9  7515 6790
10 8230 6900
11 8770 7335

Индивидуальные разницы в потреблении энергии у этих женщин составляют:

post - pre
[1] -1350 -1250 -1755 -1020  -745 -1835 -1540 -1540
[9]  -725 -1330 -1435

Усреднив эти индивидуальные разницы, получим

mean(post - pre)
[1] -1320.5

Задача заключается в том, чтобы оценить, насколько статистически значимо эта средняя разница отличается от нуля. Применим парный критерий Стьюдента (обратите внимание на использование аргумента paired = TRUE):

t.test(pre, post, paired = TRUE)
 
        Paired t-test
 
data:  pre and post 
t = 11. 9414, df = 10, p-value = 3.059e-07
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 1074.072 1566.838 
sample estimates:
mean of the differences 
               1320.455

Как видим, рассчитанное программой P-значение оказалось намного меньше 0.05, что позволяет нам сделать заключение о наличии существенной разницы в потреблении энергии у исследованных женщин до и после менструации. Истинная величина эффекта (в абсолютном выражении) с вероятностью 95% находится в интервале от 1074.1 до 1566.8 кДж/сутки.

Приведенные выше примеры охватывают наиболее типичные случаи применения критерия Стьюдента. За рамками этого сообщения остаются т.н. односторонние варианты t-теста, когда проверяемая нулевая гипотеза заключается в том, что одно из сравниваемых средних значений больше (или меньше) другого. Однако можно отметить, что односторонний вариант t-теста легко реализуется при помощи функции t. test() в сочетании с аргументом alternative, который может принимать одно из трех значений — «two.sided» («двухсторонний»; выбирается программой по умолчанию), «greater» («больше») или «less» («меньше»).

Распределение | Что это такое и как его использовать (с примерами)

Опубликован в 28 августа 2020 г. к Ребекка Беванс. Отредактировано 9 июля 2022 г.

Распределение t , также известное как t -распределение Стьюдента, представляет собой способ описания данных, которые следуют кривой нормального распределения при нанесении на график, с наибольшим количеством наблюдений, близких к среднему, и меньшим количеством наблюдений в хвосты.

Это тип нормального распределения, используемый для небольших выборок, когда дисперсия данных неизвестна.

В статистике t -распределение чаще всего используется для:

  • Найдите критические значения для доверительного интервала, когда данные примерно нормально распределены.
  • Найдите соответствующее p -значение из статистического теста, использующего t -распределение ( t -тесты, регрессионный анализ).

    Содержание

    1. Что такое t-распределение?
    2. T-распределение и стандартное нормальное распределение
    3. T-распределение и t-показатели
    4. Часто задаваемые вопросы о t-распределении

    Что такое

    t -распределение?

    Распределение t — это тип нормального распределения, который используется для небольших выборок. Нормально распределенные данные образуют форму колокола при нанесении на график, с большим количеством наблюдений около среднего и меньшим количеством наблюдений в хвостах.

    t -распределение используется, когда данные примерно нормально распределены, что означает, что данные имеют форму колокола, но дисперсия совокупности неизвестна. Дисперсия в t -распределении оценивается на основе степеней свободы набора данных (общее количество наблюдений минус 1).

    Это более консервативная форма стандартного нормального распределения , также известного как распределение z . Это означает, что оно дает более низкую вероятность центру и более высокую вероятность хвостам, чем стандартное нормальное распределение.

    Пример: t -распределение по сравнению с z -распределение Если вы измеряете средний балл теста по выборке только из 20 учащихся, вы должны использовать t -распределение для оценки доверительного интервала вокруг среднего значения. Если вы используете распределение z , ваш доверительный интервал будет искусственно точным.

    T — распределение и стандартное нормальное распределение

    При увеличении степеней свободы (общее количество наблюдений минус 1) 9Распределение 0005 t будет все ближе и ближе соответствовать стандартному нормальному распределению, также известному как распределение z , пока они не станут почти идентичными.

    Свыше 30 степеней свободы распределение t примерно совпадает с распределением z . Таким образом, распределение z можно использовать вместо распределения t при больших размерах выборки.

    Распределение z предпочтительнее t -распределение, когда дело доходит до статистических оценок, потому что оно имеет известную дисперсию. Он может дать более точные оценки, чем t -распределение, дисперсия которого аппроксимируется с использованием степеней свободы данных.

    Получение отзывов о языке, структуре и форматировании

    Профессиональные редакторы вычитывают и редактируют вашу статью, уделяя особое внимание:

    • Академический стиль
    • Расплывчатые предложения
    • Грамматика
    • Согласованность стиля

    См. пример

    Т -распределение и т -баллы

    t -оценка представляет собой число стандартных отклонений от среднего в t -распределении. Обычно вы можете найти результат t в таблице t или воспользоваться онлайн-калькулятором t .

    В статистике t -оценки в основном используются для нахождения двух вещей:

    1. Верхняя и нижняя границы доверительного интервала, когда данные примерно нормально распределены.
    2. p -значение тестовой статистики для t -тестов и регрессионных тестов.

    T — баллы и доверительные интервалы

    Доверительные интервалы используют t -показателей для вычисления верхней и нижней границ интервала прогнозирования. Оценка t , используемая для получения верхней и нижней границ, также известна как критическое значение из t или t *.

    Пример доверительного интервалаВы выбрали 20 учащихся из двух разных классов для оценки средних результатов стандартизированного теста и хотите узнать, есть ли разница между двумя группами.

    Используя двусторонний t -критерий, вы получаете оценку разницы между двумя классами и доверительный интервал вокруг этой оценки. Из теста t вы обнаружите, что разница в среднем балле между классом 1 и классом 2 составляет 4,61, с 95% доверительный интервал от 3,87 до 5,35.

    Поскольку доверительный интервал не пересекает ноль и на самом деле очень далек от нуля, маловероятно, что эта разница в результатах тестов могла возникнуть при нулевой гипотезе об отсутствии различий между группами.

    T -баллы и p -значения

    Статистические тесты генерируют тестовую статистику, показывающую, насколько далеки ваши данные от нулевой гипотезы статистического теста. Затем они вычисляют p — значение, описывающее вероятность того, что ваши данные появятся, если нулевая гипотеза верна.

    Статистика теста для t -тестов и регрессионных тестов представляет собой t -оценку. В то время как большинство статистических программ автоматически вычисляют соответствующее значение p для оценки t , вы также можете найти значения в таблице t , используя ваши степени свободы и t -оценку, чтобы найти значение p .

    Значение t , которое дает значение p ниже вашего порога статистической значимости, известно как критическое значение t или t *.

    Пример p-значения. Двусторонний t -критерий разницы результатов теста дает t -значение 12,79. Это означает, что разница в средних групповых значениях составляет 12,79 стандартных отклонений от среднего значения распределения нулевой гипотезы.

    Степени свободы 38 (n–1 для каждой группы). Глядя на это в t -table (или вычислив его в вашей любимой статистической программе) вы найдете p -значение < 0,001.

    Этот вывод, как и вывод из доверительного интервала, предполагает, что вы вряд ли обнаружите такую ​​большую разницу, если истинная разница в средних результатах теста равна нулю.

    Часто задаваемые вопросы о t-распределении

    Что такое t-распределение?
    org/Answer»>

    Распределение t — это способ описания набора наблюдений, где большинство наблюдений падают близко к среднему, а остальные наблюдения составляют хвосты с обеих сторон. Это тип нормального распределения, используемый для небольших выборок, когда дисперсия данных неизвестна.

    Распределение t образует колоколообразную кривую при нанесении на график. Его можно описать математически, используя среднее значение и стандартное отклонение.

    Что такое t-оценка?

    t -значение (также известное как t -значение) эквивалентно количеству стандартных отклонений от среднего значения t -распределения.

    Показатель t — это тестовая статистика, используемая в t -тестах и ​​регрессионных тестах. Его также можно использовать для описания того, насколько далеко от среднего находится наблюдение, когда данные следуют т -распределение.

    Что такое тестовая статистика?

    Статистика теста — это число, рассчитанное с помощью статистического теста. Он описывает, насколько ваши наблюдаемые данные далеки от нулевой гипотезы об отсутствии связи между переменными или отсутствии различий между группами выборок.

    Тестовая статистика показывает, насколько две или более группы отличаются от общего среднего значения генеральной совокупности или насколько линейный наклон отличается от наклона, предсказанного нулевой гипотезой. В разных статистических тестах используются разные статистические данные.

    Что такое критическое значение?
    org/Answer»>

    Критическое значение — это значение статистики теста, которое определяет верхнюю и нижнюю границы доверительного интервала или определяет порог статистической значимости в статистическом тесте. Он описывает, как далеко от среднего значения распределения вы должны уйти, чтобы покрыть определенное количество общей вариации данных (т. е. 90%, 95%, 99%).

    Если вы строите 95% доверительный интервал и используете порог статистической значимости p = 0,05, то ваше критическое значение будет одинаковым в обоих случаях.

    Процитировать эту статью Scribbr

    Если вы хотите процитировать этот источник, вы можете скопировать и вставить цитату или нажать кнопку «Цитировать эту статью Scribbr», чтобы автоматически добавить цитату в наш бесплатный генератор цитирования.

    Беванс, Р. (2022, 09 июля). Т-распределение | Что это такое и как его использовать (с примерами). Скриббр. Проверено 22 марта 2023 г., с https://www.scribbr.com/statistics/t-distribution/

    Процитировать эту статью

    Полезна ли эта статья?

    Вы уже проголосовали. Спасибо 🙂 Ваш голос сохранен 🙂 Обработка вашего голоса…

    Ребекка работает над докторской диссертацией по почвенной экологии, а в свободное время пишет. Она очень рада, что может поболтать о статистике со всеми вами.

    т Распределение Основные понятия | Реальная статистика с использованием Excel

    Основные понятия

    Проверка гипотезы с одной выборкой, описанная в разделе «Проверка гипотез с использованием центральной предельной теоремы с использованием нормального распределения», подходит, когда известно стандартное отклонение распределения совокупности, а совокупность либо нормально распределена или выборка достаточно велика, чтобы применить центральную предельную теорему.

    Проблема в том, что стандартное отклонение генеральной совокупности обычно неизвестно. Один из подходов к решению этой проблемы заключается в использовании стандартного отклонения s выборки в качестве аппроксимации стандартного отклонения σ для генеральной совокупности. Лучшим подходом является использование t-распределения.

    Pdf и основные свойства

    Определение 1 : ( Студенческий ) т  распределение с к степеней свободы , сокращенно T ( k ) имеет функцию распределения вероятностей (pdf)

    , где Γ(y) — гамма-функция, как описано в разделе Гамма-функция.

    Ключевые статистические свойства распределения t:

    • Среднее = 0 для k > 0
    • Медиана = 0
    • Режим = 0
    • Диапазон = (-∞, ∞)
    • Дисперсия = тыс. ⁄ ( тыс.  – 2) для тыс. > 2
    • Асимметрия = 0 для k > 3
    • Эксцесс = 6 ⁄ ( к  – 4) для к > 4

    Общая форма функции плотности вероятности распределения t напоминает колоколообразную форму нормально распределенной случайной величины со средним значением 0 и дисперсией 1, за исключением того, что она немного ниже и шире. По мере роста числа степеней свободы распределение t приближается к стандартному нормальному распределению, и в действительности приближение довольно близкое для K ≥ 30.

    Рисунок 1 — Диаграмма T -распределения по градусам свободы

    Другие свойства

    свойство 1 : если x имеет нормальное дистрибьютор 555555555 года. , ?

    Щелкните здесь для доказательства свойства 1.

    свойство 2 : для выборок достаточно большого размера n со средним и стандартным отклонением s случайная величина

    3 имеет распределение 0 T

    3

    ( н – 1).

    Доказательство: Это следует из свойства 1 центральной предельной теоремы.

    Наблюдения

    Тестовая статистика в свойствах 1 и 2 такая же, как

    из центральной предельной теоремы с заменой стандартного отклонения совокупности σ на стандартное отклонение выборки s . Что делает это настолько полезным, так это то, что обычно стандартное отклонение совокупности неизвестно, в то время как стандартное отклонение выборки известно.

    Если выборка составляет значительную часть (конечной) совокупности (например, более 5%), то стандартную ошибку s/ в свойствах 1 и 2 следует заменить на

    , где N  – численность населения.

    Функции рабочего листа

    Excel Functions : Excel обеспечивает следующие функции для распределения T:

    T.DIST ( x , DF , CUM 9006). f ( x ) для распределения t, когда cum = FALSE и соответствующая кумулятивная функция распределения F ( x ), когда включая  = ИСТИНА.

    T.ОБР ( p,df ) = значение x такое, что T.DIST( x, df , TRUE) = p df , т.е. х, df , ИСТИНА).

    Кроме того, Excel предоставляет следующие функции рабочего листа:

    T.DIST.RT ( x , df ) = правая часть распределения t с размерами x и df степеней свободы.0003

    T.DIST.2T ( x , df ) = сумма правого хвоста распределения t с df степеней свободы при x плюс левый хвост при -06,

    5 -x6,

    где x ≥ 0 (функция выдает значение ошибки, когда x < 0).

    T.ОБР.2T ( p , df ) = значение x такое, что T.DIST.2T( x , df ) = 9000 .РАСП.2T( x , df )

    Обратите внимание, что правый хвост на x , T.DIST.RT( x , df ) = 1 – T. DIST( x 0d 0 , TRUE 0, , ). Поскольку распределение t симметрично относительно x = 0, левый хвост при — x также равен T.DIST.RT( x , df ) и сумме правого и левого хвостов, T.DIST .2T( x , df ) равно 2* T.DIST.RT( x , df ).

    Так как распределение t симметрично относительно x  = 0, мы имеем следующие эквивалентности:

    T.DIST (- x , df , ИСТИНА) = 1 – T.DIST ( x , df , TRUE) = T.DIST .RT( x , df )

    T.DIST.RT(- x , df ) = 1 – T.DIST.RT( x , df ) 900 x , df , ИСТИНА)

    T.ОБР(1- p , df ) = T.ОБР.2T(2* p , df

    ) для

    Как правило, мы используем T.DIST.RT и T.DIST.2T для одностороннего и двустороннего t-тестов соответственно. Мы используем T.ОБР.(1- p, df ) и T.ОБР.2T( p, df ) для односторонних и двусторонних критических значений соответственно.

    Функции рабочего листа для более ранних версий Excel

    Функции Excel : Вышеуказанные функции недоступны для версий Excel до Excel 2010. В Excel 2007 и более ранних версиях вместо них используются следующие функции, где x ≥ 0, DF > 0 и Хвосты = 1 или 2:

    TDIST ( x, DF , Хвосты ) = T.DIST.RT ( x, DF ), если хвосты = 1 и = T.DIST.2T( x, df ) if tails = 2

    TINV ( p, df ) = T.INV.2T( p, df )

    функции более подробно описаны в разделе Встроенные статистические функции.

    На рис. 2 приведены примеры использования этих функций рабочего листа Excel.

    Рисунок 2 – Примеры функций распределения t

    Функции для нецелочисленных df округляется до ближайшего меньшего целого числа. Таким образом, df = 3,7 обрабатывается так же, как df = 3.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *