Коэффициента стьюдента: Основные статистики и t-критерий Стьюдента

Критерий Стьюдента, формула | matematicus.ru

Artman Математическая статистика

Критерий Стьюдента применяется для проверки равенства средних значений двух выборок, сравнение количественных значений только двух выборок с нормальным распределением случайной величины. 

 Критерий Стьюдента определяется по формуле:

$\bar{X_1}$ – выборочные средние значения первой выборки;

$\bar{X_2}$ – выборочные средние значения второй выборки;

n1 – объем первой выборки;

n2 – объем второй выборки;

σ1 и σ2 – среднее квадратическое отклонение в соответствующих выборках и находятся из формулы:

Число степеней свободы определяется по формуле:

k=n1+n2−2

Fкр(α, k) определяется по таблице

При Fнабл<Fкр нулевая гипотеза принимается.

Формула критерия Стьюдента для несвязанных независимых выборок:

Формула для определения стандартной ошибки разности средних арифметических σxy:

Число степеней свободы определяется выражением:

k=n1+n2–2

При n1=n2число степеней свободы находится по формуле:

k=2n-2

а стандартная ошибка разности средних арифметических σxy задаётся выражением:


Пример

Даны две выборки.

В первой выборки продажа товара со скидкой, а во второй без скидки.

№ п/пXY
12519
23431
32317
43524
533
28
62531
74539
84132
92738
105443
113221
1232

По критерию Стьюдента определить зависит ли спрос на товар от скидок на него при p=0. 99?

Решение

В соответствии с таблицей n1=12, n2=11

Вычислим дисперсии D(X), D(Y)

№ п/пXYD(X)D(Y)
1251978,028107,4
234310,02782,6777
32317117,36152,86
435241,361128,769
533280,69441,8595
6253178,0282,6777
74539124,6992,86
8413251,3616,9504
9273846,69474,587
105443406,69185,95
1132213,361169,95
12323,3611
Сумма406323911,67726,55
Среднее33,83329,364

Подставим значения в формулу стандартной ошибки разности средних арифметических

σxy:

 

Вычисляем критерий Стьюдента:

Число степеней свободы равно:

k=12+11–2=21

По таблице Стьюдента находим критическое значение:

tкрит=2,8310     

Отсюда tкрит> tнабл, следовательно, зависит.

15021

Рекомендации по использованию и описанию методов статистики

1. При использовании выражений типа «M ± m» и «M ± δ» необходимо указывать, какие величины соединены знаком « ± » [1].

2. Нельзя использовать выражения типа M ± m для балльных признаков [1].

3. При применении t-критерия Стьюдента необходимо проверять два ограничительных условия – нормальность распределения и равенство дисперсий. В противном случае его использование недопустимо. Ошибочное использование t-критерия Стьюдента увеличивает вероятность выявить несущественные различия, то есть подтвердить недостоверную гипотезу. Например, вместо признания равноэффективными двух методов лечения один из них может быть безосновательно объявлен «лучшим» [1, 2, 3].

4. Недопустимо применение t-критерия Стьюдента для сравнения средних более чем в двух группах, без проверки двух ограничительных условий [1].

5. В среде пакета EXCEL нет процедуры проверки нормальности распределения, поэтому применение t-критерия Стьюдента без дополнительной проверки нормальности распределения недопустимо [1].

6. «Достоверность параметров» с помощью критерия Стьюдента проверить нельзя, так как он предназначен для проверки статистической гипотезы о равенстве средних при наличии двух независимых выборок (если нет указания на применение парного критерия) [4].

7. Однофакторный дисперсионный анализ (ANOVA) для несвязанных выборок может применяться только при выполнении двух ограничительных условий: не менее трех градаций фактора и не менее двух испытуемых в каждой градации; результативный признак (значение зависимой переменной) должен быть нормально распределен в исследуемой выборке [1].

8. «Неправильное» и «правильного» распределения данных не существует [4].

9. Описание данных с помощью средних арифметических и стандартных отклонений не рекомендуется делать в случае, если они не подчиняются закону нормального распределения [4].

10. Нельзя применять t-критерий Стьюдента к дискретным, балльным признакам [1].

11. При использовании в тексте статей конкретных значений достигнутого уровня статистической значимости необходимо указывать статистические критерии, для которых они вычислялись [1].

12. Утверждение, что уровень значимости принимался более 5 % – некорректно. Фактически такая формулировка означает принятие ложных выводов как истинных. Корректным будет выражение типа «Критический уровень значимости принимался равным 5 %» [1].

13. Утверждение, что уровень значимости принимался более 95 % некорректно [1].

14. Выражение «р<0,05» может быть получено только при использовании конкретных статистических критериев, например t-критерия Стьюдента, критерия c2 и т.д. Поэтому их нужно указывать [1].

15. Необходимо указывать, что подразумевается под величиной “р” – уровень значимости или доверительной вероятности. Если Р > 0,95 (0,99, 0,999) или р < 0,05 (0,01, 0,001), то различия статистически значимы, если Р < 0,95 (0,99, 0,999) или р > 0,05 (0,01, 0,001), то статистически не значимы [1].

16. Не рекомендуется использовать слово «достоверно» применительно к результатам проверки статистических гипотез, поскольку в ГОСТ Р 50779.10–2000 «Статистические методы. Вероятность и основы статистики. Термины и определения» нет такого термина как «достоверность». Следует использовать выражения «статистически значимые различия», «статистически значимо» или «статистически не значимо» [1, 2, 4].

17. При упоминании о применении многомерных методов статистического анализа необходимо конкретизировать эти методы и описание результатов их использования [1].

18. При представлении данных корреляционного анализа нужно конкретизировать название используемого коэффициента корреляции [1].

19. Нельзя использовать выражения «непараметрические данные», «непараметрические признаки», «параметрические признаки» [4].

20. В разделе «Материал и методы» необходимо указывать только те методы статистического анализа, результаты использования которых приводятся в тексте статьи [1].

21. Вероятности более 1 не существует, поэтому выражение «p > 1», в котором величина «р» является вероятностью, просто бессмысленно [1].

22. Нужно указывать, что подразумевается под стандартными (общепринятыми) методами и программами обработки информации. Недопустимо описание статистических методов и критериев в форме шаблонных клише с весьма расплывчатым содержанием (“Результаты обработаны статистически”, “Результаты опытов обработаны статистически общепринятым способом, различие считали при уровне вероятности не менее 95 %” и т.д.) [1, 4].

23. Для читателя ссылка на определенную фамилию (Лакин, Урбах, Стрелков) ни о чем не говорит, поскольку в книгах данных авторов описано много разнообразных методов. В случае применения достаточно известных статистических методов (например, t-критерия Стьюдента) отсутствие подобной ссылки не так уж важно. Однако если автор использует не столь популярный метод или критерий, нужно указывать литературу и конкретные страницы [1].

24. Использование выражения «обработано на персональном компьютере» излишне. Нужно указывать конкретную программу [1].

25. Без вариации нет статистики, поэтому от термина «вариационная статистика» было рекомендовано отказаться еще в 1973 г. [4]. 26. Целесообразнее указывать конкретное значение достигнутого уровня значимости для использованного статистического критерия. Например, достигнутый уровень значимости р=0,04; р=0,0004 [1].

Литература:

1. Леонов В. П. Статистика в кардиологии. 15 лет спустя // Медицинские технологии. Оценка и выбор. 2014. № 1. С. 17-28. [Электронный ресурс]. URL: http://www.ebm.am/Portals/0/Publications/ru/Leonov_2.pdf (дата обращения: 06.04.2018).

2. Леонов В.П., Ижевский П.В. Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях // Международный журнал медицинской практики. 1998. № 4. С. 7-12. [Электронный ресурс]. URL: https://www.mediasphera.ru/journals/mjmp/98/4/r4-98-1.htm (дата обращения: 06.04.2018).

3. Хлопова А.Е., Щербакова И.В. Условия применимости t-критерия Стьюдента в медицине // Всероссийская научно-практическая интернет-конференция студентов и молодых учёных с международным участием «YSRP-2014». [Электронный ресурс]. URL: https://medconfer.com/node/4411 (дата обращения: 06.04. 2018).

4. Гржибовский А. М. Использование статистики в российской биомедицинской литературе // Экология человека. 2008. № 12. С. 55-64. [Электронный ресурс]. URL: https://cyberleninka.ru/article/n/ispolzovanie-statistiki-v-rossiyskoy-biomeditsinskoy-literature (дата обращения: 06.04.2018).

Наибольшее количество работ, посвященных оценке качества публикаций, опубликовано В. П. Леоновым и В. В. Власовым, причем если второй больше акцентирует внимание на дизайн исследований, то первый детально описывает применение статистических методов, а также ошибки при их использовании или описании, причины ошибок, историю использования статистики в биомедицинских исследованиях в СССР и России, а также возможные пути выхода из сложившейся ситуации. Многие из публикаций В. П. Леонова представлены на созданном им сайте доказательной биологии и медицины «Биометрика» http://www.biometrica.tomsk.ru/index.htm. Пропагандой доказательной медицины, грамотного планирования исследований, обработки данных и представления результатов в украине активно занимается К. П. Воробьев, чьи работы находятся в свободном доступе в интернете на сайте http://www.vkp.dsip.net/Main.htm. Читателям, особенно аспирантам, будет полезно узнать, что на сайте http://www.biometrica.tomsk.ru/index.htm существует специальный раздел «Кунсткамера», в котором В. П. Леонов «выставляет» наиболее неграмотные диссертации с детальным анализом ошибок обработки и представления данных. Ознакомление с этим разделом рекомендуется всем будущим авторам без исключения, хотя бы с целью профилактики попадания в него, а также как стимул для ознакомления со специальной статистической литературой или приглашения биостатистика для совместного планирования исследования и обработки данных для будущей диссертации.

Шесть особенностей, связанных с вероятностью того, что опубликованные результаты (подразумеваются значимые результаты) не являются истинными (по J. Ioannidis // PLoS Medicine. 2005. Vol. 2. P. 696–701): 1) чем меньше исследование, тем выше вероятность того, что полученный результат будет ложным; 2) чем меньше эффект изучаемого воздействия на изучаемый исход, тем выше вероятность получения ложных результатов; 3) чем больше взаимосвязей проверяется в ходе исследования, тем выше вероятность получения ложных зависимостей; 4) чем больше неопределенности в определении изучаемого состояния, а также способов его изучения, тем выше вероятность получения ложного результата; 5) чем выше финансовая заинтересованность исследователей, а также чем прочнее устоявшееся мнение по поводу изучаемой проблемы, тем больше вероятность получить ложные результаты и 6) чем более актуальной и злободневной является тема исследования, тем больше вероятность получения ложного результата.

Литература:

Гржибовский А. М. Использование статистики в российской биомедицинской литературе // Экология человека. 2008. № 12. С. 55-64. [Электронный ресурс]. URL: https://cyberleninka.ru/article/n/ispolzovanie-statistiki-v-rossiyskoy-biomeditsinskoy-literature (дата обращения: 06.04.2018).

Принципы описания статистики в публикациях:

1. описание должно иметь цель. Например, приводя результаты АНАЛИЗА, мы можем использовать эти результаты для целей ОПИСАНИЯ.

2. описание должно соответствовать контексту. Согласно этому же принципу необходимо тщательно согласовывать между собой всю терминологию присущую именно той модели, о которой идет речь.

3. («принцип трех ножек табуретки»): описания разных этапов должны взаимно дополнять друг друга. Если в списке использованных методов не упомянут некий конкретный метод и цель и его использования, то нет смысла и обсуждать полученный с его помощью результат, и наоборот.

4. степень детализации и объем описания статистики в публикации должны быть адекватны той роли, которую использованные методы сыграли в получении обсуждаемых в работе выводов.

5. помните, что читателей во много раз больше, чем авторов публикаций. Из этого следует, что рано или поздно найдется опытный читатель, который обнаружит ваши ошибки или неточности описания.

Описание использованных методов статистики (общая часть)

Следует различать собственно описание использованных методов от описания результатов их применения. Обычно краткое описание использованных методов статистики состоит из перечисления этих методов в традиционном разделе (главе) «Материалы и методы». Здесь же приводятся данные о размере (объеме) выборки, а также соответствующих групп и подгрупп, название статистических методов и критериев и значение критического уровня значимости. Уместно дать и обозначение наиболее часто встречающихся значений параметров, как выборочных, так и генеральных. Поскольку до сих пор биомедицинская отрасль не имеет каких-либо стандартов в обозначении таких параметров, в отличие от физико-математических и технических отраслей, где такие стандарты де-юре и де-факто имеются, следует привести названия и обозначения таких параметров. В частности, в большинстве отраслей знания принято генеральные параметры в популяции обозначать буквами греческого алфавита, тогда как выборочные параметры соответствующими буквами латинского алфавита.

Приводим ниже пример такого описания, отражающего личную точку зрения автора, и никоим образом не претендующего на «истину в последней инстанции».

«В работе анализировалась выборка объемом 360 наблюдений. Каждое наблюдение содержало 56 переменных, из которых 26 признаков являлись дискретными, качественными, и 30 признаков – непрерывными, количественными. Доля пропущенных значений составила менее 1% . Использовались следующие методы статистического анализа: проверка нормальности распределения количественных признаков с использованием критерия Колмогорова-Смирнова с поправкой Лиллиефорса и критерия Шапиро-Уилка; проверка равенства генеральных дисперсий с помощью критериев Фишера и Кохрэна; анализ таблиц сопряженности; ранговый корреляционный анализ; непараметрический дисперсионный анализ Краскела-Уоллиса и Фридмана; лог-линейный анализ; логистическая регрессия для мультиномиальных откликов. Выборочные параметры, приводимые далее в таблицах, имеют следующие обозначения: М – среднее, s – стандартное (среднеквадратичное) отклонение, m – ошибка среднего, n – объем анализируемой подгруппы, р – достигнутый уровень значимости. Критическое значение уровня значимости принималось равным 5% . Анализ данных производился с помощью пакетов программ SAS 9 и SPSS 14.»

Обратите внимание, что в приведенном выше примере нет перечисления всех остальных параметров и показателей, которые могут быть получены в отдельных конкретных видах анализа. Это вызвано тем, что более уместно о них сказать именно в контексте обсуждения результатов этого анализа. Например, приводя результаты рангового корреляционного анализа можно сказать: «Наблюдалась положительная корреляционная связь между признаками …. . Коэффициент корреляции Спирмена rs=0,79 (р=0,002).»

При описании качественных признаков следует указать их природу – ранговые, порядковые это признаки, или же номинальные, классификационные. Привести значения каждой градации, уровня такого признака. Очевидно, что если в массиве данных много признаков, то такое описание может занять довольно много места. Весьма желательно показать соотношения отдельных подгрупп наблюдений по группирующим признакам, например по полу. Обычно это отражают в таблицах, давая значения доли в процентах для наблюдений по каждой подгруппе.

При описании количественных признаков для характеристики исследуемых популяций приводят выборочные оценки соответствующих генеральных параметров, в частности мер положения (центральной тенденции), мер рассеяния и мер формы распределения. Чаще всего это выборочные средние М, медиана Ме, мода Мо, стандартное отклонение s, ошибка среднего m, и межквартильный (интерквартильный) размах. Говоря о законе распределения, и в частности о результатах проверки гипотезы о нормальности распределения, можно пойти двумя путями. В первом случае ограничиться только тем, что привести значения использованных критериев проверки нормальности и значений «р=. .. » с соответствующим комментарием. Во втором же случае помимо этой информации привести еще и графики. Это может быть либо гистограмма с линией ожидаемой нормальной функции плотности или функции распределения, либо же так называемый график распределения на «вероятностной бумаге».

Автор рекомендует остановиться на последнем графике, поскольку помимо соответствия (несоответствия) нормальному распределению здесь можно наблюдать также возможные группировки наблюдений, аномальные выбросы, наличие симметрии и другие нюансы, заслуживающие дальнейшего обсуждения. Предположим, что по результатам проверки нормальности нулевая гипотеза была отвергнута. График, о котором идет речь выше, позволяет предположить, что мы имеем дело с лог-нормальным распределением. После проведения соответствующего преобразования можно вновь привести аналогичный график как свидетельство правильности такого предположения.

Нередко автор публикации стоит перед выбором: использовать ли для описания выборочных параметров обозначение (M ± m) или же (M ± s), где m – ошибка среднего, s – средне-квадратичное отклонение. В некоторых рекомендациях отдается предпочтение первому варианту, в других – второму. Учитывая, что «m» и «s» связаны между собой соотношением m=s/sqrt(n), (sqrt(n) – корень квадратный из объема выборки «n»), спор об этом представляется достаточно схоластическим. Выбор того или иного варианта должен в большей степени определяться контекстом. Например, если речь идет о сравнении групповых средних, то логичнее использовать первый вариант. Если же просто приводятся выборочные характеристики отдельных групп, то разумнее использовать второй вариант. Важно, чтобы как для первого, так и для второго случая всегда приводилось значение объема выборки «n». Тогда зная, например, «m» всегда можно вычислить и «s», и наоборот.

В последнее время часть авторов использует доверительные интервалы для описания точности оценок, например среднего. Такие оценки обычно представляют собой обычно двусторонние 95%-ные интервалы, задаваемые выражением M±1,96m. Однако авторы при этом забывают, что при этом необходимо указать величину доверительной вероятности. В ряде случае доверительный интервал представляет самостоятельный интерес, в частности, при анализе частотных соотношений. В этом случае достаточно информативен такой признак, как ЧБНЛ – «Число Больных, которых Необходимо Лечить определенным методом в течение определенного времени, чтобы достичь определенного эффекта или предотвратить неблагоприятный исход». Данный показатель находится как обратная величина для одной из границ доверительного интервала для доли, пропорции.

Описание использованных методов статистики (специальная часть)

Помните, что содержание описания выводов о применении любого статистического метода помимо собственно информации о полученных результатах, всегда дает читателю информацию и об уровне вашего владения этим методом. Поэтому старайтесь описывать только то, что сами хорошо понимаете. Чтобы такого не было, организуйте свое исследование так, чтобы анализ данных проводил профессионал в данной области, который и даст вам описание этого этапа. Если же вы сомневаетесь в правильности или корректности собственных формулировок, то обратитесь за консультацией к специалисту в этой области.

рекомендации по описанию более 50 методов и критериев, наиболее часто используемых в статистическом анализе биомедицинских данных – http://www.biometrica.tomsk.ru/recom.pdf

Литература:

Леонов В. Три «Почему …» и пять принципов описания статистики в биомедицинских публикациях (исправленная версия от 10.12.06) [Электронный ресурс]. URL: http://www.biometrica.tomsk.ru/principals.htm (дата обращения: 06.04.2018).

Dictionary by Merriam-Webster: самый надежный онлайн-словарь Америки

Предлагаемые поисковые запросы: снаряжение, извилистый, противоречащий, умасливающий, бесполезный, неизбежный

Мегавикторина «Назови эту вещь»: Том. 4

Проверьте свой визуальный словарный запас!

Играть »

9Викторина 0002 Лучшие слова 2022 года

Четырнадцать слов, которые помогли определить год.

Играть »

Разберитесь с этими сокращениями как можно скорее

Вам не нужно быть инженером НАСА, чтобы понять это правильно

Играть »

слова, названные в честь людей

Узнайте, кто стоит за «купальником», «морфием» и многим другим.

Играть »

Words of Snow and Ice Викторина

Подборка слов из более холодных частей лексикона.

Играть »

30 способов предсказать будущее

Дайте нам знать, если что-то из этого подойдет вам

Читать сейчас »

Отчужденность, слабохарактерность и другие слова для интровертов

Не удивляйтесь, если никто из них не хочет быть в центре внимания

Читать сейчас »

Новогодние обещания: довольно старая практика

Привычка ломать их, наверное, всего на пару дней моложе

Читать сейчас »

Еще 9 лучших слов для питья

Запомните это _до_ того, как начнете свой вечер

Читать сейчас »

14 фобий, о которых вы, вероятно, не слышали

Слова для необычных страхов

Читать сейчас »

Более часто неправильно произносимые слова

Читать сейчас »

В чем разница между «сочувствием» и «сочувствием»?

Хотя слова появляются в похожем контексте, они имеют разные значения

Читать сейчас »

Можно ли начинать предложение с «И»?

фанбои далеко не уйдут

Читать сейчас »

Названия времен года пишутся с большой буквы?

Об именах нарицательных и опадающих листьях

Читать сейчас »

Веселье! Веселее!! Самое смешное!!!

У нас тут сплошное веселье, ребята

Читать сейчас »

играть

играть

играть

играть

играть

Найдите слова того года, когда вы родились… и не только!

Select a year202220212020201820172016201520142013201220112010200920082007200620052004200320022001200019991998199719961995199419931992199119

91988198719861985198419831982198119801979197819771976197519741973197219711970196919681967196619651964196319621961196019591958195719561955195419531952195119501949194819471946194519441943194219411940193919381937193619351934193319321931193019291928192719261925192419231922192119201919191819171916191519141913191219111910190919081907190619051

031

  • 011

    991898189718961895189418931892189118

  • 9188818871886188518841883188218811880187918781877187618751874187318721871187018691868186718661865186418631862186118601859185818571856185518541853185218511850184918481847184618451844184318421841184018391838183718361835183418331832183118301829182818271826182518241823182218211820181918181817181618151814181318121811181018091808180718061805180418031802180118001799179817971796179517941793179217911791788178717861785178417831782178117801779177817771776177517741773177217711770176917681767176617651764176317621761176017591758175717561755175417531752175117501749174817471746174517441743174217411740173917381737173617351734173317321731173017291728172717261725172417231722172117201719171817171716171517141713171217111710170917081707170617051704170317021701170016991698169716961695169416931692169116
    9168816871686168516841683168216811680167916781677167616751674167316721671167016691668166716661665166416631662166116601659165816571656165516541653165216511650164916481647164616451644164316421641164016391638163716361635163416331632163116301629162816271626162516241623162216211620161916181617161616151614161316121611161016091608160716061605160416031602160116001599159815971596159515941593159215911591588158715861585158415831582158115801579157815771576157515741573157215711570156915681567156615651564156315621561156015591558155715561555155415531552155115501549154815471546154515441543154215411540153915381537153615351534153315321531153015291528152715261525152415231522152115201519151815171516151515141513151215111510150915081507150615051504150315021501150015th century14th century13th century12th centurybefore 12th century

    • А
    • Б
    • С
    • Д
    • Е
    • Ф
    • грамм
    • ЧАС
    • я
    • Дж
    • К
    • л
    • М
    • Н
    • О
    • п
    • Вопрос
    • р
    • С
    • Т
    • U
    • В
    • Вт
    • Икс
    • Д
    • Z
    • 0-9
    • БИО
    • ГЕО
    • А
    • Б
    • С
    • Д
    • Е
    • Ф
    • грамм
    • ЧАС
    • я
    • Дж
    • К
    • л
    • М
    • Н
    • О
    • п
    • Вопрос
    • р
    • С
    • Т
    • U
    • В
    • Вт
    • Икс
    • Д
    • Z
    • 0-9

    scipy.

    {-(\nu+1)/2}\]

    , где \(x\) — действительное число, а параметр степеней свободы \(\nu\) (обозначается df в реализации) удовлетворяет \(\nu > 0\). \(\Gamma\) — гамма-функция ( scipy.special.gamma ).

    Приведенная выше плотность вероятности определена в «стандартизированной» форме. Переключать и/или масштабировать распределение, используя параметры loc и scale . В частности, t.pdf(x, df, loc, scale) тождественно эквивалентно t.pdf(y,df)/масштаб с y = (x - loc) / шкала . Обратите внимание, что смещение местоположения дистрибутива не делает его «нецентральным» распределением; нецентральные обобщения некоторые дистрибутивы доступны в отдельных классах.

    Примеры

     >>> импортировать numpy как np
    >>> из scipy.stats импортировать t
    >>> импортировать matplotlib.pyplot как plt
    >>> рис, топор = plt.subplots(1, 1)
     

    Рассчитать первые четыре момента:

     >>> df = 2,74
    >>> среднее значение, вар, перекос, курт = t. stats(df, moment='mvsk')
     

    Показать функцию плотности вероятности ( pdf ):

     >>> x = np.linspace(t.ppf(0,01, df),
    ... t.ppf(0,99, df), 100)
    >>> ax.plot(x, t.pdf(x, df),
    ... 'r-', lw=5, alpha=0.6, label='t pdf')
     

    В качестве альтернативы можно вызвать объект распределения (как функцию) зафиксировать параметры формы, местоположения и масштаба. Это возвращает «замороженный» Объект RV с фиксированными заданными параметрами.

    Заморозить дистрибутив и отобразить замороженный pdf :

     >>> rv = t(df)
    >>> ax.plot(x, rv.pdf(x), 'k-', lw=2, label='замороженный pdf')
     

    Проверка точности cdf и ppf :

     >>> vals = t.ppf([0,001, 0,5, 0,999], df)
    >>> np.allclose([0,001, 0,5, 0,999], t.cdf(vals, df))
    Истинный
     

    Генерация случайных чисел:

     >>> r = t.rvs(df, размер=1000)
     

    И сравните гистограмму:

     >>> ax.hist(r,density=True, bins='auto', histtype='stepfilled', alpha=0. 2)
    >>> ax.set_xlim([x[0],x[-1]])
    >>> ax.legend(loc='лучший', frameon=False)
    >>> plt.show()
     

    Методы

    rvs(df, loc=0, scale=1, size=1, random_state=None)

    Случайные величины.

    pdf(x, df, loc=0, масштаб=1)

    Функция плотности вероятности.

    logpdf(x, df, loc=0, масштаб=1)

    Логарифм функции плотности вероятности.

    cdf(x, df, loc=0, scale=1)

    Суммарная функция распределения.

    logcdf(x, df, loc=0, масштаб=1)

    Лог интегральной функции распределения.

    sf(x, df, loc=0, масштаб=1)

    Функция выживания (также определяется как 1 - cdf , но sf иногда является более точным).

    logsf(x, df, loc=0, масштаб=1)

    Журнал функции выживания.

    ppf(q, df, loc=0, масштаб=1)

    Функция процентной точки (обратная cdf — процентили).

    isf(q, df, loc=0, масштаб=1)

    Обратная функция выживания (обратная sf ).

    момент (порядок, df, loc=0, масштаб=1)

    Нецентральный момент указанного порядка.

    статистика (df, loc=0, масштаб=1, моменты=’mv’)

    Среднее («m»), дисперсия («v»), перекос («s») и/или эксцесс («k»).

    энтропия (df, loc=0, масштаб=1)

    (Дифференциальная) энтропия ВС.

    подходят(данные)

    Оценки параметров для общих данных.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    © 2015 - 2019 Муниципальное казённое общеобразовательное учреждение «Таловская средняя школа»

    Карта сайта