Статистика фишер – Критерий Фишера в программе STATISTICA в среде Windows — Студопедия.Нет

Содержание

Критерий Фишера в программе STATISTICA в среде Windows — Студопедия.Нет

Критерий Фишера

Критерий Фишера применяется при проверке гипотезы о равенстве дисперсий двух генеральных совокупностей, распределенных по нормальному закону. Он является параметрическим критерием.

F-критерий Фишера называют дисперсионным отношением, так как он формируется как отношение двух сравниваемых несмещенных оценок дисперсий.

Пусть в результате наблюдений получены две выборки. По ним вычислены дисперсии и , имеющие и степеней свободы. Будем считать, что первая выборка взята из генеральной совокупности с дисперсией , а вторая – из генеральной совокупности с дисперсией . Выдвигается нулевая гипотеза о равенстве двух дисперсий, т.е. H0: или . Для того, чтобы отвергнуть эту гипотезу нужно доказать значимость различия при заданном уровне значимости .

Значение критерия вычисляется по формуле:

.

Очевидно, что при равенстве дисперсий величина критерия будет равна единице. В остальных случаях она будет больше (меньше) единицы.

Критерий имеет распределение Фишера . Критерий Фишера – двусторонний критерий, и нулевая гипотеза отвергается в пользу альтернативной если . Здесь , где – объем первой и второй выборки соответственно.

В системе STATISTICA реализован односторонний критерий Фишера, т.е. в качестве всегда берут максимальную дисперсию. В этом случае нулевая гипотеза отвергается в пользу альтернативы , если .

Пример

Пусть поставлена задача, сравнить эффективность обучения двух групп студентов. Уровень успеваемости — характеризует уровень управления процессом обучения, а дисперсия качество управления обучением, степень организованности процесса обучения. Оба показателя являются независимыми и в общем случае должны рассматриваться совместно. Уровень успеваемости (математическое ожидание) каждой группы студентов характеризуется средними арифметическими и , а качество характеризуется соответствующими выборочными дисперсиями оценок: и . При оценке уровня текущей успеваемости оказалось, что он одинаков у обоих учащихся: = = 4,0. Выборочные дисперсии: и . Числа степеней свободы, соответствующие этим оценкам: и . Отсюда для установления различий в эффективности обучения мы можем воспользоваться стабильностью успеваемости, т.е. проверим гипотезу .

Вычислим (в числителе должна быть большая дисперсия), . По таблицам (STATISTICAProbability Distribution Calculator) находим , которое меньше вычисленного, следовательно нулевая гипотеза должна быть отвергнута в пользу альтернативы . Это заключение может не удовлетворить исследователя, поскольку его интересует истинная величина отношения (у нас в числителе всегда большая дисперсия). При проверке одностороннего критерия получим , что меньше вычисленного выше значения. Итак, нулевая гипотеза должна быть отвергнута в пользу альтернативы .

Критерий Фишера в программе STATISTICA в среде Windows

Для примера проверки гипотезы (критерий Фишера) используем (создаем) файл с двумя переменными (fisher.sta):

Рис. 1. Таблица с двумя независимыми переменными

Чтобы проверить гипотезу необходимо в базовой статистике (Basic Statistics and Tables) выбрать проверку по Стьюденту для независимых переменных. (t-test, independent, by variables).

Рис. 2. Проверка параметрических гипотез

После выбора переменных и нажатия на клавишу Summary производится подсчет значений среднеквадратичных отклонений и критерия Фишера. Кроме этого определяется уровень значимости p, при котором различие несущественно.

Рис. 3. Результаты проверки гипотезы (F- критерий)

Используя Probability Calculator и задав значение параметров можно построить график распределения Фишера с пометкой вычисленного значения.

Рис. 4. Область принятия (отклонения) гипотезы (F- критерий)

Источники.

1. Проверка гипотез об отношениях двух дисперсий

URL: /tryphonov3/terms3/testdi.htm

2. Лекция 6. :8080/resources/math/mop/lections/lection_6.htm

3. F – критерий Фишера

URL: /home/portal/applications/Multivariatadvisor/F-Fisheer/F-Fisheer.htm

4. Теория и практика вероятностно-статистических исследований.

URL: /active/referats/read/doc-3663-1.html

5. F – критерий Фишера

URL: /stat/s04.html

Распределœение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).

Рис. 6.3. Кумулята распределœения домохозяйств по размеру

4. Рассчитаем накопленные частоты: Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

Размер заработной платы руб в месяц Xi Численность работников чел. fi Накопленные частоты S
до 5000    
5000 — 7000    
7000 — 10000    
10000 — 15000    
Итого:   -

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:

Огива

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объёму признака.

Равномерному распределœению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределœении график представляет собой вогнутую кривую исходя из уровня концентрации признака.

12.Виды абсолютных и относительных показателœей.

Статистический показатель

— количественная характеристика социально-экономических явлений и процессов в условиях качественной определœенности.

Различают показатель-категорию и конкретный статистический показатель:

Показатель категория определяет содержание статистического показателя, то есть не численное значение определœенного показателя, а его элементы: к примеру коэффициент рождаемости, смертности, национального богатства.

Конкретный статистический показатель — это цифровая характеристика изучаемого явления или процесса. К примеру: численность населœения России на данный момент составляет 145 млн.человек.

По форме различают статистические показатели:

  • Абсолютные
  • Относительные
  • Средние

По охвату единиц различают индивидуальные и сводные показатели.

Индивидуальные показатели — характеризуют отдельный объект или отдельную единицу совокупности (прибыль фирмы, размер вклада отдельного человека).

Сводные показатели — характеризуют часть совокупности или в всю статистическую совокупность в целом. Их можно получить как объёмные и расчетные. Объемные показатели получают путем сложения значений признака отдельных единиц совокупности. Полученная величина принято называть объёмом признака. Расчетные показатели вычисляются по различным формулам и используются при анализе социально-экономических явлений.

Статистические показатели по временному фактору делятся на:

  • Моментные показатели — отражают состояние или уровень явления на определœенный момент времени. К примеру, число вкладов в Сбербанке на конец какого-либо периода.
  • Интервальные показатели — характеризуют итоговый результат за период (день, неделя, месяц, квартал, год) в целом. К примеру, объём произведенной продукции за год.

Статистические показатели связаны между собой. По этой причине, чтообы составить целостное представление об изучаемом явлении или процессе, крайне важно рассматривать систему показателœей.

2. Однофакторный дисперсионный анализ для несвязан­ных выборок

Назначение метода

Метод однофакторного дисперсионного анализа применяется в тех случаях, когда исследуются изменения результативного признака под влиянием изменяющихся условий или градаций какого-либо фактора. В данном варианте метода влиянию каждой из градаций фактора подвер­гаются разные выборки испытуемых. Градаций фактора должно быть не менее трех. (Градаций может быть и две, но в этом случае мы не сможем установить нели­нейных зависимостей и более разумным представляется использование более про­стых).

Непараметрическим вариантом этого вида анализа является критерий Н Крускала-Уоллиса.

Гипотезы

H0: Различия между градациями фактора (разными условиями) являются не более выраженными, чем случайные различия внутри каждой группы.

H1: Различия между градациями фактора (разными условиями) являются более выраженными, чем случайные различия внутри каждой группы.

2.2. Ограничения метода однофакторного дисперсионного анали­за для несвязанных выборок

1. Однофакторный дисперсионный анализ требует не менее трех града­ций фактора и не менее двух испытуемых в каждой градации.

2. Результативный признак должен быть нормально распределен в ис­следуемой выборке.

Правда, обычно не указывается, идет ли речь о распределении признака во всей обследованной выборке или в той ее части, которая составляет дисперсионный комплекс.

3. Пример решения задачи методом однофакторного дисперсионного анализа для несвязанных выборок на примере:

Три различные группы из шести испытуемых получили списки из десяти слов. Первой группе слова предъявлялись с низкой скоростью -1 слово в 5 секунд, второй группе со средней скоростью — 1 слово в 2 секунды, и третьей группе с большой скоростью — 1 слово в секунду. Было предсказано, что показатели воспроизведения будут зависеть от скорости предъявления слов. Результаты представлены в Табл. 1.

Количество воспроизведенных слов Таблица 1

№ испытуемого Группа 1: низкая скорость Группа 2: средняя скорость Группа 3: высокая скорость
1 8 7 4
2 7 8 5
3 9 5 3
4 5 4 6
5 6 6 2
6 8 7 4
Суммы 43 37 24
Средние 7,17 6,17 4,00
Общая сумма

104

H0: Различия в объеме воспроизведения слов между группами являются не более выраженными, чем случайные различия внутрикаждой группы.

H1:Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы. Используя экспериментальные значения, представленные в Табл. 1, установим некоторые величины, которые будут необходимы для расчета критерия F.

Расчет основных величин для однофакторного дисперсионного анализа представим в таблице:

Таблица 2

Таблица 3

Последовательность операций в однофакторном дисперсионном анализе для несвязанных выборок

Часто встречающееся в этой и последующих таблицах обозначе­ние SS — сокращение от «суммы квадратов» (sum of squares). Это со­кращение чаще всего используется в переводных источниках.

SSфакт означает вариативность признака, обусловленную действи­ем исследуемого фактора;

SSобщ — общую вариативность признака;

SCA -вариативность, обусловленную неучтенными факторами, «случайную» или «остаточную» вариативность.

MS — «средний квадрат», или математическое ожидание суммы квадратов, усредненная величина соответствующих SS.

df — число степеней свободы, которое при рассмотрении непара­метрических критериев мы обозначили греческой буквой v.

Вывод: H0 отклоняется. Принимается H1. Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы (α=0,05). Итак, скорость предъявления слов влияет на объем их воспроизведения.

Пример решения задачи в Excel представлен ниже:

Исходные данные:

Используя команду: Сервис->Анализ данных->Однофакторный дисперсионный анализ, получим следующие результаты:

studopedia.net

Фишер. Статистический вывод

Рональд Фишер — ученый, снабдивший статистику инструментами, благодаря которым она обрела то огромное значение, которое имеет сегодня. Его основной вклад — статистический вывод, инновационный подход, связанный с понятием вероятности, который дал статистике, состоявшей прежде на службе других дисциплин, необходимый импульс для того, чтобы она стала полноправной наукой. Этому британскому математику и биологу мы обязаны статистическим методом, который применяется в планировании научных экспериментов. Он был ярым сторонником евгеники, зародившейся в первой половине XX века, и в этом контексте его исследования касались также генетики и современной эволюционной теории.

По теме см. также Левин. Статистика для менеджеров с использованием Microsoft Excel

Наука. Величайшие теории: выпуск 47: Возможно да, возможно нет. Фишер. Статистический вывод. — М.: Де Агостини, 2015. — 176 с.

Скачать конспект (краткое содержание) в формате Word или pdf, примеры в формате Excel

Глава 1. Статистика до Фишера

Принято считать, что статистика состоит из двух взаимосвязанных, но самостоятельных разделов: описательной статистики, которая занимается эксплоративным (пробным, разведочным) анализом данных, и статистического вывода, отвечающего за предсказания в условиях неопределенности.

Золотая теорема Бернулли, известная сегодня как просто теорема Бернулли, гласит, что относительная частота события стремится к фиксированному числу (вероятности события) по мере того, как увеличивается количество повторений эксперимента (рис. 1).

Рис. 1. Относительная частота выпадения орла после 100 подбрасываний монеты; откройте файл Excel и поэкспериментируйте, нажимая F9; поскольку график основан на формуле, использующей случайные числа, его вид будет постоянно меняться, но стремление к среднему значению будет неизменным

На рубеже XVIII и XIX веков Пьер-Симон де Лаплас (1749–1827) утверждал, что ситуации, связанные со случайностью, бывают двух типов. В ситуациях первого типа случай проявляется в результатах. Известно, что в урне находятся белые и черные шары; вопрос: какой шар мы вытащим? На основе причин (количество белых и черных шаров в урне) вычислим вероятность результата: вытащим ли мы белый или черный шар? В ситуациях второго типа случай проявляется не в результатах, а в причинах. Мы знаем результат опыта (например, мы вытащили черный шар) и хотим вычислить состав содержимого урны, который нам неизвестен (подробнее см. Пьер Симон Лаплас. Опыт философии теории вероятностей).

Представим себе урну, в которой могут быть два разных набора шаров: 2 белых и 3 черных или 3 белых и 2 черных (рис. 2). Вытаскиваем случайный шар, он оказывается черным; какой набор шаров в урне более вероятен? Теорема Байеса обеспечивает численную оценку этой вероятности (подробнее см. Идеи Байеса для менеджеров). Если предположить a priori, что два состава равновероятны (вероятность каждого равна 0,5), после применения формулы Байеса вероятность первого состава увеличивается до 0,6 из-за извлечения черного шара, тогда как вероятность второго состава уменьшается до 0,4. Вероятности a priori (0,5 и 0,5) корректируются a posteriori (0,6 и 0,4). Для Лапласа, как и для Байеса, эта важная теорема означала возможность обучения через опыт.

Рис. 2. Теорема Байеса в действии. Если мы вытащили черный шар, то согласно теореме Байеса, вероятность a posteriori состава на рисунке слева выше, чем вероятность состава на рисунке справа

В 1835 году ученик Лапласа, Симеон Дени Пуассон исследовал вопросы электоральной математики и юриспруденции и сформулировал «закон больших чисел», который обеспечивал лучшую основу применению исчисления вероятностей к социальным проблемам, объясняя статистическую стабильность в социальных изменениях. Большое количество индивидуумов, действуя в рамках системы, определяют регулярность, которая не зависит от их взаимной координации.

Неполнота генетических теорий Чарльза Дарвина (1809–1882) подтолкнула его кузена Фрэнсиса Гальтона (1822–1911) к попытке разрешить проблемы наследования признаков при помощи математического анализа биологических данных. В книге «Наследственность таланта, ее законы и последствия» (1869) он утверждает: «Точно так же, как методами тщательной и умелой селекции в рамках естественных ограничений удается получить стабильную породу собак или лошадей, обладающих особенными способностями к бегу или к чему-либо еще, представляется вполне возможным произвести высокоталантливую расу людей путем рассчитанных браков в течение нескольких последовательных поколений».

Гальтон считал, что союз двух умных людей приведет к рождению еще более умных детей, точно так же как у двух высоких людей рождаются еще более высокие дети. Однако эксперименты с наследованием, которые он проводил в течение всей жизни, привели к открытию другой статистической закономерности, отличной от ожидаемой. В своей книге «Естественное наследование» (1889) он назвал ее «возвращением к посредственности», а позднее — «регрессией к среднему». Сегодня мы знаем, что это не столько биологическая, сколько исключительно статистическая закономерность: более вероятно, что значения нормальной случайной величины будут ближе к ее среднему, ожидаемому значению (подробнее см. Даниэль Канеман. Думай медленно… решай быстро).

Гальтон обнаружил следующее линейное соотношение:

рост ребенка, см = 85 см + 0,5 * рост родителя, см

Это и была одна из прямых регрессии.

Глава 2. Карл Пирсон и биометрическая школа

Карл Пирсон (1857–1936) родился в Лондоне. Его семья принадлежала к среднему классу, что позволило юноше изучать математику в Кембридже, а после окончания в 1879 году продолжить обучение в университетах Гейдельберга и Берлина.

Одним из первых введенных им понятий было «стандартное отклонение». Далее он придумал коэффициент вариации, определив его как связь между стандартным отклонением и средним в абсолютном значении. Пирсон разработал еще два описательных показателя, коэффициент асимметрии и эксцесс. Пирсон сделал использование абстрактной математики в статистике обязательным и анализировал большие наборы данных (более 1000 объектов). Пирсон первым предупреждал об опасности выявления «ложных корреляций»: две переменные могут коррелировать между собой в отсутствие причинно-следственной связи или общей причины. В 1900 году Пирсон вывел критерий хи-квадрат (χ2) для определения качества подгонки наблюдаемого и теоретического, или ожидаемого, распределения.

В 1901 году Уэлдон и Пирсон, при участии Фрэнсиса Гальтона, основали журнал «Биометрика». В 1914 году Пирсон получил для публикации в «Биометрике» статью, подписанную 24-летним студентом по имени Р.А. Фишер. Статья была посвящена выборочным распределениям. Этот вопрос превращался в важную тему для дальнейшего развития статистического вывода, так как позволял количественно оценить надежность предположений, сделанных на основании репрезентативной выборки, имеющей своей целью узнать характеристики генеральной совокупности, набора объектов, который считался слишком большим, чтобы исследовать его полностью.

Характеристики генеральной совокупности, которые нужно было оценить, стали называть параметрами: генеральное среднее μ, стандартное отклонение генеральной совокупности σ или коэффициент корреляции генеральной совокупности ρ. Значения, вычисленные на основе данных выборки для оценки этих параметров, окрестили статистиками: выборочное среднее, стандартное отклонение выборки S.

Уильям Сили Госсет (1876–1937) по образованию был химиком, а познакомился со статистикой после работы в биометрической лаборатории Пирсона. В 1908 году он издал свою знаменитую статью «Возможная ошибка среднего» под псевдонимом Стьюдент. Причиной такой таинственности послужило то, что дублинская пивоварня Гиннесс, где он работал, не разрешала сотрудникам публиковать результаты исследований, проведенных на производстве. Стремясь контролировать качество производимого пива, Стьюдент собирал небольшие выборки (из соображений экономии). Он обнаружил, что один из типов кривых Пирсона соответствовал распределению, удобному для проведения этих экспериментов в малом масштабе. Так, если Стьюдент хотел оценить среднюю кислотность пива, произведенного на заводе за определенный период, он вычислял среднее из уровней кислотности, измеренных в дюжине бочек, которые составляли выборку. Проблема заключалась в том, что Стьюдент не знал возможную ошибку, возникающую при оценке среднего генеральной совокупности по выборочному среднему, то есть число, необходимое для определения точности статистического вывода и допустимого предела кислотности. Чтобы определить это, Стьюденту нужно было знать распределение выборочного среднего. Было замечено, что если выборка достаточно большая — 30 или более объектов, — распределение выборочного среднего приближается к нормальному (благодаря центральной предельной теореме), но если выборка маленькая, то дело обстоит иначе.

Стьюдент вычислил верное распределение, известное сегодня — после того как в 1925 году его отметил Фишер — как распределение t Стьюдента. На самом деле это целое семейство распределений, зависящих от количества степеней свободы; в общем случае оно более плоское, чем нормальное распределение, с более длинными хвостами, что отражает большую неуверенность в выводах. Эта вероятностная модель оказалась неотъемлемой частью статистических методов наших дней ввиду своей надежности, поэтому она используется не только для выводов на основании малых выборок из нормальной генеральной совокупности (для которой среднее и стандартное отклонение неизвестны), но также и для ненормально распределенных данных. Распределение t оказалось практически нечувствительным к гипотезе нормальности (рис. 3).

Рис. 3. Распределение t Стьюдента (серый цвет) обладает более широкими хвостами по отношению к нормальному (черный цвет)

Глава 3. Математические основы статистического вывода

В 1920-е годы Фишер принял эстафету у поколения статистиков, сформировавшегося вокруг Пирсона. Его статья «О математических основах теоретической статистики» и последовавшие за ней книги «Статистические методы для исследователей» и «Планирование экспериментов» ознаменовали становление статистического вывода как математической дисциплины. В них Фишер изложил критерий значимости, дисперсионный анализ и рандомизацию в качестве основных принципов любой работы ученого-натуралиста с фактами.

Статистический вывод — это набор методов, которые позволяют формулировать суждения об общем (генеральная совокупность) на основании частного (выборка), предоставляя меру уверенности в предсказании, вероятность ошибки.

До Фишера статистика, в которой доминировал титан Карл Пирсон, находилась в следующей ситуации. В описательной статистике, хотя и не существовало явного различия между выборкой и генеральной совокупностью, были известны простые графические представления (столбчатая диаграмма, гистограмма, диаграмма рассеяния) и вычислялись основные показатели центральной тенденции (среднее, медиана, мода), дисперсии (стандартное отклонение, хотя оно было и не единственной мерой), позиции (квартили и перцентили) и формы (асимметрия и эксцесс). Переход от разведывательного анализа данных к математической теории вероятностей проходил через подгонку теоретических распределений — нормальной кривой или кривых Пирсона — к наблюдаемым распределениям частот методом наименьших квадратов или методом моментов. Качество подгонки оценивалось с помощью критерия хи-квадрат. Наконец, статистический вывод мог похвастаться только двумя быстрыми методами: предсказаниями, основанными на анализе регрессии и корреляции, и в особенности обратными вероятностными методами, базирующимися на теореме Байеса (байесовский, или субъективный вывод).

Фишер заполнил пробел в этом важнейшем секторе, заложив основы методов оценки и вывода. Если Пирсон учил, как извлекать интересующую информацию из путаницы данных, Фишер показал, как познать целое (генеральную совокупность), наблюдая часть (выборку). Можно сказать, что Фишер довел до абсолюта создание методологического корпуса статистики: выбор теоретической модели на основании эмпирических данных, математическая дедукция свойств этой модели, оценка неизвестных параметров и заключительная проверка модели с помощью эксперимента. Подход, состоящий в сборе информации в ходе эксперимента и подготовке выводов на ее основе, составляет суть статистического вывода, и в отличие от вычисления вероятностей это не индуктивный, а дедуктивный процесс, сопровождающийся определенными ошибками, которые можно оценить количественно.

Сосредоточившись на проблемах теории оценки, Фишер утверждал, что речь шла о выборе наиболее подходящего значения из параметров генеральной совокупности традиционно обозначаемых греческими буквами, например, Θ на основании данных выборки, или, точнее, на базе статистик — обозначаемых латинскими буквами (например, Т), — которые вычисляются по наблюдаемым данным. Теория статистической оценки, разработанная Фишером, определяет, каким критериям должна удовлетворять хорошая оценка.

Сегодня три критерия, приведенные Фишером, претерпели небольшие изменения, хотя их смысл сохранился. Смещение. Оценка Т считается правильной и несмещенной для параметра Θ, если для любого размера выборки среднее значение ее распределения равно Θ, то есть если ожидаемое значение статистики Т является истинным значением Θ. Иначе оценка считается смещенной (рис. 4; подробнее см. СТАНДОТКЛОН.В и СТАНДОТКЛОН.Г: в чем различие?). Эффективность. Эффективность, или точность, оценки определяется как величина, обратная дисперсии ее выборочного распределения: чем больше дисперсия оценки, тем менее точна эта оценка, и наоборот. Это понятие имеет особенное значение для сравнения несмещенных оценок, так как среди них предпочтение должно отдаваться более эффективным, то есть обладающим наименьшей дисперсией.

Рис. 4. Пример смещения и эффективности оценки. Если мы сравним статистические оценки с выстрелами нескольких стрелков, то сможем лучше понять, какими качествами должна обладать хорошая оценка. Выстрелы стрелка А не отклоняются в каком-то одном направлении, но видно, что они очень разбросаны (это соответствует несмещенной, но неэффективной оценке). Выстрелы стрелка В смещены влево и разбросаны (оценка смещенная и неэффективная). Выстрелы стрелка С кучные, но отклоняются (смещенная и эффективная оценка).

Чтобы понять функцию правдоподобия, заново введенную Фишером и одну из самых важных для вывода, следует четко различать два довольно близких понятия. Пусть Θ — неизвестный параметр генеральной совокупности, а X — случайная выборка из этой совокупности. С одной стороны, существует вероятность получения выборки X при условии некоторого значения Θ (предполагается, что оно известно), обозначаемая р(Х|Θ) (X — переменная, Θ фиксирован) и определяющая вероятность появления всякой выборки. В проблеме оценки случай противоположный: наблюдается выборка X, но значение Θ неизвестно. Тем не менее описанная функция остается полезной, так как, заменив X на наблюдаемые значения, из Р(Х|Θ) для каждого Θ у нас будет вероятность получить выборочное значение X.

Изменяя Θ при фиксированном X, можно получить функцию, называемую функцией правдоподобия, L(Θ|Х), где X фиксирован, а Θ — переменная. Следует отметить, что после перемены ролей X и Θ в соответствии со сменой точки зрения, возникающей при выводе, функция правдоподобия не является распределением вероятности, следовательно, не подчиняется правилам исчисления вероятностей (когда подставляются конкретные значения из выборки). Эта функция отражает наши знания о параметре генеральной совокупности. И вместо предположения известного Θ и вычисления вероятности наблюдать различные выборки X допустим, что наблюдается конкретная выборка X, и оценим правдоподобие различных значений Θ.

Во время Второй мировой войны статистики, работавшие на стороне союзников, столкнулись с трудно разрешимой проблемой: как оценить общее количество немецких танков по серийным номерам захваченных у противника машин? Допустим, у захваченных танков следующие серийные номера: 2, 3, 7, 16. Сколько всего выпущено танков? Наилучшей возможной оценкой будет эффективная оценка (несмещенная и с минимальной дисперсией), формула которой для N следующая: m + (m –n)/n, где m — наибольший наблюдаемый серийный номер и n — размер выборки. Эту формулу можно интерпретировать как сумму выборочного максимума и «пустого среднего» выборки. К максимальному значению прибавляется среднее из промежутков между имеющимися наблюдениями, исходя из предположения, что за максимумом находится еще столько же элементов, сколько пропущено между имеющимися значениями. В нашем примере лучшей оценкой для N будет: 16 + (16-4)/4 = 19 танков всего (см. также Малые выборки в конкурентной разведке).

Фишер в качестве оценки Θ предлагал выбирать то значение, которое соответствует максимальной вероятности появления наблюдаемых значений выборки. Другими словами, выбрать такое значение параметра, которое, оказавшись реальным, максимизирует вероятность иметь данные, наблюдаемые в реальности.

Пусть имеется монета, вероятность выпадения сторон которой, р, неизвестна. Монету подбрасывают четыре раза и получают следующую серию: 0Р00 (орел-решка-орел-орел). Из исчисления вероятностей мы знаем, что Р(ОРОО|р) = р3(1 – р). Следовательно, функция правдоподобия: L(p|ОРОО) = р3(1 – р). Функция правдоподобия достигает максимума для значения 0,75. Таким образом, наша оценка, основанная на имеющейся выборке, будет р = 0,75. В сущности, это и есть основа метода оценки параметров с помощью максимального правдоподобия.

В период с 1923 по 1924 год Фишер писал книгу «Статистические методы для исследователей», которая увидела свет в 1925 году и на сегодняшний день выдержала 14 переизданий. Это самый влиятельный и известный труд Фишера. Он больше похож на учебник, чем на научную работу, благодаря убедительному стилю и характерному отсутствию математических доказательств. Возможно, этим и обусловлен его успех.

Фишер пишет, что статистика — не что иное, как математика, примененная к результатам наблюдений. При исследовании доступных выборок статистик делает выводы о полной совокупности, но они должны быть выражены не языком вероятности (как считали сторонники теоремы Байеса, или обратных вероятностных методов), а скорее языком правдоподобия.

Краеугольный камень всего произведения — «критерий значимости». В чем он состоит? В первую очередь в нулевой гипотезе Н0, которая устанавливает, например, что истинное значение неизвестного параметра таково, что Θ = Θ0. Затем выбирается статистика Т и вычисляется ее значение по данным имеющейся выборки X, которое обозначается как Т(Х). Так как распределение статистики Т в выборке известно, определяется вероятность того, что статистика Т примет значение, равное или большее наблюдаемому значению Т(Х), при условии, что нулевая гипотеза верна.

Математически это выглядит так: Р(Т Т(Х)|Н0). Это число было названо p-значением. Отсюда, если значение р достаточно мало — обычно меньше 0,05,— считается, что критерий оказался значимым и поэтому позволил опровергнуть нулевую гипотезу Н0. В противоположном случае тест оказывается незначимым для заранее заданного уровня значимости α = 0,05, отклонить нулевую гипотезу Н0 оказывается невозможным, ее временно принимают.

Нулевая гипотеза отвергалась только в том случае, когда вероятность наблюдать выборку вроде имеющейся была очень низка. Статистическое рассуждение основывалось на следующей логической дизъюнкции: «Или произошло исключительное событие (очень маловероятное), или нулевая гипотеза неверна». Очень малое р-значение указывало на то, что наблюдаемая выборка сильнее отличается от ожидаемой, чем это можно объяснить чистой случайностью, и поэтому исследователь имеет дело с неправдоподобной нулевой гипотезой, которую следует отвергнуть.

Закрепим эти понятия с помощью простой иллюстрации. Предположим, мы использовали новое удобрение на 20 растениях и наблюдали их рост в течение определенного периода времени, чтобы измерить влияние нового удобрения: увеличение (+) или уменьшение (–) скорости роста по отношению к росту без удобрения. Нашей нулевой гипотезой будет отсутствие всякого положительного эффекта от удобрения, то есть распределение ускорений (+) и замедлений (–) будет полностью случайным, как выпадение «орла» и «решки» при подбрасывании совершенно симметричной монеты. Поэтому, согласно нулевой гипотезе Н0, вероятность «+» будет равна вероятности «–», а именно Θ = 0,5. Представим, что после эксперимента мы видим 16 «+» и только 4 «–». Если мы выберем в качестве статистики Т количество наблюдаемых «+», то выяснится, что вероятность получить 16 или более «+» исходя из предположения, что вероятность положительного эффекта равна 0,5, составляет, как легко вычислить (см. рис. 5), только 0,006. То есть: Р(Т Т(Х)|Н0) = 0,006. Так как значение р ниже порогового α = 0,05, тест оказался значимым, и мы можем отвергнуть исходную нулевую гипотезу: есть эмпирические данные, противоречащие гипотезе, что удобрение не оказывает эффекта. Наоборот, все указывает на то, что оно стимулирует рост растений.

Рис. 5. Таблица расчета вероятности получить 16 и более «+» согласно формуле биномиальной вероятности:

Фишер предупреждал, что уровень значимости α не должен быть фиксированным, жестким. Впрочем, его предупреждение забыли и уровень 0,05 широко приняли, вплоть до того, что значение р = 0,051 стали считать незначимым, а 0,049 — значимым. Выбор этого граничного значения — вопрос не математический, универсальный, а зависит от прагматического контекста: если проверяется новое лекарство, то уровень значимости 0,05 несет 5%-ный риск того, что неэффективное лекарство будет признано эффективным (в этом случае, как и в некоторых других, уровень 0,01 или 0,001 может оказаться более подходящим).

Фишер описывал критерий значимости как способ отвергнуть нулевую гипотезу, которая никаким образом не может быть доказана и установлена окончательно. Этот подход, связанный с опровержением, соответствовал направлению «фальсификации», инициированному философом Карлом Поппером (1902–1994). Для статистика и философа наука характеризуется постановкой экспериментальных доказательств, которые могут опровергнуть или фальсифицировать теории, описываемые учеными (подробнее см. Карл Поппер. Логика научного исследования).

Методологически подход Фишера был разновидностью фальсификации в приложении к статистике: он состоял в опровержении гипотез, для которых наблюдения были относительно неправдоподобными. Нулевая гипотеза никогда не подтверждалась, но ее можно было опровергнуть. Если критерий оказывался значимым, гипотеза оказывалась неприемлемой в свете имеющихся данных; если нет, это говорило лишь о том, что гипотеза была совместима с данными.

Кроме критерия значимости, книга Фишера описывала дисперсионный анализ — другую инновационную статистическую методику, известную во всем мире по английской аббревиатуре ANOVA (англ. ANalysis Of VAriance; подробнее см. Однофакторный дисперсионный анализ).

В 1935 году Фишер издает книгу «Планирование экспериментов». Биологические исследования требуют проведения контролируемых экспериментов. Пассивного наблюдения недостаточно. Выборочная техника состоит в исследовании репрезентативной выборки из генеральной совокупности и измерении изучаемых показателей. Планирование экспериментов, наоборот, заключается в фиксации одних параметров и наблюдении за другими, с измерением возникающих изменений.

Объекты, получающие «обработку», являются экспериментальными единицами. Каждая обработка должна встречаться как минимум два раза, а лучше — несколько раз. Если мы хотим сравнить обработку А и В, в идеале следует применить их одновременно на множестве участков. Может случиться, что наблюдаемая разница между обработками А и В связана просто с разной плодородностью почвы на разных участках, а не с тем, например, что А эффективнее, чем В. Принцип повторения, сформулированный Фишером, помогал ограничить ошибку эксперимента, то есть случайную вариацию, не контролируемую экспериментатором (как, например, разная плодородность участков, на которых применяются обработки А и В).

baguzin.ru

Критерий Фишера Википедия

F-тест или критерий Фишера (F-критерий, φ*-критерий) — статистический критерий, тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).

Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на «степени свободы»). Чтобы статистика имела распределение Фишера, необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение Хи-квадрат. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.

Тест проводится путём сравнения значения статистики с критическим значением соответствующего распределения Фишера при заданном уровне значимости. Известно, что если F∼F(m,n){\displaystyle F\sim F(m,n)}, то 1/F∼F(n,m){\displaystyle 1/F\sim F(n,m)}. Кроме того, квантили распределения Фишера обладают свойством F1−α=1/Fα{\displaystyle F_{1-\alpha }=1/F_{\alpha }}. Поэтому обычно на практике в числителе участвует потенциально большая величина, в знаменателе — меньшая и сравнение осуществляется с «правой» квантилью распределения. Тем не менее тест может быть и двусторонним, и односторонним. В первом случае при уровне значимости α{\displaystyle \alpha } используется квантиль Fα/2{\displaystyle F_{\alpha /2}}, а при одностороннем тесте — Fα{\displaystyle F_{\alpha }}[1].

Более удобный способ проверки гипотез — с помощью p-значения p(F){\displaystyle p(F)} — вероятностью того, что случайная величина с данным распределением Фишера превысит данное значение статистики. Если p(F){\displaystyle p(F)} (для двустороннего теста — 2p(F{\displaystyle 2p(F})) меньше уровня значимости α{\displaystyle \alpha }, то нулевая гипотеза отвергается, в противном случае принимается.

ru-wiki.ru

СТАТИСТИКА ФИШЕРА — это… Что такое СТАТИСТИКА ФИШЕРА?


СТАТИСТИКА ФИШЕРА
 – статистический метод обработки данных измерений векторов, разработанный Р.Фишером. Широко применяется при обработке палеомагнитных данных. Проверка соответствия реальных распределений естественной остаточной намагниченности Jn и ее компонент распределению Фишера помогает оценить однокомпонентность совокупности векторов, эффективность чисток; при анализе временных последовательностей помогает выявить наличие регулярной составляющей Jn , что необходимо для диагностики синхронной намагниченности.

См. распределение Фишера, двухъярусный статистический анализ и др.

Палеомагнитология, петромагнитология и геология. Словарь-справочник.. Д.М. Печерский.

  • СТАВРОЛИТ
  • СТЕПЕНЬ ОДНОФАЗНОГО ОКИСЛЕНИЯ ТИТАНОМАГНЕТИТА

Смотреть что такое «СТАТИСТИКА ФИШЕРА» в других словарях:

  • Статистика — Гистограмма (метод графических изображений) У этого термина существуют и другие значения, с …   Википедия

  • Статистика малых выборок (small-sample statistics) — Принято считать, что начало С. м. в. или, как ее часто называют, статистике «малых п», было положено в первом десятилетии XX века публикацией работы У. Госсета, в к рой он поместил t распределение, постулированное получившим чуть позже мировую… …   Психологическая энциклопедия

  • Информация Фишера — В математической статистике и теории информации информацией Фишера называется дисперсия функции вклада выборки. Эта функция названа в честь описавшего её Рональда Фишера. Содержание 1 Определение 2 Свойства …   Википедия

  • Критерий Фишера — (F критерий, φ* критерий, критерий наименьшей значимой разности)  апостериорный статистический критерий, используемый для сравнения дисперсий двух вариационных рядов, то есть для определения значимых различий между групповыми средними в… …   Википедия

  • Экономическая статистика — Эконометрика  наука, изучающая конкретные количественные и качественные взаимосвязи экономических объектов и процессов с помощью математических и статистических методов и моделей. Определение предмета эконометрики было дано в уставе… …   Википедия

  • РАСПРЕДЕЛЕНИЕ ФИШЕРА — [Fisher, 1953] – аналог нормального распределения на сфере. Статистика Р.Фишера широко применяется при обработке палеомагнитных данных. Проверка соответствия реальных распределений векторов Jn и ее компонент распределению Фишера помогает оценить… …   Палеомагнитология, петромагнитология и геология. Словарь-справочник.

  • Биологическая статистика — Биометрия, или Биологическая статистика  раздел вариационной статистики, с помощью методов которого производят обработку экспериментальных данных и наблюдений, а также планирование количественных экспериментов в биологических исследованиях;… …   Википедия

  • Вариация (статистика) — У этого термина существуют и другие значения, см. Вариация. Вариация  различие значений какого либо признака у разных единиц совокупности за один и тот же промежуток времени. Причиной возникновения вариации являются различные условия… …   Википедия

  • Мода (статистика) — У этого термина существуют и другие значения, см. Мода (значения). Мода значение во множестве наблюдений, которое встречается наиболее часто. Случайная величина может не иметь моды. Иногда в совокупности встречается более чем одна мода (например …   Википедия

  • Медиана (статистика) — В этой статье не хватает ссылок на источники информации. Информация должна быть проверяема, иначе она может быть поставлена под сомнение и удалена. Вы можете …   Википедия

Книги

  • 744 партии Бобби Фишера, Голубев А.Н., Роберт (Бобби) Джеймс Фишер – международный гроссмейстер с 1958 года, одиннадцатыйчемпион мира по шахматам, гениальный и фанатичный слуга богини шахмат Каиссы. Удовлетворяя интерес… Категория: Увлечения, спорт и досуг Серия: — Издатель: Самиздай, Подробнее  Купить за 1093 руб
  • 744 партии Бобби Фишера, Голубев А.Н., Роберт (Бобби) Джеймс Фишер – международный гроссмейстер с 1958 года, одиннадцатыйчемпион мира по шахматам, гениальный и фанатичный слуга богини шахмат Каиссы. Удовлетворяя интерес… Категория: Увлечения, спорт и досуг Серия: — Издатель: Самиздай, Подробнее  Купить за 1093 руб
  • Экономические индексы, Р. Аллен, В книге рассматриваются основные вопросы построения индексов применительно к экономическим задачам измерения динамики уровня цен и объема продукции. Описываютсяиндексы Ласпейреса и Пааше в их… Категория: Статистика. Демография Издатель: Статистика, Подробнее  Купить за 760 руб

magnitologiya.academic.ru

Распределение Фишера

Распределением Фишера называется распределение случайной величины  ,

где .

Иными словами величины  имеют , поэтому величина  есть отношение двух хи-квадрат величин (с разными степенями свободы).

Из свойств Г-распределения следует, что распределение  останется тем же при  и любом >0 и что  при целых   допускает представление

где случайные величины  независимы .

Найдем плотность распределения .

Имеем

                                    (1)

;

Требуемая плотность получится, очевидно, если подставить сюда .

Моменты случайной величины  (если она существует):

      (2)

В частности, при  находим из (2) для первого момента:

,

Для второго момента из (2) имеем, полагая  :

.

Распределение Фишера иногда называют также распределением Снедекора.

Это связано с тем, что Фишер предложил использовать и табулировать, собственно, не распределение , а распределение случайной величины .

Распределение же  было несколько позже подробно продублировано Снедекором.

В начало

Содержание портала

statistica.ru

Рональд Фишер • ru.knowledgr.com

Сэр Рональд Эйлмер Фишер FRS (17 февраля 1890 – 29 июля 1962) был английским статистиком, эволюционным биологом, математиком, генетиком и eugenicist. Фишер известен как один из главных архитекторов неодарвинистского синтеза, для его существенных вкладов в статистику, включая дисперсионный анализ (АНОВА), метод максимальной вероятности, основанного на вере вывода и происхождения различных распределений выборки, и для того, чтобы быть одним из трех основных основателей популяционной генетики. Андерс Халд назвал его «гением, который почти единолично создал фонды для современной статистической науки», в то время как Ричард Докинс назвал его «самым великим биологом начиная с Дарвина».

Биография

Молодость

Фишер родилась в Восточном Финчли в Лондоне, Англия, Джорджу и Кейти Фишер. Его отец был успешным аукционистом и дилером искусств когда-то. У него было счастливое детство, любившее до безумия тремя старшими сестрами, старшим братом и его матерью, но она умерла от острого перитонита, когда ему было 14 лет. Его отец потерял его бизнес в нескольких необдуманных сделках только 18 месяцев спустя.

С 1896 до 1904 семья жила в Доме Inverforth в северном Лондоне на краю Хампстед-Хит, где английское Наследие установило синюю мемориальную доску в 2002, чтобы отметить детскую резиденцию Рональда Фишера.

Хотя у Рональда Фишера было довольно плохое зрение, он был рано развившимся студентом, выигрывая Медаль Neeld (конкурентоспособное эссе в математике) в Харроу-Скул в возрасте 16 лет. Из-за его плохого зрения он был обучен математике без помощи бумаги и ручки, которая развила его способность визуализировать проблемы в геометрических терминах, не способствуя его интересу к написанию надлежащих происхождений математических решений, особенно доказательства. Он поразил своих пэров с его способностью предугадать математические решения, не оправдывая его заключения, показав промежуточные шаги. Он также развил большой интерес к биологии и особенно эволюционной биологии.

В 1909 он выиграл стипендию в Гонвилл и Колледж Caius, Кембридж. Там он сформировал много дружбы и стал приведенным в восторг с опрометчивой интеллектуальной атмосферой. В Кембридже Фишер узнал о недавно открытой вновь теории Менделевской генетики. Он видел биометрию и ее растущий корпус статистических методов как потенциальный способ урегулировать прерывистую природу Менделевского наследования с непрерывным изменением и постепенным развитием. Однако его передовое беспокойство было евгеникой, которую он рассмотрел как неотложную социальную, а также научную проблему, которая охватила и генетику и статистику.

В 1911 Рыбак был вовлечен в формирование из Общества Евгеники Кембриджского университета с Джоном Мэйнардом Кейнсом, Р. К. Паннеттом и Горацием Дарвином (сын Чарльза Дарвина). Эта группа была активна, и она провела ежемесячные встречи, часто показывая адреса лидерами господствующих организаций евгеники, такими как Образовательное Общество Евгеники Лондона, основанного полукузеном Чарльза Дарвина, Фрэнсисом Гэлтоном в 1909.

Близко к церемонии вручения дипломов Фишера в 1912, его наставник сказал его студенту, что — несмотря на его огромную способность для научной работы и его математического потенциала — его несклонность, чтобы показать вычисления или доказать суждения отдала ему неподходящий для карьеры в прикладной математике, которая потребовала большей тщательности. Его наставник дал ему «прохладную» рекомендацию, заявив, что, если бы Фишер «придерживался веревок, он сделал бы первоклассного математика, но он не был бы».

После его церемонии вручения дипломов Фишер стремился присоединиться к британской армии в ожидании входа Великобритании в Первую мировую войну. Однако он неоднократно подводил медицинские экспертизы из-за его плохого зрения. За следующие шесть лет он работал статистиком для Лондонского Сити. Для части его военной работы он поднял обучающую физику и математику в последовательности государственных школ, включая Колледж Брэдфилда в Беркшире, а также на борту H.M. Учебное судно Вустер. Майор Леонард Дарвин (другой сын Чарльза Дарвина) и нетрадиционный и оживленный друг, которого он назвал Gudruna, был почти своими единственными контактами с его Кембриджским кругом. Они выдержали его через этот трудный период.

Яркое пятно в его жизни тогда было то, что Gudruna настраивают его с ее сестрой Эйлин Гиннесс. Они были женаты в 1917, когда ей было только 17 лет. С помощью ее сестры он настроил операцию по натуральному хозяйству в поместье в Брэдфилде, где они имели большой сад и разводили животных, учась уметь обойтись на очень мало. Они пережили остальную часть войны, не используя их продовольственные купоны.

Во время этого периода Фишер начал писать рецензии на книгу для Eugenic Review и постепенно увеличивал свой интерес к генетической и статистической работе. Он добровольно предложил предпринимать все такие обзоры для журнала и был нанят к положению с частичной занятостью майором Дарвином. Он опубликовал несколько статей на биометрии во время этого периода, включая инновационную бумагу «Корреляция Между Родственниками на Гипотезе Менделевского Наследования», написанный в 1916 и издал в 1918. Эта бумага положила начало тому, что стало известным как биометрическая генетика, и это ввело методологию дисперсионного анализа, который был значительным шагом вперед по методам корреляции, используемым ранее. Эта бумага показала, что наследование черт, измеримых реальными ценностями (т.е., непрерывных или размерных черт), совместимо с Менделевскими принципами. Это формирует основание генетики сложного наследования черты и смягченных дебатов между biometricians и Mendelians и совместимостью наследования макрочастицы с естественным отбором. В этой газете было также первое использование термина «различие» в статистике.

После конца Первой мировой войны Рыбак пошел, ища новую работу в низких надеждах, назвав себя «вопиющей неудачей в двух профессиях» как коммерческий статистик и как учитель. Ему предложили положение в Лаборатории Galton во главе с Карлом Пирсоном, основателем математической статистики в Великобритании. Поскольку он видел развивающуюся конкуренцию с Пирсоном как профессиональное препятствие, однако, он принял временную работу вместо этого в качестве статистика с небольшой сельскохозяйственной станцией в сельской местности в 1919.

Ранние профессиональные годы

В 1919 Рыбак начал работу над Экспериментальной Станцией Rothamsted в Харпендене, Хартфордшире, Англия. Здесь он начал основное исследование обширных коллекций данных, зарегистрированных за многие годы. Это привело к ряду отчетов в соответствии с общим названием Исследования в Изменении Урожая. Это начало период большой производительности. За следующие семь лет он вел принципы дизайна экспериментов и разработал его исследования дисперсионного анализа. Он содействовал своим исследованиям статистики небольших выборок. Возможно, еще более важный, он начал свой систематический подход анализа реальных данных как трамплин для развития новых статистических методов. Он развил вычислительные алгоритмы для анализа данных от его уравновешенных экспериментальных планов. В 1925 эта работа привела к публикации его первой книги, Статистических Методов для Научных работников. Эта книга прошла много выпусков и переводов в более поздних годах, и это стало стандартной справочной работой для ученых во многих дисциплинах. В 1935 эта книга сопровождалась Дизайном Экспериментов, который также широко использовался.

В дополнение к дисперсионному анализу Фишер назвал и продвинул метод максимальной оценки вероятности. Фишер также породил понятие достаточности, вспомогательной статистики, линейного дискриминатора Фишера и информации о Фишере. Его статья О распределении, приводящем к функциям ошибок нескольких известных статистических данных (1924) chi-брусковый тест представленного Пирсона и t Уильяма Госсета в той же самой структуре как Гауссовское распределение и его собственный параметр в z-распределении Фишера дисперсионного анализа (несколько более обычно используемые десятилетия спустя в форме распределения F). Эти вклады сделали его ключевой фигурой в статистике 20-го века. Он был знаменитым противником статистики Bayesian и был даже первым, чтобы использовать термин «Bayesian».

Его работа над теорией популяционной генетики также сделала его, одна из трех великих фигур той области, вместе со Сьюолом Райтом и Дж. Б. С. Холденом, и как таковой была одним из основателей неодарвинистского современного эволюционного синтеза. В дополнение к основанию современной количественной генетики с его газетой 1918 года он был первым, чтобы использовать уравнения распространения, чтобы попытаться вычислить распределение частот аллелей среди населения. Он вел оценку генетической связи и частот аллелей максимальными методами вероятности, и написал ранние работы на волне прогресса выгодных генов и на градиентах признаков частоты аллели. Его газета 1950 года на градиентах признаков частоты аллели известна как первое применение компьютера, EDSAC, к биологии.

Его инновационная книга Генетическая Теория Естественного отбора была начата в 1928 и издана в 1930. Он развил идеи о половом отборе, мимикрии и развитии господства. Он классно показал, что вероятность мутации, увеличивающей фитнес организма, уменьшается пропорционально с величиной мутации. Он также доказал, что более многочисленное население несет больше изменения так, чтобы у них был больший шанс выживания. Именно в этой книге он сформулировал фонды того, что должно было стать известным как популяционная генетика. Книга была рассмотрена, среди других, физиком Чарльзом Гэлтоном Дарвином, внуком Чарльза Дарвина, и после публикации его обзора, К. Г. Дарвин послал Фишеру свою копию книги с заметками на полях. Примечания на полях стали едой для корреспонденции, управляющей по крайней мере тремя годами. Книга Фишера также имела главное влияние на эволюционного биолога В. Д. Гамильтон и развитие его более поздних теорий на генетической основе для существования семейного отбора.

У

рыбака было долгое и успешное сотрудничество с Э. Б. Фордом в области экологической генетики. Результатом этой работы было общее признание, что сила естественного отбора была часто намного более сильной, чем ценилось прежде, и что много ecogenetic ситуаций (таких как полиморфизм) не были выборочно нейтральны, но сохранялись силой выбора. Рыбак был оригинальным автором идеи преимущества heterozygote, которое, как позже находили, играло частую роль в генетическом полиморфизме. Открытие бесспорных случаев естественного отбора в природе было одним из главных берегов в современном эволюционном синтезе.

Его более поздние годы

Рыбак получил признание своих пэров в 1929, когда он был введен в должность в Королевское общество. Его известность выросла, и он начал путешествовать больше и читать лекции к более широким кругам. В 1931 он провел шесть недель в Статистической Лаборатории в Государственном колледже Айовы в Эймсе, Айова. Он дал три лекции в неделю на его работе, и он встретил многих активных американских статистиков, включая Джорджа В. Снедекора. Он возвратился в штат Айова снова для другого посещения в 1936.

В 1933 он покинул Rothamsted, чтобы стать профессором Евгеники в Университетском колледже Лондона. В 1937 он посетил индийский Статистический Институт в Калькутте, которая в это время состояла из одного частично занятого сотрудника, П. К. Мэхаланобиса. Он посещал там часто в более поздних годах, поощряя его развитие. Он был почетным гостем на его 25-й годовщине в 1957, когда это выросло до 2 000 сотрудников.

В 1939, когда Вторая мировая война вспыхнула для Британской империи, университет попытался распустить отдел евгеники, и это приказало всех уничтоженных животных. Фишер сопротивлялся, но тогда он был послан назад Rothamsted с очень уменьшенным штатом и ресурсами. Он был неспособен найти любую действительно подходящую военную работу, и хотя он сохранял очень занятым различными маленькими проектами, он стал обескураженным любого реального прогресса. Его брак распался. Его старший сын Джордж, летчик, был убит в бою.

В 1943 Рыбаку предложили Председателя Бэлфура Генетики в Кембриджском университете, его alma mater. Во время войны был почти разрушен этот отдел, но университет обещал ему, что он будет обвинен в восстановлении его после войны. Рыбак принял это предложение, но обещания были в основном не выполнены, и отдел рос очень медленно. Заметное исключение было вербовкой в 1948 итальянского исследователя Кавалли-Сфорцы, который установил индивидуальную единицу бактериальной генетики. Он продолжал свою работу над отображением хромосомы мыши — размножением мышей в лабораториях в его собственном доме — и другими проектами. Они достигли высшей точки в публикации в 1949 Теории Межродственного скрещивания. В 1947 Рыбак соучредил журнал Heredity: Международный журнал Генетики с Сирилом Дарлингтоном.

Он выступил против Заявления ЮНЕСКО Гонки. Он полагал, что доказательства и повседневный опыт показали, что человеческие группы отличаются глубоко «по их врожденной способности для интеллектуального и эмоционального развития» и пришли к заключению, что «практическая международная проблема — проблема обучения разделить ресурсы этой планеты дружески с людьми существенно различной природы», и что «эта проблема затеняется полностью полными благих намерений усилиями минимизировать реальные различия, которые существуют». Пересмотренное заявление, названное «» (1951), сопровождалось отколовшимся комментарием Фишера.

Рыбак в конечном счете получил много премий за свою работу, и он был назван Бакалавр Рыцаря Королевой Елизаветой II в 1952. Он был также награжден линнеевским Обществом престижного Дарвина-Уоллеса Медэла Лондона в 1958.

Неисправимый курильщик трубки, Фишер был настроен против заключений Ричарда Долла и Остина Б. Хилла, то курение вызывает рак легких. Он сравнил корреляции в их газетах к корреляции между импортом яблок и повышением развода, чтобы показать, что корреляция не подразумевает причинную обусловленность. Цитировать его биографов Йетса и Мазера, «Было предложено, чтобы факт, что Фишер был нанят как консультант табачными компаниями в этом противоречии, подверг сомнению ценность его аргументов. Это должно недооценить человека. Он не был выше принятия финансового вознаграждения за его труды, но причиной его интереса была, несомненно, его неприязнь и недоверие к пуританским тенденциям всех видов; и возможно также личное утешение он всегда находил в табаке».

После ухода в отставку с Кембриджского университета в 1957, эмигрировал Фишер, и он провел некоторое время как старший научный сотрудник в австралийском CSIRO в Аделаиде, Южная Австралия. Он умер в Аделаиде в 1962. Его остается, были преданы земле в англиканском Соборе Св. Петра, Норт-Аделаида

Индивидуальность и верования

Рыбак был известен своей лояльностью его друзьям. Как только он сформировал благоприятное мнение любого человека, он был лоялен к ошибке. Похожее ощущение лояльности связало его с его культурой. Он был патриотом, членом Англиканской церкви, политически консервативной, и научный рационалист. Очень искавший как блестящий собеседник и компаньон ужина, он очень вначале развил репутацию небрежности в его платье и, иногда, его манерах. В более поздних годах он был образцом рассеянного преподавателя.

Он знал священные писания хорошо, и Х. Аллен Орр описывает его в Boston Review как «очень набожный англиканец кто, между основанием современной статистики и популяционной генетикой, сочиненными статьями для церковных журналов». Но он не был догматичен в своих религиозных верованиях. В трансляции 1955 года на Науке и христианстве, он сказал:

Рыбак был горячим покровителем евгеники, которая также стимулировала и вела большую часть его работы в генетике людей. Последняя треть его книги Генетическая Теория коснулась применений этих идей людям и представила доступные данные в то время. Он представил теорию, которая приписала снижение и падение цивилизаций к его прибытию в государство, где изобилие высших сословий захлопнуто. Используя данные о переписи 1911 для Великобритании, он показал, что была обратная связь между изобилием и социальным классом. Это было частично должно, он верил к повышению социального положения семей, которые не были способны к производству многих детей, но кто поднялся из-за финансового преимущества наличия небольшого количества детей. Поэтому он предложил отмену экономического преимущества малочисленных семей, установив субсидии (он назвал их пособиями) семьям с большим числом детей, с пособиями, пропорциональными доходу отца. У него самого было два сына и шесть дочерей. Согласно Йетсу и Мазеру, «Его большая семья, в частности воздвигнутый в условиях большой финансовой строгости, была самовыражением его генетических и эволюционных убеждений».

Между 1929 и 1934 Общество Евгеники также провело кампанию трудно за закон, разрешающий стерилизацию на евгенических основаниях. Они полагали, что это должно быть полностью добровольно, и право, не наказание. Они издали проект предложенного законопроекта, и это было представлено Парламенту. Хотя это было побеждено 2:1 отношение, это рассматривалось как прогресс, и кампания продолжалась. Фишер играл главную роль в этом движении и служил в нескольких официальных комитетах, чтобы продвинуть его. В 1934 Фишер двинулся, чтобы увеличить власть ученых в пределах Общества Евгеники, но в конечном счете мешался участниками с точкой зрения защитника окружающей среды, и он, наряду со многими другими учеными, ушел в отставку.

См. также

  • Дисперсионный анализ
,
  • Точный тест рыбака
  • Линейный дискриминант рыбака
  • Геометрическая модель рыбака
  • Неравенство рыбака
  • Перестановка рыбака проверяет
  • Теория рыбака развития соотношения полов
  • Z-распределение рыбака
  • Распределение рыбака-Bingham
  • Распределение рыбака-Tippett
  • Перетасовка рыбака-Yates
  • Проблема Behrens-рыбака
  • Обратная вероятность
  • Лекторство Р. А. Фишера
  • распределение фон Мизес-Фишера

Примечания

  • Коробка, Джоан Фишер (1978) Р. А. Фишер: жизнь ученого, Нью-Йорк: Вайли, ISBN 0-471-09300-9.
  • Уильям Х. Краскэл: «Значение Фишера: обзор Р. А. Фишера. Жизнь Ученого, Джоан Фишер Бокс», Журнал американской Статистической Ассоциации, 75 (1980), 1019–1030.
  • Дэвид Хоуи, «интерпретируя вероятность: споры и события в начале двадцатого века» (издательство Кембриджского университета, 2002)
  • Залсбург, Дэвид (2002) чай дегустации леди: как статистика коренным образом измененная наука в двадцатом веке, ISBN 0-8050-7134-2

Библиография

Выбор от 395 статей Фишера

Они доступны на университете веб-сайта Аделаиды:

  • «Плотность распределения ценностей коэффициента корреляции в образцах от неопределенно значительной части населения». Biometrika, 10: 507–521. (1915)
  • «Корреляция между родственниками на гипотезе Менделевского наследования» Сделка Рой. Soc. Edinb., 52: 399–433. (1918). Именно в этой газете различие слова было сначала введено в теорию вероятности и статистику.
  • «На математических фондах теоретической статистики» Философские Сделки Королевского общества, A, 222: 309–368. (1922)
  • «На отношении господства». Proc. Рой. Soc. Edinb., 42: 321–341. (1922)
  • «На распределении, приводящем к функциям ошибок нескольких известных статистических данных» Proc. Международный Конгресс. Математика., Торонто, 2: 805–813. (1924)
  • «Теория статистической оценки» Слушания Кембриджа Философское Общество, 22: 700–725 (1925)
  • «Применения распределения Студента» Metron, 5: 90–104 (1925)
  • «Расположение полевых экспериментов» Дж. Мин. Agric. G. Бром., 33: 503–513. (1926)
  • «Общее распределение выборки многократного коэффициента корреляции» Слушания Королевского общества, A, 121: 654–673 (1928)
  • «Два новых свойства математической вероятности» Слушания Королевского общества, A, 144: 285–307 (1934)

Книги рыбака

Полные детали публикации доступны на университете веб-сайта Аделаиды:

  • Статистические методы для научных работников (1925) ISBN 0-05-002170-2.
  • Генетическая теория естественного отбора (1930) ISBN 0-19-850440-3.
  • Дизайн экспериментов (1935) ISBN 0-02-844690-9
  • Использование многократных измерений в таксономических проблемахЛетописи Евгеники 7/1936)
  • Статистические таблицы для биологического, сельскохозяйственного и медицинского исследования (1938, coauthor:Frank Йетс)
  • Теория межродственного скрещивания (1949) ISBN 0-12-257550-4, ISBN 0-05-000873-0
  • Вклады в математическую статистику, Джона Вайли, (1950)
  • Статистические методы и научный вывод (1956) ISBN 0-02-844740-9
  • Собранные бумаги Р.А. Фишера (1971–1974). Пять объемов. Университет Аделаиды.

Биографии рыбака

  • Коробка, Джоан Фишер (1978) Р. А. Фишер: жизнь ученого, Нью-Йорк: Вайли, ISBN 0-471-09300-9. Предисловие

Вторичная литература

  • Эдвардс, A.W.F., 2005, «Статистические методы для научных работников» в Grattan-Guinness, мне., редактор, Знаменательные Письма в Западной Математике. Elsevier: 856–70.

Внешние ссылки

  • Справочник по Р. А. Фишеру Джоном Олдричем
  • Самое раннее Известное Использование Некоторых Слов Математики для вклада Рыбака в язык статистики
  • Университет Библиотеки Аделаиды для библиографии, биографии, 2 объемов корреспонденции и многих статей
  • Классика в Истории Психологии для первого выпуска Статистических Методов для Научных работников
  • Взимание цитат Фишера, собранных А. В. Ф. Эдвардсом

ru.knowledgr.com

Документация — Медицинская статистика

Электронная таблица

  1. Критерий Фишера 2xN таблицы сопряженности
  • Приближенный критерий хи-квадрат
  • Кластеризация факторов равного риска
  • Точный тест Харди-Вайнберга для множественных аллелей
  • Точный тест взаимодействия генов
  • 1.1 Точный критерий Фишера 2xN

    Покажем, что для малых выборок необходимо использовать точные методы. Запустим электронную таблицу. Откроем файл test.sp. Выберем меню Analyse —> Fisher Test, см. рис.1.1:

    Рис.1.1 Меню анализа электронной таблицы

    Выделим мышью прямоугольную область ячеек B2:D3 и нажмем кнопку ОК, см.рис.1.2:

    Рис.1.2 Выделение прямоугольной области 2х3 ячеек

    В нижнем окне появится результат выполнения точного критерия Фишера, см.рис.1.3:

    Рис.1.3 Вывод результата точного критерия Фишера.

    Из рис.1.3 видно, то результат точного критерия Фишера p-value=0.06363 , что почти в три раза больше, чем для приближенного критерия хи-квадрат p-value=0.023. Это означает, что на уровне значимости 0.05 по методу хи-квадрат выборки контроль и больные отличаются по возрастному составу, а в соответствии с точным методом Фишера — нет.
    Алгоритм взят из [1,2].

    1.2 Приближенный критерий Фишера 2xN

    Для практики абсолютная точность вычисления значимости не нужна, достаточно лишь нескольких знаков после запятой. Ограничение точности позволяет значительно ускорить получение результата и проводить вычисления для больших таблиц. Откроем файл fisher18.sp. Выберем меню Analyse —> Fisher 2xN Test…, выделим ячейки с числами, в поле Accuracy введем желаемую точность — число 2, см. рис.1.4:

    Рис.1.4 Задание точности — 2 цифры после запятой.

    и нажмем кнопку ОК. Результат появится через несколько секунд, см.рис.1.5:

    Рис.1.5 Результат приближенного Фишера с двумя знаками после запятой.

    Точные вычисления для таблицы рис.1.5 дают p-value=0.051572 см.[1]. Из рис.1.5 видно, что первые 2 цифры после запятой совпадают.
    Литература
    1. Requena F., Ciudad N., 2005. A major improvement to the Network Algorithm for Fisher’s Exact Test in 2xc contingency tables.
    2. Requena F., Ciudad N., 2003. The Maximum Probability 2xc Contingency Tables and the Maximum Probability Points of the Multivariate Hypergeometric Distribution.

    [К оглавлению]

    2.Приближенный критерий хи-квадрат

    Покажем, какие кнопки нажимать, чтобы посчитать хи-квадрат. Откроем файл cluster_test.sp. Выберем меню Analyse —> Chi-squared test. Выделяем в таблице прямоугольную область с числами и нажимаем кнопку ОК. Для таблиц размерности 2х2 рекомендуется включить поправку Йейтса (Yates correction) на непрерывность, см.рис 2.1

    Рис.2.1 Вычисление хи-квадрат.

    Из рис.1.4 видно, что p-valueЛитература
    • Saul A. Teukolsky, 2002. Numerical recipes in C. The Art of Scientific Computing. Second edition.

    [К оглавлению]

    3. Кластеризация факторов равного риска

    Покажем, какие кнопки нажимать, чтобы сгруппировать факторы в 2-х выборках по степени риска. Откроем файл cluster_test.sp. С помощью критерия хи-квадрат, а еще лучше Фишера, убеждаемся, что строки и/или столбцы таблицы зависимы на желаемом уровне значимости, см.рис.2.1. Выберем меню Analyse —> Risk cluster… Выделяем прямоугольную 2хN область с числами. Сверху от чисел должны находиться произвольные имена факторов, слева — имена выборок и нажимаем кнопку ОК, см. рис.3.1а.

    Рис.3.1а Горизонтальная таблица с названиями факторов и выборок.

    или рис.3.1б, где сверху — имена выборок, слева — имена факторов:

    Рис.3.1б Вертикальная таблица с названиями факторов и выборок.

    Результат в виде отдельной таблицы появится снизу в окне Results, см.рис.3.2

    Рис.3.2 Результат кластеризации в виде 2-х таблиц.

    На рис.3.2 показан результат кластеризации факторов по степени риска. В верхней таблице Equal risk clusters в первой строке показана значимость P-value полученного набора кластеров. Во второй строке — количество кластеров. В последующих строках с именами факторов показана принадлежность факторов определенным кластерам, отсортированная по убыванию риска попадания в выборку «Больные». Первые два фактора входят в кластер 1, третий фактор — в кластер 2. Делаем вывод: на уровне значимости 0.045 (см.рис.2.1) выделены два кластера, различающиеся уровнем риска.

    В нижней таблице Odds and Frequencies Ratio показаны отношения шансов и частот для кластеров. В первом столбце показан номер кластера. Во втором и третьем — численности пациентов в выборке «Контроль» и «Больные» для кластера. В четвертом столбце Frequencies ratio — отношение частот численностей выборок «Больные» к «Контроль» 23/14=1,64. Видно, что отношение частот для первого кластера больше 1, следовательно этот кластер «рискованный». Для второго кластера отношение частот 6/15=0,4 Odds ratio показано отношение шансов данного кластера к следующему. Для редких болезней оно показывает во сколько раз возрастает риск попасть в группу «Больные» под воздействием факторов данного кластера, по отношению к следующему кластеру. Из рис.3.2 видно, что вероятность заболеть для лиц, принадлежащих кластеру 1 в 4,10714 раза больше, чем принадлежащих кластеру 2. Ячейка отношения шансов для кластера 2 оставлена пустой, т.к. следующего после него кластера 3 не существует. В случае нулевых знаменателей при вычислении отношения частот и шансов нули заменяются на 1/2 и соответствующие величины выводятся в скобках.

    Литература

    [К оглавлению]

    4. Точный тест Харди-Вайнберга для множественных аллелей

    Покажем, какие кнопки нажимать, чтобы проверить генотипы выборки на равновесие Харди-Вайнберга. Откроем файл hardy_weinberg.sp. В первой строке показано количество генотипов: n11=0, n12=3, n13=5, n14=3. Вторая строка: n22=1, n23=18, n24=7 и т.д. Ячейки ниже главной диагонали nij для iпустыми из-за симметрии матрицы генотипов. Выберем меню Analyse —> Exact Hardy-Weinberg… Выделяем 4х4 область ячеек с числами и нажимаем кнопку ОК, см. рис.4.1.

    Рис.4.1 Выделенная область генотипов и результат теста.

    Из рис.4.1 видно, что P_VALUE=0.0174423[1].
    Литература
    1. Satoshi Aoki, 2003, Network algorithm for the exact test of Hardy-Weinberg proportion for multiple alleles

    4. Точный тест на равенство взаимодействия генов

    Покажем, какие кнопки нажимать, чтобы проверить отсутствие взаимодействия между двумя генами с произвольным количеством аллелей. Частоты аллелей в сравниваемых популяциях должны быть одинаковыми. Пусть ген A имеет 3, а ген B — 2 аллеля. Откроем файл interaction3x2.sp. В первой строке показаны названия аллелей гена А, в первом столбце — гена В, которые повторяются по вертикали два раза. Это означает, что вверху расположена первая выборка гаплотипов, внизу — вторая. Выберем меню Analyse —> Gene interaction…Выделяем прямоугольную область ячеек двух выборок с числами, см. рис.5.1.

    Рис.5.1 Выделенная область гаплотипов двух выборок.

    и нажимаем кнопку ОК. В нижнем окне появится результат расчета, см.рис.5.2.

    Рис.5.2 Результат теста взаимодействия двух генов.

    Уровень значимости теста P-VALUE=0,03, поэтому делаем вывод: на уровне значимости 0,03 гипотеза о равенстве взаимодействия генов А и В отклоняется. Это означает, что некоторые условные вероятности в популяциях отличаются.
    Литература

    doctorstat.narod.ru

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *