Онлайн калькулятор хи квадрат: Анализ четырехпольных таблиц (хи-квадрат)

Тест хи-квадрат (X2)

Иллюстрированный самоучитель по SPSS > Таблицы сопряженности > Тест хи-квадрат (X2)


Статистические критерии для таблиц сопряженности — Тест хи-квадрат

Чтобы получить статистические критерии для таблиц сопряженности, щелкните на кнопке Statistics… (Статистика) в диалоговом окне Crosstabs. Откроется диалоговое окно Crosstabs: Statistics (Таблицы сопряженности: Статистика) (см. рис. 11.9).

Рис. 11.9: Диалоговое окно Crosstabs: Statistics

Флажки в этом диалоговом окне позволяют выбрать один или несколько критериев.

  • Тест хи-квадрат (X2)

  • Корреляции

  • Меры связанности для переменных, относящихся к номинальной шкале

  • Меры связанности для переменных, относящихся к порядковой шкале

  • Меры связанности для переменных, относящихся к интервальной шкале

  • Коэффициент каппа (к)

  • Мера риска

  • Тест Мак-Немара

  • Статистики Кохрана и Мантеля-Хэнзеля

Эти критерии рассматриваются в двух последующих разделах, причем из-за того, что критерий хи-квадрат имеет большое значение в статистических вычислениях, ему посвящен отдельный раздел.

Тест хи-квадрат (X2)

При проведении теста хи-квадрат проверяется взаимная независимость двух переменных таблицы сопряженности и благодаря этому косвенно выясняется зависимость обоих переменных. Две переменные считаются взаимно независимыми, если наблюдаемые частоты (fо) в ячейках совпадают с ожидаемыми частотами (fe).

Для того, чтобы провести тест хи-квадрат с помощью SPSS, выполните следующие действия:

  • Выберите в меню команды Analyze (Анализ) ► Descriptive Statistics (Дескриптивные статистики) ► Crosstabs… (Таблицы сопряженности)

  • Кнопкой Reset (Сброс) удалите возможные настройки.

  • Перенесите переменную sex в список строк, а переменную psyche — в список столбцов.

  • Щелкните на кнопке Cells… (Ячейки). В диалоговом окне установите, кроме предлагаемого по умолчанию флажка Observed, еще флажки Expected и Standardized. Подтвердите выбор кнопкой Continue.

  • Щелкните на кнопке Statistics… (Статистика). Откроется описанное выше диалоговое окно Crosstabs: Statistics.

  • Установите флажок Chi-square (Хи-квадрат). Щелкните на кнопке Continue, а в главном диалоговом окне — на ОК.

Вы получите следующую таблицу сопряженности.

Пол * Психическое состояние Таблица сопряженности

Психическое состояниеTotal
Крайне неустойчивоеНеустойчивоеУстойчивоеОчень устойчивое
ПолЖенскийCount16189144
Expected Count7,916,617,02,544,0
Std. Residual2,9,3-1,9-.9
МужскойCount32232
5
62
Expected Count11,123,424,03,562,0
Std. Residual-2,4-,31,6,8
TotalCount194041 6106
Expected Count19,040,041,06,0106,0

Кроме того, в окне просмотра будут показаны результаты теста хи-квадрат:

Chi-Square Tests (Тесты хи-квадрат)

Value (Значение)dfAsymp. Sig. (2-sided)
(Асимптотическая значимость (двусторонняя))
Pearson Chi-Square
(Хи-квадрат по Пирсону)
22,455 (а)3,000
Likelihood Ratio
(Отношение правдоподобия)
23,6883,000
Linear-by-Linear Association
(Зависимость линейный-линейный)
20,3911,000
N of Valid Cases
(Кол-во допустимых случаев)
106

а.

2 cells (25,0%) have expected count less than 5. The minimum expected count is 2,49 (2 ячейки (25%) имеют ожидаемую частоту менее 5. Минимальная ожидаемая частота 2,49.)

Для вычисления критерия хи-квадрат применяются три различных подхода:

  • формула Пирсона;
  • поправка на правдоподобие;
  • тест Мантеля-Хэнзеля.
  • Если таблица сопряженности имеет четыре поля (таблица 2 x 2) и ожидаемая вероятность менее 5, дополнительно выполняется точный тест Фишера.

Критерий хи-квадрат по Пирсону

Обычно для вычисления критерия хи-квадрат используется формула Пирсона:

Здесь вычисляется сумма квадратов стандартизованных остатков по всем полям таблицы сопряженности. Поэтому поля с более высоким стандартизованным остатком вносят более весомый вклад в численное значение критерия хи-квадрат и, следовательно, — в значимый результат. Согласно правилу, приведенному в разделе 8.9, стандартизованный остаток 2 (1,96) или более указывает на значимое расхождение между наблюдаемой и ожидаемой частотами в той или ячейке таблицы.

В рассматриваемом примере формула Пирсона дает максимально значимую величину критерия хи-квадрат (р<0,0001). Если рассмотреть стандартизованные остатки в отдельных полях таблицы сопряженности, то на основе вышеприведенного правила можно сделать вывод, что эта значимость в основном определяется полями, в которых переменная psyche имеет значение «крайне неустойчивое». У женщин это значение сильно повышено, а у мужчин — понижено.

Корректность проведения теста хи-квадрат определяется двумя условиями:

  • ожидаемые частоты < 5 должны встречаться не более чем в 20% полей таблицы;
  • суммы по строкам и столбцам всегда должны быть больше нуля.

Однако в рассматриваемом примере это условие выполняется не полностью. Как указывает примечание после таблицы теста хи-квадрат, 25% полей имеют ожидаемую частоту менее 5. Однако, так как допустимый предел в 20% превышен лишь ненамного и эти поля, вследствие своего очень малого стандартизованного остатка, вносят весьма незначительную долю в величину критерия хи-квадрат, это нарушение можно считать несущественным.

Критерий хи-квадрат с поправкой на правдоподобие

Альтернативой формуле Пирсона для вычисления критерия хи-квадрат является поправка на правдоподобие:

При большом объеме выборки формула Пирсона и подправленная формула дают очень близкие результаты. В нашем примере критерий хи-квадрат с поправкой на правдоподобие составляет 23,688.

Тест Мантеля-Хэнзеля

Дополнительно в таблице сопряженности под обозначением linear-by-linear («линейный-по-линейному») выводится значение теста Мантеля-Хэнзеля (20,391). Эта форма критерия хи-квадрат с поправкой Мантеля-Хэнзеля — еще одна мера линейной зависимости между строками и столбцами таблицы сопряженности. Она определяется как произведение коэффициента корреляции Пирсона на количество наблюдений, уменьшенное на единицу:

Полученный таким образом критерий имеет одну степень свободы. Метод Мантеля-Хэнзеля используется всегда, когда в диалоговом окне Crosstabs: Statistics установлен флажок Chi-square. Однако для данных, относящихся к номинальной шкале, этот критерий неприменим.


Эффект от рассылок: Как правильно оценивать улучшение

Хороший маркетинг — это доказательный маркетинг.

Но если не соблюсти несколько правил, то все насмарку: вроде бы результаты тестов положительные, конверсия растет, а выручка — нет.

Три главных правила оценки эффекта от рассылок:

  1. Разница в результатах должна быть значима
  2. Один тест — одна гипотеза
  3. Инвестиции в улучшения должны окупаться

1. Разница значима?

Всегда, всегда, всегда нужно помнить про статистику. Разница в результатах может быть как закономерностью, так и случайностью.

Например, на кассе вы опросили 10 покупателей, меняли ли они номер мобильного телефона за последнее время. Выяснилось, что 1 человек не пользуется телефоном вообще. Сделаете ли вы вывод, что 10% ваших покупателей не пользуются телефоном? Вряд ли. Вы скажете, что это какая-то случайность. Такие люди, наверное, есть, но их точно меньше 10%. Но если вы опросили 1000 человек и 100 человек сказали, что отказались от использования мобильного телефона? Вы были бы безумно удивлены, но отмахнуться от 10% стало бы тяжелее.

Чтобы понять, когда и насколько можно доверять данным, есть разработанные методологии и готовые инструменты. Например русскоязычный калькулятор Mindbox (подробная инструкция на странице калькулятора).

Как применять это на практике?

Предположим, вы провели тест: одной группе клиентов отправили письмо с простой картинкой, а другой группе — с анимированной. Получилось, что в одном варианте конверсия 14%, а в другом — 17%. Казалось бы — ура, рост конверсии на 21,5%! Но достаточно ли наблюдений (писем или показов страницы сайта)?

Берем цифры и подставляем в калькулятор (нижний слайдер ставьте на 95%):

Для того, чтобы правильно спланировать этот тест еще до его проведения, можно рассчитать, сколько минимум нужно отправленных писем каждого варианта, чтобы сразу получить достоверную оценку результатов.

Для нашего примера калькулятор показывает, что только если в каждом варианте более 3 000 писем, можно сказать, что вариант с конверсией 17% успешнее, чем вариант с конверсией в 14%.

  • Если нужно определить, какого объема должна быть выборка в каждом варианте (сколько писем, сколько показов странички сайта), вам нужно подставить две цифры в эту форму. Первая цифра — какая конверсия была до изменений или ожидается в одном из вариантов. Вторая цифры — минимум на сколько  вы хотите эту конверсию увеличить.
  • Если нужно понять, можно ли верить разнице конверсии в двух вариантах, нужно подставить абсолютные значения в следующую форму.
  • Если надо определить, различаются ли средние чеки в двух вариантах, нужно подставить столбцы со значениями в третью форму

Если тест проводили не вы, а вам предоставляют отчет, убедитесь, что была проведена проверка на значимость или запросите данные и самостоятельно проверьте их на калькуляторе. Если хотите почитать об этом всем побольше, то вот ключевые слова: доверительный интервал, 95% доверительная вероятность, уровень значимости 5%, ХИ-квадрат, T-тест, t-критерий Стьюдента.

Если возник спорный случай или не получается разобраться, пишите нам на [email protected], мы постараемся помочь.

2. Тест точно проверяет нужную гипотезу?

Как построить эксперимент так, чтобы измерить именно то, что хочется измерить?Кажется, что все просто? Давайте разберем на примере.

Есть гипотеза: товарные рекомендации в письме увеличивают выручку.

Кажется, что АБ-тест должен быть такой: первый вариант письма — без рекомендаций, второй — с рекомендациями.

Но это не так. Давайте разберемся:

Когда мы говорим, что хотим измерить эффективность рекомендаций, мы имеем в виду измерение специального способа (алгоритма) подбора товаров. Считается, что именно качественный подбор растит конверсию.  Но что мы делаем, когда добавляем  рекомендации? На самом деле мы делаем две вещи:

  1. добавляем блок товаров в письмо
  2. выбираем с помощью рекомендательного алгоритма правильные товары в этот блок

Получается, что мы нарушили правило «один тест — одна гипотеза», и проверяем сразу два изменения.

В результате мы не сможем понять, что же именно изменило конверсию: само по себе наличие дополнительного блока с товарами или алгоритм их подбора?

Что делать?

Применить правило «один тест — одна гипотеза» и  добавить еще один вариант: письмо с блоком товаров, подобранных случайным образом.

Сравнивая конверсии попарно, можно определить, какой вклад делает каждая составляющая.

Сколько надо писем, чтобы такая разница была значима? Немало. В первой паре 15% и 17% будут достоверно различны, если  в каждом варианте будет больше 5 000 писем. Для второй же пары в 17% и 18% нужно уже больше 22 000 писем в каждом варианте.

3. Окупаются ли инвестиции?

Хорошо, допустим, мы грамотно провели тест и проверка на значимость показала, что конверсия или средний чек увеличились. Это хорошо и должно привести к увеличению выручки.

Теперь давайте разберемся, сколько нам стоил этот рост выручки, и окупились ли улучшения. В случае товарных рекомендаций, например — это затраты на разработку (или покупку) алгоритма + затраты на его обновление и поддержку.

Если эффект от рассылок дает прирост на 1%, т.е. 1 дополнительный заказ на 100 «обычных», хватает ли этого, чтобы окупить затраты?

Итог

  1. Проверяйте результаты на статистическую значимость
  2. Разбирайте тест на элементарные составляющие, 1 тест — 1 гипотеза
  3. Грамотно считайте деньги

Если вы делаете много тестов, выбираете выигрышные варианты, но в итоге у вас не растет выручка — это признак, что что-то вы делаете не так. АБ-тесты должны работать на ваш бизнес.

Критерий независимости хи-квадрат — MathCracker.com

Решатели Статистика


Инструкции: Этот калькулятор проводит тест независимости хи-квадрат. Пожалуйста, сначала укажите количество столбцов и строк для перекрестной таблицы. Затем введите данные таблицы, уровень значимости и, при желании, имена строк и столбцов, и результаты теста Хи-квадрат будут представлены вам ниже:

номер Строки = номер столбцы =


Хи-квадрат независимости — это тест, используемый для категориальных переменных для оценки степени связи между двумя переменными. Иногда критерий независимости хи-квадрат называют критерием хи-квадрат однородности дисперсий, но они математически эквивалентны. Идея теста состоит в том, чтобы сравнить информацию о выборке (данные наблюдений) со значениями, которые можно было бы ожидать, если бы две переменные действительно были независимыми. Основные свойства критерия независимости Хи-квадрат:

  • Распределение тестовой статистики представляет собой распределение хи-квадрат с \((r-1)\times(c-1)\) степенями свободы, где r — количество строк, а c — количество столбцов.

  • Распределение хи-квадрат является одним из наиболее важных распределений в статистике, наряду с нормальным распределением и F-распределением. 92 }{E_{ij} }\]

    Одним из наиболее распространенных применений этого теста является оценка того, являются ли две категориальные переменные значимо связанными или нет.

    Обычно тест Хи-квадрат на независимость называют 2-сторонняя перекрестная таблица тест. Если у вас есть односторонняя перекрестная таблица, вы должны использовать Хи-квадрат тест на соответствие .

    Что делать, если у вас есть парные данные?

    Если у вас есть парные данные, вместо использования калькулятора хи-квадрат вам следует использовать это Калькулятор теста Макнемара .


    Базовый пакет статистики Тест хи-квадрат Хи-квадрат статистика Хи-квадрат тест независимости Проверка гипотезы Статистический тест Решатель статистики

    37: тест хи-квадрат для калькулятора независимости

    1. Последнее обновление
    2. Сохранить как PDF
  • Идентификатор страницы
    8625
    • Ларри Грин
    • 9{2}\) тестовая статистика и p-значение будут рассчитаны для вас.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *