Манна уитни нулевая гипотеза. Автоматический расчет U-критерия Манна-Уитни

По уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.

Другие названия: критерий Манна - Уитни - Уилкоксона (англ. Mann - Whitney - Wilcoxon, MWW ), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test ) или критерий Уилкоксона - Манна - Уитни (англ. Wilcoxon - Mann - Whitney test ).

История

Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном (F. Wilcoxon ). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann ) и Д. Р. Уитни (D. R. Whitney ), по именам которых сегодня обычно и называется.

Описание критерия

Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума .

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.

Ограничения применимости критерия

  1. В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
  2. В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало.

Использование критерия

Для применения U-критерия Манна - Уитни нужно произвести следующие операции.

Автоматический расчет U-критерия Манна - Уитни

Таблица критических значений

См. также

  • Критерий Краскела - Уоллиса - многомерное обобщение U-критерия Манна - Уитни.

Литература

  • Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947. - № 18. - P. 50-60.
  • Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. - 1945. - P. 80-83.
  • Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. - Л., 1973.
  • Сидоренко Е. В. Методы математической обработки в психологии. - С-Пб., 2002.

Wikimedia Foundation . 2010 .

Смотреть что такое "U-критерий Манна - Уитни" в других словарях:

    критерий Манна Уитни - — Тематики электросвязь, основные понятия EN Mann Whitney U test … Справочник технического переводчика

    U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    U критерий Манна Уитни (англ. Mann Whitney U test) статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять… … Википедия

    - (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми … Википедия

    Или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия

    Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому… … Википедия

    Критерий Кохрена используют при сравнении трёх и более выборок одинакового объёма. Расхождение между дисперсиями считается случайным при выбранном уровне значимости, если: где квантиль случайной величины при числе суммируемых… … Википедия

    - (максиминный критерий) один из критериев принятия решений в условиях неопределённости. Критерий крайнего пессимизма. История Критерий Вальда был предложен Абрахамом Вальдом в 1955 году для выборок равного объема, а затем распространен на … Википедия

Настоящий статистический метод был предложен Фрэнком Вилкоксоном (см. фото) в 1945 году. Однако в 1947 году метод был улучшен и расширен Х. Б. Манном и Д. Р. Уитни, посему U-критерий чаще называют их именами.

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 ,n 2 ≥3 или n 1 =2, n 2 ≥5, и является более мощным, чем критерий Розенбаума.

Описание U-критерия Манна-Уитни

Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам (Гублер Е. В., 1978; Рунион Р., 1982; Захаров В. П., 1985; McCall R., 1970; Krauth J., 1988).

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок (Welkowitz J. et al., 1982).

Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы U - критерия Манна-Уитни

H 0 : Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1 : Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения U-критерия Манна-Уитни

1. В каждой выборке должно быть не менее 3 наблюдений: n 1 ,n 2 ≥ З; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

2. В каждой выборке должно быть не более 60 наблюдений; n 1 , n 2 ≤ 60.

Автоматический расчет U-критерия Манна-Уитни

Шаг 1

Введите в первую колонку («Выборка 1») данные первой выборки, а во вторую колонку («Выборка 2») данные второй выборки. Данные вводятся по одному числу на строку; без пробелов, пропусков и т.д. Вводятся только цифры. Дробные числа вводятся со знаком «.» (точка). После заполнения колонок нажмите на кнопку «Шаг 2», чтобы произвести автоматический расчет U-критерия Манна-Уитни.

Критерий Манна-Уитни представляет непараметрическую альтернативу t -критерия для независимых выборок. Преимущество его состоит в том, что мы отказываемся от предположения нормальности распределения и одинаковых дисперсий. Необходимо, чтобы данные были измерены как минимум в порядковой шкале.

STATISTICA предполагает, что данные расположены тем же образом, что в и t -критерии для независимых выборок. Файл должен содержать кодовую (независимую) переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе.

Предположения и интерпретация. Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t -критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок ; фактически, в некоторых случаях он имеет даже большую мощность, чем t -критерий.

Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению (см. Siegel, 1956). Поэтому вместе с U статистикой будут показаны z значение (для нормального распределения и соответствующее p -значение.

Точные вероятности для малых выборок. Для выборок малого объема STATISTICA вычислит точную вероятность, связанную с соответствующей U статистикой. Эта вероятность основана на подсчете всех возможных значений U при заданном количестве наблюдений в двух выборках (см. Dinneen & Blakesley, 1973). Программа сообщит (в последнем столбце таблицы результатов) значение 2 * p, где p равно 1 минус кумулятивная (односторонняя) вероятность соответствующей U статистики. Заметим, что это обычно не приводит к большой недооценке статистической значимости соответствующих эффектов (см. Siegel, 1956).

Статистика критерия выглядит следующим образом.

где W - статистика Вилкоксона , предназначенная для проверки этой же гипотезы

в противном случае

Таким образом, статистика U считает общее число тех случаев, в которых элементы второй выборки превосходят элементы первой выборки. Если гипотеза верна, то

Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t -критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t -критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t -критерий.

Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению. Поэтому, вместе с U статистикой, будут показано z значение (для нормального распределения) и соответствующее p -значение.

Подробные инструкции по поводу того, как использовать критерий, вы можете найти дальше в части, касающейся примера применения.

Пример

Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни. Сравним результаты, полученные в примере Основные статистики и t-критерий Стьюдента для 2-го и 3-го столбцов таблицы по критерию Стьюдента, с результатами непараметрического сравнения.

Для расчета U-критерия Уилкоксона расположим варианты сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до n1 + n2. Первая строка представляет собой варианты первой выборки, вторая - второй выборки, третья - соответствующие ранги в обобщенном ряду:





















Надо обратить внимание, что если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно n1 + n2 (в нашем случае 20). Это правило используют для проверки правильности ранжирования.

Отдельно для каждой выборки рассчитываем суммы рангов их вариант R1 и R2. В нашем случае:

R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Для проверки правильности вычислений можно воспользоваться другим правилом: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашем случае R1 + R2 = 210.

Статистика U1 = 69 - 10*11/2 = 14; U2 = 141 - 10*11/2 = 86.

Для проверки одностороннего критерия выбираем минимальную статистику U1 = 14 и сравниваем ее с критическим значением для n1 = n2 = 10 и уровня значимости 1%, равным 19.

Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью параметрического критерия Cтьюдента, подтверждается с помощью данного непараметрического метода.

Материал из Википедии - свободной энциклопедии

U-критерий Манна - Уитни (англ. Mann - Whitney U-test ) - статистический критерий , используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.

Другие названия: критерий Манна - Уитни - Уилкоксона (англ. Mann - Whitney - Wilcoxon, MWW ), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test ) или критерий Уилкоксона - Манна - Уитни (англ. Wilcoxon - Mann - Whitney test ). Реже: критерий числа инверсий .

История

Данный метод выявления различий между выборками был предложен в 1945 году Фрэнком Уилкоксоном (F. Wilcoxon ). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann ) и Д. Р. Уитни (D. R. Whitney ), по именам которых сегодня обычно и называется.

Описание критерия

Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума .

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.

Ограничения применимости критерия

  1. В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
  2. В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало.

Использование критерия

Для применения U-критерия Манна - Уитни нужно произвести следующие операции.

  1. Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг. Общее количество рангов получится равным: N=n_1+n_2, где n_1 - количество элементов в первой выборке, а n_2 - количество элементов во второй выборке.
  2. Разделить единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно - на долю элементов второй выборки. Определить большую из двух ранговых сумм (T_x), соответствующую выборке с n_x элементами.
  3. Определить значение U-критерия Манна - Уитни по формуле: U=n_1\cdot n_2+\frac{n_x\cdot(n_x+1)}{2}-T_x.
  4. По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n_1 и n_2. Если полученное значение U меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U больше табличного, принимается нулевая гипотеза . Достоверность различий тем выше, чем меньше значение U.
  5. При справедливости нулевой гипотезы критерий имеет математическое ожидание M(U)=\frac{n_1\cdot n_2}{2} и дисперсию D(U)=\frac{n_1\cdot n_2\cdot (n_1+n_2+1)}{12} и при достаточно большом объёме выборочных данных (n_1>19,\;n_2>19) распределён практически нормально.

Таблица критических значений

См. также

  • Критерий Краскела - Уоллиса - многомерное обобщение U-критерия Манна - Уитни.

Напишите отзыв о статье "U-критерий Манна - Уитни"

Примечания

Литература

  • Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947. - № 18. - P. 50-60.
  • Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. - 1945. - P. 80-83.
  • Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. - Л., 1973.
  • Сидоренко Е. В. Методы математической обработки в психологии. - С-Пб., 2002.

Отрывок, характеризующий U-критерий Манна - Уитни

Он забылся на одну минуту, но в этот короткий промежуток забвения он видел во сне бесчисленное количество предметов: он видел свою мать и ее большую белую руку, видел худенькие плечи Сони, глаза и смех Наташи, и Денисова с его голосом и усами, и Телянина, и всю свою историю с Теляниным и Богданычем. Вся эта история была одно и то же, что этот солдат с резким голосом, и эта то вся история и этот то солдат так мучительно, неотступно держали, давили и все в одну сторону тянули его руку. Он пытался устраняться от них, но они не отпускали ни на волос, ни на секунду его плечо. Оно бы не болело, оно было бы здорово, ежели б они не тянули его; но нельзя было избавиться от них.
Он открыл глаза и поглядел вверх. Черный полог ночи на аршин висел над светом углей. В этом свете летали порошинки падавшего снега. Тушин не возвращался, лекарь не приходил. Он был один, только какой то солдатик сидел теперь голый по другую сторону огня и грел свое худое желтое тело.
«Никому не нужен я! – думал Ростов. – Некому ни помочь, ни пожалеть. А был же и я когда то дома, сильный, веселый, любимый». – Он вздохнул и со вздохом невольно застонал.
– Ай болит что? – спросил солдатик, встряхивая свою рубаху над огнем, и, не дожидаясь ответа, крякнув, прибавил: – Мало ли за день народу попортили – страсть!
Ростов не слушал солдата. Он смотрел на порхавшие над огнем снежинки и вспоминал русскую зиму с теплым, светлым домом, пушистою шубой, быстрыми санями, здоровым телом и со всею любовью и заботою семьи. «И зачем я пошел сюда!» думал он.
На другой день французы не возобновляли нападения, и остаток Багратионова отряда присоединился к армии Кутузова.

Князь Василий не обдумывал своих планов. Он еще менее думал сделать людям зло для того, чтобы приобрести выгоду. Он был только светский человек, успевший в свете и сделавший привычку из этого успеха. У него постоянно, смотря по обстоятельствам, по сближениям с людьми, составлялись различные планы и соображения, в которых он сам не отдавал себе хорошенько отчета, но которые составляли весь интерес его жизни. Не один и не два таких плана и соображения бывало у него в ходу, а десятки, из которых одни только начинали представляться ему, другие достигались, третьи уничтожались. Он не говорил себе, например: «Этот человек теперь в силе, я должен приобрести его доверие и дружбу и через него устроить себе выдачу единовременного пособия», или он не говорил себе: «Вот Пьер богат, я должен заманить его жениться на дочери и занять нужные мне 40 тысяч»; но человек в силе встречался ему, и в ту же минуту инстинкт подсказывал ему, что этот человек может быть полезен, и князь Василий сближался с ним и при первой возможности, без приготовления, по инстинкту, льстил, делался фамильярен, говорил о том, о чем нужно было.
Пьер был у него под рукою в Москве, и князь Василий устроил для него назначение в камер юнкеры, что тогда равнялось чину статского советника, и настоял на том, чтобы молодой человек с ним вместе ехал в Петербург и остановился в его доме. Как будто рассеянно и вместе с тем с несомненной уверенностью, что так должно быть, князь Василий делал всё, что было нужно для того, чтобы женить Пьера на своей дочери. Ежели бы князь Василий обдумывал вперед свои планы, он не мог бы иметь такой естественности в обращении и такой простоты и фамильярности в сношении со всеми людьми, выше и ниже себя поставленными. Что то влекло его постоянно к людям сильнее или богаче его, и он одарен был редким искусством ловить именно ту минуту, когда надо и можно было пользоваться людьми.
Пьер, сделавшись неожиданно богачом и графом Безухим, после недавнего одиночества и беззаботности, почувствовал себя до такой степени окруженным, занятым, что ему только в постели удавалось остаться одному с самим собою. Ему нужно было подписывать бумаги, ведаться с присутственными местами, о значении которых он не имел ясного понятия, спрашивать о чем то главного управляющего, ехать в подмосковное имение и принимать множество лиц, которые прежде не хотели и знать о его существовании, а теперь были бы обижены и огорчены, ежели бы он не захотел их видеть. Все эти разнообразные лица – деловые, родственники, знакомые – все были одинаково хорошо, ласково расположены к молодому наследнику; все они, очевидно и несомненно, были убеждены в высоких достоинствах Пьера. Беспрестанно он слышал слова: «С вашей необыкновенной добротой» или «при вашем прекрасном сердце», или «вы сами так чисты, граф…» или «ежели бы он был так умен, как вы» и т. п., так что он искренно начинал верить своей необыкновенной доброте и своему необыкновенному уму, тем более, что и всегда, в глубине души, ему казалось, что он действительно очень добр и очень умен. Даже люди, прежде бывшие злыми и очевидно враждебными, делались с ним нежными и любящими. Столь сердитая старшая из княжен, с длинной талией, с приглаженными, как у куклы, волосами, после похорон пришла в комнату Пьера. Опуская глаза и беспрестанно вспыхивая, она сказала ему, что очень жалеет о бывших между ними недоразумениях и что теперь не чувствует себя вправе ничего просить, разве только позволения, после постигшего ее удара, остаться на несколько недель в доме, который она так любила и где столько принесла жертв. Она не могла удержаться и заплакала при этих словах. Растроганный тем, что эта статуеобразная княжна могла так измениться, Пьер взял ее за руку и просил извинения, сам не зная, за что. С этого дня княжна начала вязать полосатый шарф для Пьера и совершенно изменилась к нему.

U-критерий является ранговым , поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Другие названия: критерий Манна-Уитни-Уилкоксона (Mann-Whitney-Wilcoxon, MWW), критерий суммы рангов Уилкоксона (Wilcoxon rank-sum test) или критерий Уилкоксона-Манна-Уитни (Wilcoxon-Mann-Whitney test, WMW).

Примеры задач

Пример 1. Первая выборка - это пациенты, которых лечили препаратом А. Вторая выборка - пациенты, которых лечили препаратом Б. Значения в выборках - это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через три дня после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.

Пример 2. Первая выборка - это поля, обработанные агротехническим методом А. Вторая выборка - поля, обработанные агротехническим методом Б. Значения в выборках - это урожайность. Требуется выяснить, является ли один из методов эффективнее другого, или различия урожайности обусловлены случайными факторами.

Пример 3. Первая выборка - это дни, когда в супермаркете проходила промо-акция типа А (красные ценники со скидкой). Вторая выборка - дни промо-акции типа Б (каждая пятая пачка бесплатно). Значения в выборках - это показатель эффективности промо-акции (объём продаж, либо выручка в рублях). Требуется выяснить, какой из типов промо-акции более эффективен.

Описание критерия

Заданы две выборки .

Дополнительные предположения:

Иногда ошибочно считают, что U-критерий проверяет нулевую гипотезу равенства медиан в двух выборках. Существуют распределения, для которых гипотеза верна, но их медианы различны.

U-критерий можно применять для проверки гипотезы сдвига в качестве альтернативной , где - некоторая константа, отличная от нуля. При этой альтернативе U-критерий является состоятельным . Его целесообразно применять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой физической величины. При этом функция распределения описывает погрешности измерения одного значения, а - другого. Однако во многих приложениях (в частности, эконометрических) нет особых оснований предполагать, что распределение второй выборки лишь сдвигается, но не меняется каким-либо иным образом.

U-критерий является непараметрическим аналогом критерия Стьюдента . Если выборки нормальные , то для проверки гипотезы сдвига предпочтительно применить более мощный критерий Стьюдента.

История

Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном. В 1947 году он был существенно переработан и расширен Манном и Уитни, по именам которых сегодня обычно и называется.

Литература

  1. Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947, №18. - Pp. 50-60.
  2. Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. 1945. - Pp. 80–83.
  3. Орлов А. И. Эконометрика. - М.: Экзамен, 2003. - 576 с. (§4.5 Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона?)
  4. Кобзарь А. И. Прикладная математическая статистика. - М.: Физматлит, 2006. - 816 с.


Вверх