shvarz: (Default)
shvarz ([personal profile] shvarz) wrote2011-11-19 09:13 pm
Entry tags:

Интерпретация p value

1. Если нулевая гипотеза верна, то очень маловероятно получить в эксперименте результат Х.
2. Мы сделали эксперимент и получили результат Х.
3. Следовательно, нулевая гипотеза скорее всего неверна.

Эта интерпретация p value встречается в науке сплошь и рядом, и даже в некоторых учебниках по статистике приводится. Что статистиков чрезвычайно выводит из себя, но я не встречал еще статистика, который мог бы на пальцах объяснить, что почему это не верно.

А вы видите тут логическую неувязку?

Если нет, то следующая аналогия (вычитанная мною в одной статье) вам должна помочь:

1. Если человек американец, то очень маловероятно что он сенатор.
2. Вот перед нами сенатор.
3. Следовательно, он скорее всего не американец.

Впрочем, даже здесь, хотя абсурдность вывода и очевидна, откуда именно она берется - не совсем очевидно и приходится подумать.

[identity profile] yurvor.livejournal.com 2011-11-20 03:25 am (UTC)(link)
Аналогия не верна совершенно. Нулевая гипотеза состоит в том, что результат будет 0. Конечно, мы получим результат не 0, а X, но чем дальше он от 0, тем менее вероятно его получить.

В твоей аналогии в чём состоит нулевая гипотеза? Что человек - американец? Тогда оно, конечно, очень маловероятно, что он сенатор, но даже сенатор будет американцем. Т.е. результат "быть сенатором" не исключает результата "быть американцем". А в статистическом эксперименте результат X с очевидностью исключает результат 0.

А статистики ругаются вот почему. p-value - это вероятность получить результат X, если нулевая гипотеза верна. Вероятность (получить в эксперименте результат X) _при_условии,_что_ (нулевая гипотеза верна).

А для того, чтобы принять или отвергнуть нулевую гипотезу, нужно оценить другую вероятность - вероятность того, что (нулевая гипотеза верна) _при_условии,_что_ (в эксперименте получился результат X). Легко видеть, что это совсем другая вероятность, в некотором смысле "наоборот" к первой. Эта другая называется Bayesian inference.

Кстати говоря, в Википедии (http://en.wikipedia.org/wiki/P-value) довольно понятно всё объяснено.
Edited 2011-11-20 03:27 (UTC)

[identity profile] rsokolov.livejournal.com 2011-11-20 03:32 am (UTC)(link)
Прошу прощения, но мне кажется, что второй вопрос - о том, насколько вероятна нулевая гипотеза - несколько бессмысленный. Гипотез может быть бесконечное множество, в одной из них - результат 0, в другой - 0.00001 и т.д. То есть, нулевая гипотеза почти гарантированно неверна.

[identity profile] yurvor.livejournal.com 2011-11-20 03:36 am (UTC)(link)
Нулевая гипотеза состоит не в том, что результат будет 0, а в том, что матожидание результата будет 0 (я там раньше неточно выразился).

Почитайте про Байесов подход (http://en.wikipedia.org/wiki/Bayesian_inference).

Edited 2011-11-20 03:37 (UTC)

[identity profile] rsokolov.livejournal.com 2011-11-20 03:42 am (UTC)(link)
Не, если гипотез - ограниченное количество, и нам заранее известны распределения результатов, то всё в порядке.

[identity profile] yurvor.livejournal.com 2011-11-20 03:45 am (UTC)(link)
Нет, гипотез неограниченное количество. Функциональное пространство, можно сказать :) Короче, почитайте матчасть - там нетривиально :)

[identity profile] rsokolov.livejournal.com 2011-11-20 03:47 am (UTC)(link)
ок

Но если я чего-нибудь там не пойму, то вернусь.

[identity profile] rsokolov.livejournal.com 2011-11-20 04:18 am (UTC)(link)
Я правильно понял, что

1. Доказать нулевую гипотезу нельзя.
2. Мы отвергаем нулевую гипотезу, если p - мало?

(В википедии написано именно это, но вдруг это неправда?)

[identity profile] yurvor.livejournal.com 2011-11-20 04:46 am (UTC)(link)
1. Доказать нельзя, можно только проверить с той или иной вероятностью.
2. "мы" не отвергаем, это они отвергают :)

В посте как раз и обсуждаются резоны, по которым можно отвергнуть гипотезу. И суть в том, что p-value строго говоря тут ни при чём.

[identity profile] rsokolov.livejournal.com 2011-11-20 04:53 am (UTC)(link)
1. Еще раз прошу прощения, но что такое "проверить с той или иной вероятностью" - совсем уж непонятно.

2. Проблема в том, что в статье, на которую вы дали ссылку, говорится, что гипотеза отвергается, если p мало. Значит, этой статье не стоит доверять?

[identity profile] yurvor.livejournal.com 2011-11-20 05:03 am (UTC)(link)
1. Это вопрос вопросов, на самом деле. Классический подход не определяет это понятие, а Байесов считает, что вероятность - это мера нашей уверенности в том, что гипотеза правильная.

2. Вы про какую ссылку говорите? В статье про p-value прямо говорится, что "The p-value is not the probability that the null hypothesis is true." Поэтому что делать с гипотезой, тоже не ясно. А в статье про Bayesian inference нет такого слова "p-value".

[identity profile] rsokolov.livejournal.com 2011-11-20 05:05 am (UTC)(link)
В статье про p-value:

However, had one more head been obtained, the resulting p-value (two-tailed) would have been 0.0414 (4.14%). This time the null hypothesis – that the observed result of 15 heads out of 20 flips can be ascribed to chance alone – is rejected when using a 5% cut-off.

(no subject)

[identity profile] yurvor.livejournal.com - 2011-11-20 05:07 (UTC) - Expand

(no subject)

[identity profile] rsokolov.livejournal.com - 2011-11-20 05:14 (UTC) - Expand

(no subject)

[identity profile] yurvor.livejournal.com - 2011-11-20 05:18 (UTC) - Expand

(no subject)

[identity profile] rsokolov.livejournal.com - 2011-11-20 05:22 (UTC) - Expand

(no subject)

[identity profile] yurvor.livejournal.com - 2011-11-20 05:36 (UTC) - Expand

(no subject)

[identity profile] magner58.livejournal.com - 2011-11-20 10:29 (UTC) - Expand

(no subject)

[identity profile] galicarnax.livejournal.com - 2011-11-20 08:50 (UTC) - Expand

(no subject)

[identity profile] yurvor.livejournal.com - 2011-11-20 14:06 (UTC) - Expand

(no subject)

[identity profile] shvarz.livejournal.com - 2011-11-20 13:23 (UTC) - Expand

[identity profile] rsokolov.livejournal.com 2011-11-20 05:03 am (UTC)(link)
Попробую пояснить суть своего недоумения.

Вы говорите, что на бесконечномерном пространстве всевозможных гипотез для каждого значения Х задано распределение вероятности истинности гипотез. Но множество нулевых гипотез обладает нулевой мерой. Поэтому, строго говоря, вероятность того, что нулевая гипотеза верна, равна нулю.

[identity profile] yurvor.livejournal.com 2011-11-20 05:09 am (UTC)(link)
Про дельта-функцию слышали? :)

[identity profile] rsokolov.livejournal.com 2011-11-20 05:13 am (UTC)(link)
отож

(no subject)

[identity profile] rsokolov.livejournal.com - 2011-11-20 05:24 (UTC) - Expand

(no subject)

[identity profile] yurvor.livejournal.com - 2011-11-20 05:35 (UTC) - Expand

(no subject)

[identity profile] rsokolov.livejournal.com - 2011-11-20 05:43 (UTC) - Expand

(no subject)

[identity profile] rsokolov.livejournal.com - 2011-11-20 05:51 (UTC) - Expand

(no subject)

[identity profile] yurvor.livejournal.com - 2011-11-20 05:57 (UTC) - Expand

(no subject)

[identity profile] rsokolov.livejournal.com - 2011-11-20 06:08 (UTC) - Expand

(no subject)

[identity profile] yurvor.livejournal.com - 2011-11-20 06:04 (UTC) - Expand

(no subject)

[identity profile] rsokolov.livejournal.com - 2011-11-20 06:11 (UTC) - Expand

[identity profile] shvarz.livejournal.com 2011-11-20 01:27 pm (UTC)(link)
Нормальная совершенно аналогия. Байес тут ни при чем, все сформулировано в фреквентистских терминах (вы видите где-нибудь в условии обсуждение вероятностей результатов при разных гипотезах?).

[identity profile] yurvor.livejournal.com 2011-11-20 02:02 pm (UTC)(link)
Честно говоря, не понял твоего возражения. Причём тут "обсуждение вероятностей результатов при разных гипотезах"?

Поясни, какова в твоей аналогии нулевая гипотеза и какой, собственно, эксперимент ставится.

[identity profile] shvarz.livejournal.com 2011-11-20 11:31 pm (UTC)(link)
Аналогия тем и аналогия, что в ней используются другие понятия. В аналогии нет нулевой гипотезы. Есть логическое построение, сходное с логикой в первом построении - начинаем с предположения, затем на основании маловероятности некоего события в рамках этого предположения судим о вероятности того, что наше предположение верно.

[identity profile] yurvor.livejournal.com 2011-11-20 11:35 pm (UTC)(link)
"В аналогии нет нулевой гипотезы."

Хм. Мне тогда кажется, что она совсем не аналогия :) Вернее сказать, я не понимаю, что тогда тут аналогичного - ведь важна внутренняя структура представления, в данном случае вероятностная связь между нулевой гипотезой и полученным результатом. А в аналогии такой связи нет.

[identity profile] shvarz.livejournal.com 2011-11-21 09:41 pm (UTC)(link)
Внутренняя стурктура (логические заключения на основании каких-то предпосылок и данных) в обоих случаях одинакова. Если очень хочется, то можно наверно сформулировать нулевую гипотезу как "рассматриваемое нами общество - американское".

[identity profile] vasja-iz-aa.livejournal.com 2011-11-21 01:21 am (UTC)(link)
> маловероятности некоего события в рамках этого предположения

это, как бе, дважды неверно. мы оценивает вероятность не события а ошибки первого рода и совершить, а не наоборот. ну если, конечно, я правильно понимаю о чем Вы

[identity profile] shvarz.livejournal.com 2011-11-21 09:42 pm (UTC)(link)
Я о вероятности того, что случайно-взятый человек будет сенатором.

[identity profile] vasja-iz-aa.livejournal.com 2011-11-21 09:47 pm (UTC)(link)
а-а, Вы про Байеса...

[identity profile] shvarz.livejournal.com 2011-11-21 09:48 pm (UTC)(link)
Я уже и сам запутался о Байесе или нет. А казалось вначале, что такая красивая и понятная аналогия :)

[identity profile] vasja-iz-aa.livejournal.com 2011-11-20 07:02 pm (UTC)(link)
Как это Байес ни при чем? Эту ж аналогию наверняка какой-нибуть байесовский статистик придумал, для плюнуть в ненавистный частотный подход.

[identity profile] shvarz.livejournal.com 2011-11-20 11:32 pm (UTC)(link)
Вы не так уж далеки от истины :)