Байес, такой Байес
Sep. 19th, 2011 03:34 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Собрался с духом и прочитал вот эту статью. Если у кого доступа нет, не плачьте, я вам сейчас все напою.
Два года назад были обнародованы результаты клинического испытания ВИЧ вакцины в Таиланде и, впервые за 30 лет исследований, был получен положительный сигнал - 31% эффективности в предотвращении инфекции. Стат-анализ выдал p=0.04 (то есть результат статистически-достоверный по общепринятым канонам). Авторы этой статьи (среди которых есть и сами исследователи этой вакцины), начинают с того, что "p value" - концепция не интуитивная и часто неправильно интерпретируемая. Поэтому они сейчас обсчитают те же результаты байесовскими методами, которые дают ответ на интуитивно-понятный вопрос "Какова вероятность того, что вакцина (не) работает?"
Хитрость байесовской статистики заключается в том, что для нее требуется ваша "изначальная, до-эксперимента-сформулированная гипотеза" о том, что именно вы в эксперименте получите. Я не знаю где как, а в биологии часто фиг сформулируешь, что именно ты ожидаешь. В данном случае, прямо как в анекдоте, можно сказать, что вероятность того, что вакцина работает, равна 50%, потому что "либо она работает, либо нет". А можно сказать, что "наверняка не сработает" - потому что дурацкая совершенно вакцина и работать не должна. Вообще сколько людей, столько и мнений.
В результате получаем ключевую таблицу из статьи:

Верхняя строка - "изначальная, до-эксперимента-сформулированная гипотеза" о вероятности того, что вакцина работать не будет.
Вторая строка - стат.анализ полученных данных на предмет вероятности того, что вакцина не работает.
Третья и четвертая строки - соответственно вероятности того, что вакцина работает и того, что увеличивает число инфекций.
Результаты, конечно, впечатляющие - от вероятности в 3% до вероятности в 70% :) Выбирай, какие хочешь.
Я уж лучше, по-старинке, на p value посмотрю.
Два года назад были обнародованы результаты клинического испытания ВИЧ вакцины в Таиланде и, впервые за 30 лет исследований, был получен положительный сигнал - 31% эффективности в предотвращении инфекции. Стат-анализ выдал p=0.04 (то есть результат статистически-достоверный по общепринятым канонам). Авторы этой статьи (среди которых есть и сами исследователи этой вакцины), начинают с того, что "p value" - концепция не интуитивная и часто неправильно интерпретируемая. Поэтому они сейчас обсчитают те же результаты байесовскими методами, которые дают ответ на интуитивно-понятный вопрос "Какова вероятность того, что вакцина (не) работает?"
Хитрость байесовской статистики заключается в том, что для нее требуется ваша "изначальная, до-эксперимента-сформулированная гипотеза" о том, что именно вы в эксперименте получите. Я не знаю где как, а в биологии часто фиг сформулируешь, что именно ты ожидаешь. В данном случае, прямо как в анекдоте, можно сказать, что вероятность того, что вакцина работает, равна 50%, потому что "либо она работает, либо нет". А можно сказать, что "наверняка не сработает" - потому что дурацкая совершенно вакцина и работать не должна. Вообще сколько людей, столько и мнений.
В результате получаем ключевую таблицу из статьи:

Верхняя строка - "изначальная, до-эксперимента-сформулированная гипотеза" о вероятности того, что вакцина работать не будет.
Вторая строка - стат.анализ полученных данных на предмет вероятности того, что вакцина не работает.
Третья и четвертая строки - соответственно вероятности того, что вакцина работает и того, что увеличивает число инфекций.
Результаты, конечно, впечатляющие - от вероятности в 3% до вероятности в 70% :) Выбирай, какие хочешь.
Я уж лучше, по-старинке, на p value посмотрю.
Bayes statistics
Date: 2011-09-19 08:23 pm (UTC)Да, откуда это prior distribution берется почти никогда не понятно. Часто его выберают просто для удобства вычислений.
Re: Bayes statistics
Date: 2011-09-19 08:27 pm (UTC)Re: Bayes statistics
Date: 2011-09-19 08:56 pm (UTC)Ну, цифирьки подогнать -- это всегда дело нужное и полезное.
no subject
Date: 2011-09-19 08:41 pm (UTC)Когда мы из головы выдумываем уровень значимости 1-0.0001 мы как раз пробегаем етот спектр 3-70% (грубо говоря)
no subject
Date: 2011-09-19 08:42 pm (UTC)no subject
Date: 2011-09-19 08:47 pm (UTC)no subject
Date: 2011-09-19 10:27 pm (UTC)no subject
Date: 2011-09-20 08:20 am (UTC)Т.е. вы открываете статью с p-value = x. Какие значения вы считаете достаточными, чтобы поверить исследованию?
no subject
Date: 2011-09-20 01:12 pm (UTC)Если данных много, и p-value <10^-9 нуль гипотеза отвергнута, и эффект скорее всего значительный. 10^-3 < p-value < 10^-6 нуль гипотеза отвергнута, но эффект возможно мало значительный. Если > 10^-2-10^-3, то это повод задуматься что авторы исследования страдают фигней.
no subject
Date: 2011-09-20 01:30 pm (UTC)http://en.wikipedia.org/wiki/P-value#Misunderstandings пункт (7)
no subject
Date: 2011-09-20 02:29 pm (UTC)Оттуда же "The p-value does not indicate the size or importance of the observed effect. *The two do vary together*"
no subject
Date: 2011-09-20 02:44 pm (UTC)no subject
Date: 2011-09-20 02:46 pm (UTC)no subject
Date: 2011-09-20 03:35 pm (UTC)Просто на практике, получить с мало значительным эффектом "зашкаливающее" значение p-value достаточно сложно/маловероятно и это по крайней мере ни так бредово как кажется. Ну и тут вопрос, конечно, что считать значительным, для генератора псевдо случайных чисел, P(0) = 0.49 это значительный эффект, для чего-то другого - нет.
no subject
Date: 2011-09-20 05:27 pm (UTC)no subject
Date: 2011-09-20 01:22 pm (UTC)no subject
Date: 2011-09-20 05:28 am (UTC)no subject
Date: 2011-09-20 01:21 pm (UTC)no subject
Date: 2011-09-20 04:57 pm (UTC)Но в общем то, зависит от обстоятельств. Бывает, что лучше всего на губы смотреть.
no subject
Date: 2011-09-20 07:27 pm (UTC)no subject
Date: 2011-09-21 01:27 am (UTC)Но практически гораздо чаще встречаются не полностью отстsвующие, а частичные указания. Как то вроде либо слабая положительная корреляция с p-value .01 или статистически достоверная корреляция .4 Второе много лучше.
no subject
Date: 2011-11-23 05:52 pm (UTC)no subject
Date: 2011-11-24 06:48 am (UTC)no subject
Date: 2011-09-20 09:11 am (UTC)no subject
Date: 2011-09-20 10:42 am (UTC)no subject
Date: 2011-09-20 11:49 am (UTC)no subject
Date: 2011-09-20 01:19 pm (UTC)no subject
Date: 2011-09-20 05:07 pm (UTC)no subject
Date: 2011-09-20 08:04 pm (UTC)no subject
Date: 2011-09-20 10:18 pm (UTC)no subject
Date: 2011-09-20 09:14 am (UTC)no subject
Date: 2011-09-20 01:20 pm (UTC)no subject
Date: 2011-09-20 04:55 pm (UTC)no subject
Date: 2011-09-20 11:16 pm (UTC)