Байес, такой Байес
Sep. 19th, 2011 03:34 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Собрался с духом и прочитал вот эту статью. Если у кого доступа нет, не плачьте, я вам сейчас все напою.
Два года назад были обнародованы результаты клинического испытания ВИЧ вакцины в Таиланде и, впервые за 30 лет исследований, был получен положительный сигнал - 31% эффективности в предотвращении инфекции. Стат-анализ выдал p=0.04 (то есть результат статистически-достоверный по общепринятым канонам). Авторы этой статьи (среди которых есть и сами исследователи этой вакцины), начинают с того, что "p value" - концепция не интуитивная и часто неправильно интерпретируемая. Поэтому они сейчас обсчитают те же результаты байесовскими методами, которые дают ответ на интуитивно-понятный вопрос "Какова вероятность того, что вакцина (не) работает?"
Хитрость байесовской статистики заключается в том, что для нее требуется ваша "изначальная, до-эксперимента-сформулированная гипотеза" о том, что именно вы в эксперименте получите. Я не знаю где как, а в биологии часто фиг сформулируешь, что именно ты ожидаешь. В данном случае, прямо как в анекдоте, можно сказать, что вероятность того, что вакцина работает, равна 50%, потому что "либо она работает, либо нет". А можно сказать, что "наверняка не сработает" - потому что дурацкая совершенно вакцина и работать не должна. Вообще сколько людей, столько и мнений.
В результате получаем ключевую таблицу из статьи:

Верхняя строка - "изначальная, до-эксперимента-сформулированная гипотеза" о вероятности того, что вакцина работать не будет.
Вторая строка - стат.анализ полученных данных на предмет вероятности того, что вакцина не работает.
Третья и четвертая строки - соответственно вероятности того, что вакцина работает и того, что увеличивает число инфекций.
Результаты, конечно, впечатляющие - от вероятности в 3% до вероятности в 70% :) Выбирай, какие хочешь.
Я уж лучше, по-старинке, на p value посмотрю.
Два года назад были обнародованы результаты клинического испытания ВИЧ вакцины в Таиланде и, впервые за 30 лет исследований, был получен положительный сигнал - 31% эффективности в предотвращении инфекции. Стат-анализ выдал p=0.04 (то есть результат статистически-достоверный по общепринятым канонам). Авторы этой статьи (среди которых есть и сами исследователи этой вакцины), начинают с того, что "p value" - концепция не интуитивная и часто неправильно интерпретируемая. Поэтому они сейчас обсчитают те же результаты байесовскими методами, которые дают ответ на интуитивно-понятный вопрос "Какова вероятность того, что вакцина (не) работает?"
Хитрость байесовской статистики заключается в том, что для нее требуется ваша "изначальная, до-эксперимента-сформулированная гипотеза" о том, что именно вы в эксперименте получите. Я не знаю где как, а в биологии часто фиг сформулируешь, что именно ты ожидаешь. В данном случае, прямо как в анекдоте, можно сказать, что вероятность того, что вакцина работает, равна 50%, потому что "либо она работает, либо нет". А можно сказать, что "наверняка не сработает" - потому что дурацкая совершенно вакцина и работать не должна. Вообще сколько людей, столько и мнений.
В результате получаем ключевую таблицу из статьи:

Верхняя строка - "изначальная, до-эксперимента-сформулированная гипотеза" о вероятности того, что вакцина работать не будет.
Вторая строка - стат.анализ полученных данных на предмет вероятности того, что вакцина не работает.
Третья и четвертая строки - соответственно вероятности того, что вакцина работает и того, что увеличивает число инфекций.
Результаты, конечно, впечатляющие - от вероятности в 3% до вероятности в 70% :) Выбирай, какие хочешь.
Я уж лучше, по-старинке, на p value посмотрю.