С нетерпением ждем следующую серию, "Танец доверительных интервалов" ;-) Если ученый действительно стремится к знанию, формальные методы бессильны: www.newyorker.com/reporting/2010/12/13/101213fa_fact_lehrer
Честно говоря, когда я увидел этот ролик в первый раз, то сначала не поверил. Но проверил -- всё действительно именно так. Если взять параметры распределений и количество наблюдений, как в ролике, то в 50% экспериментов разница будет значимой (p<0.05), а в 50% -- нет. Результат почти не зависит от статистического теста: я попробовал ttest, ranksum and bootstrap.
Думаю, основной практический вывод такой: p<0.05 -- это смехотворно высокая граница (для одного-единственного набора данных). Чтобы доверять результату, нужно либо получить p типа 10^-10, либо провести несколько независимых экспериментов и т.п. Всё это, в общем, и так понятно, но после этого ролика становится совсем уж очевидно: если некий результат держится на одном сравнении c p около 0.05 (или пусть даже 0.001), то доверять ему нельзя.
вот эта презентация выглядит сильно интересней, для иучения проблем связаных с излишним доверием к p-value. я, правда, проглядел ее лишь мельком, надо бы потом почитать подробнее, а все ли там правильно нарисовано www.vigg.ru/fileadmin/materials/bonferroni.ppt
no subject
(Anonymous) 2011-11-22 09:44 pm (UTC)(link)Если ученый действительно стремится к знанию, формальные методы бессильны: www.newyorker.com/reporting/2010/12/13/101213fa_fact_lehrer
(no subject)
(no subject)
(Anonymous) - 2011-11-23 02:12 (UTC) - Expandпонимание которых требует гораздо более высокого
Re: понимание которых требует гораздо более высокого
Re: понимание которых требует гораздо более высокого
Re: понимание которых требует гораздо более высокого
(no subject)
(Anonymous) - 2011-11-23 21:53 (UTC) - Expandесли в какой-то статье результат эксперимента будет
no subject
no subject
Думаю, основной практический вывод такой: p<0.05 -- это смехотворно высокая граница (для одного-единственного набора данных). Чтобы доверять результату, нужно либо получить p типа 10^-10, либо провести несколько независимых экспериментов и т.п. Всё это, в общем, и так понятно, но после этого ролика становится совсем уж очевидно: если некий результат держится на одном сравнении c p около 0.05 (или пусть даже 0.001), то доверять ему нельзя.
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
В прямом смысле.
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
в то время как на самом деле you can simply cannot trust the experiment
то есть reliability of p would be a measure of the quality of the experiment and the hypothesis
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(Anonymous) - 2011-11-23 23:42 (UTC) - Expand(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
(no subject)
no subject
http://www.google.com/search?q=%D0%B3%D0%B4%D0%B5+%D1%80%D1%83%D0%B1%D0%BB%D1%8C
(no subject)
(no subject)
no subject
www.vigg.ru/fileadmin/materials/bonferroni.ppt
payday loans 894 5197
(Anonymous) 2012-10-20 08:47 pm (UTC)(link)payday loans 473 20735
(Anonymous) 2012-10-22 02:28 pm (UTC)(link)cialis online 506 4520
(Anonymous) 2012-10-22 03:44 pm (UTC)(link)