Page Summary
- (Anonymous) - (no subject)
yurvor.livejournal.com - (no subject)
kobak.livejournal.com - (no subject)
signamax.livejournal.com - (no subject)
vasja-iz-aa.livejournal.com - (no subject)
vasja-iz-aa.livejournal.com - (no subject)
- (Anonymous) - payday loans 894 5197
- (Anonymous) - payday loans 473 20735
- (Anonymous) - cialis online 506 4520
Style Credit
- Style: Neutral Good for Practicality by
Expand Cut Tags
No cut tags
no subject
Date: 2011-11-22 09:44 pm (UTC)Если ученый действительно стремится к знанию, формальные методы бессильны: www.newyorker.com/reporting/2010/12/13/101213fa_fact_lehrer
no subject
Date: 2011-11-22 09:48 pm (UTC)no subject
Date: 2011-11-23 02:12 am (UTC)понимание которых требует гораздо более высокого
Date: 2011-11-23 05:13 pm (UTC)Re: понимание которых требует гораздо более высокого
Date: 2011-11-23 05:17 pm (UTC)Так вот споров насчет конкретных цифр и того, означают ли они что вакцина действительно работала или нет было выше крыши. И нижнюю границу доверительного интервала (2%) тоже приводили не раз.
Re: понимание которых требует гораздо более высокого
Date: 2011-11-23 05:53 pm (UTC)Re: понимание которых требует гораздо более высокого
Date: 2011-11-23 05:58 pm (UTC)no subject
Date: 2011-11-23 09:53 pm (UTC)Подумайте и четко сформулируйте для себя определение доверительного интервала ("доверительный интервал с уровнем доверия 95% для параметра a распределения P_a - это...").
После этого посмотрите определение в википедии, лучше в английской, но можно и в русской (в русской труднее понять из-за краткости); сравните со своим.
После этого прочитайте вот этот пост, где автор делиться своим недоумением от определения в википедии: users.livejournal.com/_winnie/316159.html
Наконец, прочитайте комментарий Саши Шеня к этому посту. (Он мне кажется абсолютно верным и очень ясным, но если вдруг понадобятся пояснения, я готов попробовать.)
Вопрос: проделав всё это, Вы по-прежнему считаете, что если в какой-то статье результат эксперимента будет выражен доверительным интервалом, у Вас не возникнет особых трудностей в интерпретации этого результата? Или по крайней мере, что интерпретация p-value была бы труднее?
если в какой-то статье результат эксперимента будет
Date: 2011-11-23 11:34 pm (UTC)no subject
Date: 2011-11-22 09:52 pm (UTC)no subject
Date: 2011-11-22 11:32 pm (UTC)Думаю, основной практический вывод такой: p<0.05 -- это смехотворно высокая граница (для одного-единственного набора данных). Чтобы доверять результату, нужно либо получить p типа 10^-10, либо провести несколько независимых экспериментов и т.п. Всё это, в общем, и так понятно, но после этого ролика становится совсем уж очевидно: если некий результат держится на одном сравнении c p около 0.05 (или пусть даже 0.001), то доверять ему нельзя.
no subject
Date: 2011-11-23 10:20 am (UTC)Так?
no subject
Date: 2011-11-23 01:11 pm (UTC)no subject
Date: 2011-11-23 05:10 pm (UTC)А анонимного математика Вы боюсь неправильно поняли. Он говорит, что автор ролика некорректо рассказывает про недостатки использования p-value потому, что не понимает сам что это такое. Я думаю, что в этом анонимный математик немного неправ и создатель ролика сознательно мухлюет, что бы сделать эти недостатки более выпуклыми, зримыми, яркими, достучаться до общественного мнения. Но это, конечно, субьективные мнения которые вряд ли могут быть подтверждены.
no subject
Date: 2011-11-23 05:12 pm (UTC)no subject
Date: 2011-11-23 06:36 pm (UTC)В прямом смысле.
Date: 2011-11-23 08:20 pm (UTC)no subject
Date: 2011-11-23 08:43 pm (UTC)no subject
Date: 2011-11-23 10:32 pm (UTC)no subject
Date: 2011-11-23 10:43 pm (UTC)И это не единственная претензия к ролику, я назвал то, что описать проще. Да и то, вот видите, не очень аккуратно назвал пять четырмя.
no subject
Date: 2011-11-23 10:44 pm (UTC)надо смотреть на эксперимент в целом
все остальное - конвенции для простоты
no subject
Date: 2011-11-23 04:38 pm (UTC)no subject
Date: 2011-11-23 02:05 am (UTC)в то время как на самом деле you can simply cannot trust the experiment
то есть reliability of p would be a measure of the quality of the experiment and the hypothesis
no subject
Date: 2011-11-23 01:13 pm (UTC)no subject
Date: 2011-11-23 06:33 pm (UTC)я увидел что люди ставят экспеример и если видят устраивающее их р - тут же публикуют
если они повторяют эксперимент и р уже не то - они это игнорируют
в то же время если у вас хорошая гипотеза то сколько бы не проводили эксперимент - у вас будет хорошее устойчивое р ибо вы установили закономерность
если гипотеза не отражает реальность - так у вас и р будет гулять
гуляющее р лишь говорит что то что вы наэксперементировали у вас получилось by chance only а не в результате закономерности
no subject
Date: 2011-11-23 06:38 pm (UTC)no subject
Date: 2011-11-23 06:46 pm (UTC)если р гуляет - конвенционально - теория не верна
почему р гуляет - может из-за грязи в эксперименте может из-за чего еще
я посмотрю еще раз как он устанавливает разницу
по памяти - там разница очень маленькая при больших хвостах
имхо - в этом и суть претензий
если есть маленькая разница при больших хвостах то и появление экперимента с хорошим р это дело шанса
гипотеза которая ведет к эксперименту с маленькой разницей при больших хвостах - это грубо говоря плохая гипотеза или грязный эксперимент
альтернатива - эксперимент с большой разницей и маленькими хвостами - и у вас не будет гулять р
кстати величина разницы имеет меньшее значение чем величина хвостов
no subject
Date: 2011-11-23 10:16 pm (UTC)no subject
Date: 2011-11-23 10:27 pm (UTC)если хвосты приводят в произвольным колебаниям р это как раз и значит что эффекта нет
то есть шума столько что обнаруженный эффект by chance only
то есть на одном эксперименте нашли что эффект есть
стали изучать далее и выяснили что этот эффект обнаружен by chance which means by convention - no effect
если же в вас еще живет вера в то что эффект есть, что он "интересный" - увеличивайте n до величин вам доступных
в принципе эксперимент это модель - по определению
результат эксперимента экстраполируется в психологических экспериментах (да и в любых других) или на всю популяцию или на ее часть по договоренности
то есть идеальным экспериментом будет тот где n равно численности популяции (или ее части на которую вы собираетесь экстраполировать результаты эксперимента)
если в идеальном эксперименте у вас так гуляет р - то эффекта нет
если на n=32 у вас гуляет а вы думаете что вы найдет n при котором не будет гулять - увеличивайте n
в таком случае - опять же - при n=32 вы признаете что эксперимент тухлый и надо делать новый с большим n
no subject
Date: 2011-11-23 10:51 pm (UTC)Так что ролик демонстрирует простую ситуацию: "гипотеза" не просто хорошая, он истинная! Нулевая гипотеза неверна. И при этом распределение p-values (неожиданно?) получается очень широкое. Конечно, если увеличить количество людей в каждой группе, то р будут уменьшаться.
no subject
Date: 2011-11-23 11:42 pm (UTC)i thing we r talking about the same
from dif angles though
my point: u cannot reliably judge your hypothesis true or false if ur p value is dancing by convention
increase ur n, get ur p down, and then place ur judgment
also, as i agreed above, the experiment is better to be not only by p, but again, it is by convention.
if i were a peer and u come to me for a review with the best hypothesis possible and dancing p - i would say the same - increase ur n, make it cleaner.
no subject
Date: 2011-11-24 10:30 am (UTC)no subject
Date: 2011-11-24 07:43 pm (UTC)no subject
Date: 2011-11-24 07:56 pm (UTC)no subject
Date: 2011-11-24 08:40 pm (UTC)no subject
Date: 2011-12-01 03:44 pm (UTC)Я биолог (нейрофизиолог), и у нас например неофициально считается, что эффект меньше 20% - не эффект. Это из немного другой оперы, но логика схожа. N может быть большим, P может быть маленьким, но если сама величина эффекта меньше какого-то интуитивного значения - то эффекта нет, потому что наши системы слишком сложны, и мы просто не в состоянии их полностью контролировать. Это здравый смысл такой. Чтобы утверждать, что эффект есть, он должен прорываться "сквозь" наши нелепые эксперименты, как трава сквозь асфальт. А иначе - это подтасовка данных, потому что "чистых экспериментов" в нашей области не бывает.
Вот и тут похоже. Не в том проблема, что P плохи, а в том, что эксперимент дурацкий.
no subject
Date: 2011-12-01 04:20 pm (UTC)то есть гуляем так - смотрим на выборку и predict p или имеем p и представляем себе выборку
при достаточно больших выборках это упражнение теряет практический смысл и доверие к р возрастает
то есть ограничивать посыл автора ролика к утрверждению что
"если видим хороший р в статье то это может ни о чем не говорить, точнее это может говорить что этот р или отражает реальность в эксперименте, или что выборка недостаточна и р случайно такой выпал, и тогда нужно смотреть на другие параметры эксперимента" тут я с ним могу согласится - р by itself недостаточен для того чтобы судить об эксперименте
и тут дело доверия
думаю раньше convention была что если иссдедователи получили хороший эксперимент с "разницей" ну как не посмотри то чтобы не рапортовать все параметры рапортовали только р
потому честность стерлась и р стало единственным за чем стали гоняться что естественно неверно
no subject
Date: 2011-12-01 04:41 pm (UTC)no subject
Date: 2011-11-23 10:40 pm (UTC)от противного
возьмем простой известный эксперимент с известным результатом и с маленькими хвостами
и я попрошу вас продемонстрировать мне как там будет гулять р
no subject
Date: 2011-11-23 03:38 am (UTC)http://www.google.com/search?q=%D0%B3%D0%B4%D0%B5+%D1%80%D1%83%D0%B1%D0%BB%D1%8C
no subject
Date: 2011-11-23 08:31 am (UTC)no subject
Date: 2011-11-23 04:44 pm (UTC)no subject
Date: 2011-11-25 06:55 pm (UTC)www.vigg.ru/fileadmin/materials/bonferroni.ppt
payday loans 894 5197
Date: 2012-10-20 08:47 pm (UTC)payday loans 473 20735
Date: 2012-10-22 02:28 pm (UTC)cialis online 506 4520
Date: 2012-10-22 03:44 pm (UTC)