shvarz: (Default)
[personal profile] shvarz
Что делать, если вам нужно сделать очень дорогой эксперимент, но вы не можете даже примерно предсказать размер ожидаемого эффекта? Например, впервые тестируете совершенно новый метод лечения в людях. Какого размера выборку следует делать? Часто исследователи идут по пути "возьмем статистическую модель, подставим в нее наши примерные оценки нужных параметров и посмотрим что выйдет". Не секрет, что иногда начинают и с обратного - берут уже имеющийся размер выборки (например, количество уже согласившихся волонтеров) и потом под нее подгоняют параметры. В обоих случаях, рецензенты этих грантов частенько исследователей гоняют на счет того, что предлагаемый ими размер выборки недостаточно велик.

Вот в этой интересной статье, авторы предлагают в случаях, когда небольшие изменения в параметрах сильно меняют размер выборки, просто не заморачиваться с этими оценками. А пользоваться практическими соображениями (ценой, количеством волонтеров, и т.п.) и честно об этом говорить. Потому что как правило, исследование с 15 пациентами не намного улучшит статистическую мощность против исследования с 10, а увеличения в цене, времени и необходимых ресурсах вырастут существенно.

Они предлагают пользоваться, как одним из таких практических соображений, минимизированием функции C/sqrt(N), где C - это стоимость эксперимента при выборке N.

Date: 2011-08-29 08:03 pm (UTC)
From: [identity profile] ariwch.livejournal.com
Если не ошибаюсь, методика оценки рисков (то есть, в принципе, вероятностей) с использованием малой выборки достаточно хорошо проработана в актуарном анализе (причем есть какие-то математически обоснованные приемы, а не "пол-палец-потолок"). Правда, не знаю, не является ли 15 человек все же слишком уж малой выборкой.

Date: 2011-08-29 08:13 pm (UTC)
From: [identity profile] tenrousei.livejournal.com
является :)
скорее всего, на таком маленьком количестве людей ничего нельзя будет сказать о корреляции параметров - есть ли она, нет ли её

Date: 2011-08-29 09:31 pm (UTC)
From: [identity profile] shvarz.livejournal.com
В контрольной группе все 15 человек живы, в тестовой - все умерли. Вполне можно сказать.

Date: 2011-08-29 10:07 pm (UTC)
From: [identity profile] tenrousei.livejournal.com
это выборка из 30и человек :) иначе - это разные группы и разные измерения и сравнивать их вообще нельзя просто с точки зрения статистики.
кроме того, если в системе много параметров, то вероятность ошибки при уменьшении размера выборки возрастает и не получится утвердить гипотезу или отвергнуть

Date: 2011-08-29 10:10 pm (UTC)
From: [identity profile] shvarz.livejournal.com
Ну если вам очень хочется: 7 выжило, 7 умерло.

Date: 2011-08-29 10:20 pm (UTC)
From: [identity profile] tenrousei.livejournal.com
каков размер генеральной последовательности? гипотезу о скольки людях вы принимаете? и, главное, какую? что 100% человек выживет(проживёт n лет) при определённом условии?

Date: 2011-08-29 10:47 pm (UTC)
From: [identity profile] tenrousei.livejournal.com
и да, с какой вероятностью?

Date: 2011-08-30 12:02 am (UTC)
From: [identity profile] shvarz.livejournal.com
Перечитайте пост - вероятности не известны. О том и речь, что если распределения известны (среднее, стандартное отклоненение и т.п.) то посчитать проблемы нет. Речь о том, что делать если этой информации нет.

Date: 2011-08-30 12:01 am (UTC)
From: [identity profile] shvarz.livejournal.com
Лечили грипп у в остальном здоровых людей, так что ожидаемая смертность очень низкая (скажем один на сто тысяч).

(удивленно)

Date: 2011-08-30 02:11 pm (UTC)
From: [identity profile] sgustchalost.livejournal.com
"Лечили грипп у в остальном здоровых людей, так что ожидаемая смертность очень низкая (скажем один на сто тысяч).
Ну если вам очень хочется: 7 выжило, 7 умерло."

То есть вы намекаете на мааленький эксперимент, включающий полтора миллиона больных?

Re: (удивленно)

Date: 2011-08-30 02:33 pm (UTC)
From: [identity profile] shvarz.livejournal.com
Нет, всего 14. Полечили семерых, а они все тут же взяли и умерли. Товарищ сверху утверждал, что при таких цифрах что-либо достоверно о лечении в принципе сказать невозможно, поэтому я утрировал пример :)
From: [identity profile] sgustchalost.livejournal.com
и 5 умерших в "леченой" группе хватит.
А вот показать, что лекарство спасает от смерти - миллион испытуемых надо.
From: [identity profile] shvarz.livejournal.com
Ну зависит же от конкретного вопроса. Для гриппа - да, нужны сотни тысяч, а для агрессивного рака десяти человек хватит.
From: [identity profile] sgustchalost.livejournal.com
что вылечит 10 из 10 так да.
А если вылечит только 4 - формально недостоверно.

Но в том-то и мой пойнт (и возможно авторов), что лучше сначала взять 6 и потом еще 6, чем сразу 12.

Date: 2011-08-30 07:00 pm (UTC)
From: [identity profile] vasja-iz-aa.livejournal.com
> если в системе много параметров, то вероятность ошибки при уменьшении размера выборки возрастает

Это правильно только относительно сферических выборок в вакууме. А на практике чем больше выборка -- тем выше вероятность получить в результатах систематическую ошибку связаную с неслучайностью ее формирования.

Date: 2011-08-29 09:30 pm (UTC)
From: [identity profile] shvarz.livejournal.com
Проблема не в том, что теории не существует, или в том, что о ней не знают или не умеют пользоваться, а в том, что для таких оценок все равно нужны какие-то предположения о том, что будет измеряться.

Date: 2011-08-30 03:11 am (UTC)
From: [identity profile] overscience-mes.livejournal.com
с одной стороны, правильно, ну нет денег на 100 мартышек и не будет, с другой стороны, в этой сфере и так много манипуляций сознанием...

Date: 2011-08-30 02:48 pm (UTC)
From: [identity profile] shvarz.livejournal.com
Ну, вроде как призывают как раз поменьше манипулировать. Если есть десять мартышек, так не пудри мозги статистикой, а так и скажи. Вернее это скорее призыв к рецензентам, чтобы они не требовали статистику там, где от нее смысла мало.

Date: 2011-08-30 05:51 am (UTC)
From: [identity profile] vdinets.livejournal.com
блин, где они были пять лет назад?

Date: 2011-08-30 02:50 pm (UTC)
From: [identity profile] shvarz.livejournal.com
Я не думаю, что это сильно новая мысль. Ссылаются они на статьи 10-15-летней давности.

Date: 2011-08-30 06:57 pm (UTC)
From: [identity profile] vasja-iz-aa.livejournal.com
правильно не думаете. примерно 19го века мысль

Вывод один - думать надо.

Date: 2011-08-30 02:08 pm (UTC)
From: [identity profile] sgustchalost.livejournal.com
С одной стороны "рецензенты этих грантов частенько исследователей гоняют на счет того, что предлагаемый ими размер выборки недостаточно велик" и это плохо, потому как "рецензенты" сами проблему дизайна исследования глубоко не осознают и действую часто механически.

С другой стороны (статья не открывается, поэтому буду бурчать, опираясь на ваш пост)
оптимизировать надо не "статистическую мощность" относительно затрат, а такой неформальный параметр, как "чувство глубокого удовлетворения", относительно затрат. Практически это выражается в том, что лучше сначала запланировать небольшое исследование, а потом развивать (и модифицировать!) его, исходя из полученных результатов.
К сожалению, это подход плохо совместим с грантосистемой.

Безумно хихикаю от "таких практических соображений, как минимизирование функции C/sqrt(N), где C - это стоимость эксперимента при выборке N."
В таком совсем не редком случае, когда стоимость эксперимента в существенной части определяется стоимостью реактивов, она нарастает приблизительно пропорционально N.
Так что лучше всего будет при N = 1.

Впрочем, авторы-то это осознают
new ideas often must start small (sometimes even with an n of 1)
и, надеюсь, необходимость думать не отрицают.




Re: Вывод один - думать надо.

Date: 2011-08-30 04:01 pm (UTC)
From: [identity profile] shvarz.livejournal.com
как "чувство глубокого удовлетворения", относительно затрат
Да, примерно об этом они и пишут.

В таком совсем не редком случае, когда стоимость эксперимента в существенной части определяется стоимостью реактивов, она нарастает приблизительно пропорционально N.
Это зависит от реагентов. Иногда приготовить что-либо в маленьком количестве human-grade практически невозможно, поэтому есть начальная инвестиция в создание реагента с избытком. Плюс, например, организация и поддержание рекрутмента волонтеров. Но вообще да, они говорят, что в некоторых случаях оптимальное N=1 (как в случае с берлинским пациентом). Статистику делать на N=1 бесполезно, но само исследование может быть очень полезным.
From: [identity profile] polryby4.livejournal.com
Когда тестируют совершенно новый метод лечения / новое лекарство на людях, в первую очередь заботятся о его безопасности. И начинают с нескольких больных (методология 3+3), т.е. дали минимальную дозу первым 3 пациентам, если им не поплохело - дали дозу повыше следующим 3 и т.д. Интересуются в это время практически только переносимостью. Когда нашли максимальную дозу, от которой не плохеет - набирают еще человек 10-15 с этой дозой. Тут уже какая-то информация и об эффективности появляется, уже можно что-то в будущую модель подставить :)
From: [identity profile] shvarz.livejournal.com
Сейчас, насколько я знаю, вообще дают по одному за раз (после случая, когда одному резко поплохело, а в соседних комнатах продолжали давать новым), что не исключает дизайна эксперимента с заранее оговоренным количеством пациентов.

Date: 2011-08-31 10:52 am (UTC)
From: [identity profile] che-burashkaa.livejournal.com
Y = C/sqrt(N)

Если С пропорциональна N, то функция возрастает. Поэтому лучше не делать эксперимент вообще ;)

Date: 2011-08-31 01:48 pm (UTC)
From: [identity profile] shvarz.livejournal.com
Обычно график очень нелинейный. Есть некая большая начальная инвестиция, плюс дополнительная стоимость за каждого пациента, плюс иногда стоимость может вырастать скачкообразно (например, если начальная инвестиция покрывает десять пациентов максимум, а для 11 нужно удваивать ее стоимость).

Date: 2011-09-03 08:46 pm (UTC)

March 2022

S M T W T F S
  12345
6789101112
13141516171819
20212223242526
2728293031  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 24th, 2026 01:28 pm
Powered by Dreamwidth Studios