0,05. Доказательная медицина от магии до поисков бессмертия - [46]

Шрифт

Интервал

. Эту вероятность называют p-значение (пи-значение) или просто p (пи). Фишер предложил считать, что нулевая теория может считаться опровергнутой, если p-значение меньше 0,05.

Фишер рассчитал, что если бы в эксперименте использовалось по три, а не по четыре чашки чая каждого типа, то случайное угадывание всех шести чашек происходило бы в одном случае из двадцати[104], то есть p как раз было бы равно 0,05, и выбранный критерий не выполнялся бы. Поэтому он предложил использовать минимум восемь чашек, по четыре каждого типа. Тогда при всех правильных ответах значение p равно одному к семидесяти, или 0,014 в десятичных дробях[105], что меньше выбранного порога. В таком случае результат признается статистически значимым.

Этот подход прочно закрепился в исследовательской практике, в том числе и в медицинских экспериментах. В контролируемых клинических испытаниях нулевая гипотеза гласит, что эффект у изучаемого метода отсутствует, а наблюдаемые различия исходов в сравниваемых группах случайны. В подавляющем большинстве работ вы увидите расчет значения p, и очень часто результат будет считаться статистически значимым, если значение p меньше 0,05.

Важно помнить, что упомянутый Фишером порог p = = 0,05 – условен и был предложен как условие джентльменского соглашения между учеными. Разница между убедительностью результатов с p = 0,04 и с p = 0,06, конечно, гораздо меньше, чем для результатов с p = 0,04 и p = 0,001, хотя первые находятся по разные стороны условной границы, а вторые – по одну. И Фишер, и другие математики подчеркивали, что критерий p < 0,05 недостаточно строг, не годится для медицинских исследований[106], и рекомендовали другие пороговые значения, 0,01 и 0,001, но исследователи ухватились за наименее строгое, а значит, проще всего достижимое.

Что касается исключения ложноотрицательного результата, Фишер отметил, что чем меньше размер эффекта, то есть чем слабее способность леди угадывать, в какой последовательности были налиты молоко и чай, тем больше чашек чая потребуется для того, чтобы ее выявить.

Для описания вероятности ложноотрицательного результата рассчитывают статистическую мощность эксперимента. Чем выше статистическая мощность, тем меньше вероятность того, что мы ошибочно подтвердили нулевую гипотезу. Статистическая мощность медицинского исследования возрастает с увеличением количества участвующих в нем пациентов. Хотя столь же распространенных, как p < 0,05, стандартов допустимой вероятности ложноотрицательного результата не существует, часто ориентируются на статистическую мощность не менее 0,80.

Таким образом, исследователи находятся между двумя возможными ошибками:

• ложноположительным результатом, когда мы ошибочно отвергаем нулевую гипотезу и думаем, что нашли эффект, хотя на самом деле его нет, – такие ошибки называют ошибками I типа, и они могут приводить к тому, что пациентов лечат бесполезными лекарствами и делают им бессмысленные операции;

• ложноотрицательным результатом, когда мы ошибочно подтверждаем нулевую гипотезу и не замечаем реально существующий эффект, – такие ошибки называют ошибками II типа, и они чреваты незамеченными полезными или вредными эффектами лекарства.

Рандомизация – неслучайная случайность

Ответ на третий вопрос чайного эксперимента тоже имел далеко идущие последствия. Напомню, что Фишер задумался о том, как исключить влияние небольших отличий, которые неизбежно возникнут в процессе подготовки к тесту. В медицинских исследованиях эта проблема еще значимее: найти две группы людей, одинаковых во всех отношениях, куда сложнее, чем приготовить две одинаковые чашки чая.

Сравнимость групп – основа и необходимое условие контролируемого исследования. Пациенты разные, и болезнь у них протекает по-разному. Если в одной группе средний возраст пациентов ниже или болезнь изначально протекает легче, чем в другой, то после лечения состояние пациентов может различаться, даже если лекарство не работает. Возникает риск приписать препарату несуществующий эффект.

☛ Сравнение изначально разных групп может привести к достаточно контринтуитивным последствиям. Так, в 1986 году были опубликованы результаты сравнения эффективности разных методов лечения почечных камней. Авторы пришли к выводу, что чрескожная нефролитотомия[107] эффективнее, чем открытая: в первом случае успешны были 83% (289 из 350) операций, а во втором – лишь 78% (273 из 350). Однако сравнение результатов удаления небольших (< 2 см) и больших (> 2 см) камней дало неожиданный результат. В обоих случаях открытая оказалась эффективнее. Для маленьких камней открытая была эффективна в 93% случаев против 87%. А для больших – в 73% случаев против 69%.

Этот эффект называется парадоксом Симпсона, хотя никакого парадокса тут на самом деле нет. Причина в том, что удаление маленьких камней (суммарно 88% успешных операций) эффективнее, чем удаление больших (суммарно 72% успеха) при любом из методов. Пациентов распределяли между двумя видами лечения неравномерно: тем, у кого были маленькие камни, чаще назначали операцию с маленьким разрезом, а при больших – открытую. Поэтому среди тех, кого лечили чрескожной нефролитотомией, преобладали пациенты с маленькими камнями, а среди тех, кого лечили открытым методом, – с большими. Это и привело к иллюзии более высокой эффективности чрескожной нефролитотомии.

Продолжить чтение

Рекомендуем почитать

Вадим Сухачевский

Священный Грааль и тайна деспозинов

Говорят: история умеет хранить свои тайны. Справедливости ради добавим: способна она порой и проговариваться. И при всем стремлении, возникающем время от времени кое у кого, вытравить из нее нечто нежелательное, оно то и дело будет выглядывать наружу этими «проговорками» истории, порождая в людях вопросы и жажду дать на них ответ. Попробуем и мы пробиться сквозь бастионы одной величественной Тайны, пронзающей собою два десятка веков.

Михаил Гром

Физик в гостях у политика

Эта книга для людей которым хочется лучше понять происходящее в нашем мире в последние годы. Для людей которые не хотят попасть в жернова 3-ей мировой войны из-за ошибок и амбиций политиков. Не хотят для своей страны судьбы Гитлеровской Германии или современной Украины. Она отражает взгляд автора на мировые события и не претендуют на абсолютную истину. Это попытка познакомить читателя с альтернативной мировой масс медиа точкой зрения. Довольно много фактов и объяснений автор взял из открытых источников.

Эстрильда Горелова

Ладога

"Ладога" - научно-популярный очерк об одном из крупнейших озер нашей страны. Происхождение и географические характеристики Ладожского озера, животный и растительный мир, некоторые проблемы экономики, города Приладожья и его достопримечательности - таковы вопросы, которые освещаются в книге. Издание рассчитано на широкий круг читателей.

Иван Зыков

Три аксиомы

О друзьях наших — деревьях и лесах — рассказывает автор в этой книге. Вместе с ним читатель поплывет на лодке по Днепру и увидит дуб Тараса Шевченко, познакомится со степными лесами Украины и побывает в лесах Подмосковья, окажется под зеленым сводом вековечной тайги и узнает жизнь городских парков, пересечет Белое море и даже попадет в лесной пожар. Путешествуя с автором, читатель побывает у лесорубов и на плотах проплывет всю Мезень. А там, где упал когда-то Тунгусский метеорит, подивится чуду, над разгадкой которого ученые до сих пор ломают головы.

Герберт Уэллс

Краткая всемирная история

Книга известного английского писателя Г. Дж. Уэллса является, по сути, уникальным проектом: она читается как роман, но роман, дающий обобщенный обзор всемирной истории, без усложнений и спорных вопросов.

Борис Келлер

Как произошла жизнь на Земле

Давайте совершим путешествие вместе с наукой в далёкое прошлое, чтобы прийти к тому времени, когда зарождалась жизнь на Земле, и узнать, как это совершалось. От такого путешествия станет крепче уверенность в силе науки, в силе человеческого разума, в нашей собственной силе.