Confounding bias
Автор: Никита Бурлов
Над материалом работали: Элина Добросоцкая
Редакция: Гузель Рафикова, Наталья Усолова
Верстка: Каримат Асадулаева
Что же такое confounding bias?
Мы заинтересованы в изучении причинно-следственных связей. Т.е. нам важно верно определять причину (например, этиологию в поисковых исследованиях) и/или следствие (например, эффект от препарата в рандомизированном клиническом исследовании).
Очень часто мы наблюдаем ложные ассоциации из-за различных предвзятостей, которые принимаем за причинно-следственную связь. И наиболее известная в узких кругах (где читают статьи) – это confounding bias.
Мне очень нравится пример из курса Brady Neal «Introduction to causal inference».
Наблюдая за людьми, мы заметили, что люди, которые ложатся спать в обуви, чаще страдают головной болью на следующее утро. Наша идея – сравнить между собой две группы («в обуви» и «без обуви») по частоте головных болей (вдруг обувь является причиной?).
Проведя математический «ритуал», получаем р<0,05. Успех! Открытие! Прорыв! (рис. 1).
Но мы стараемся мыслить рационально (хотя это сложно) и изучаем группы внимательнее. И оказывается, что в группе «в обуви» около 70% были в состоянии алкогольного опьянения, а в группе «без обуви» только 10%. Пораскинув мозгами, приходим к логичному выводу, что нетрезвые будут чаще засыпать в обуви, а еще у них ОЧЕНЬ нередко болит голова на следующее утро.
Получается схема на рис. 2, это называется DAG (Directed acyclic graph, или прямой ациклический граф; грубо – это схема, отражающая известные или предполагаемые причинно-следственные связи, а подробнее у меня в блоге).
Мы видим, что фактор «алкоголь» влияет на предполагаемую причину и на исход. Значит, чтобы адекватно оценить исход, нужно разорвать эту связь между факторами «алкоголь» и «обувь». Опять проведя «ритуал», обнаруживаем, что «алкоголь» значимо влияет на «боль», а вот «обувь» – нет (рис. 3).
Но как так? Мы же видели до этого тот самый-самый уровень р!
Все дело в ложной ассоциации, которую создает третий вмешивающий фактор (в нашем случае «алкоголь»)! Вот он и называет confounder’ом (конфаундер). А явление, которые мы наблюдали до коррекции, – confounding (конфаундинг).
А что здесь сложного? Думать! Подобные факторы могут быть не такими явными, могут отсутствовать в наших данных или еще неизвестны нам. Поэтому чаще говорят о наличии эффекта (т.е. confounding), который нередко встречается в исследованиях.