Фидуциальный вывод в статистике

Фидуциальный вывод в статистике

t.me/abba_testing

Идея фидуциального вывода (fiducial inference) следующая: Фишер, как мне видится, решил попробовать развить частный подход, стараясь как будто выйти из абстрактного (z-нормальное распределение средних) в обратное конкретное (распределение средних как оно есть).

Пускай мы знаем дисперсию генеральной = 4 и у нас есть выборка [24, 25, 26]. Наше выборочное среднее = 25 как-то соотносится с настоящим средним Mu популяции, то есть удалено от него на некоторое кол-во стандартных отклонений, значит у него есть свой z-score на z-нормальном распределении средних. 

Легко по классике выразить само Mu:

но далее вместо интервалов мы останавливаемся на том, что Z ~ N(0, 1) [распределено нормально со средним 0]. То есть это значит, что мы из нашего выборочного среднего вычтем Z-распределение, используя дополнительно коэффициент в виде стандартной ошибки.

И получим, что оценку распределения параметра Mu:

- а это и есть фидуциальное распределение параметра Mu с абсолютными значениями. 

Если мы возьмем +- 1.96 сигм в рамках этого распределения, то получим фидуциальный интервал, который будет совпадать с классическим доверительным. И тут сразу вопрос: зачем это все считать, если давно есть старый-добрый доверительный? Фишер говорил, что если считается один параметр, то фидуциальный интервал совпадает с доверительным, а вот при оценке параметров для многомерного случая отличия бывают. Я пытался (вероятно, плохо) обнаружить эти отличия в последнем случае, но все совпадало. Возможно, что неспроста статистики тогда стали считать один и другой интервалы синонимами, что печалило и чему сопротивлялся сэр Фишера. Но на этом проблемы не заканчиваются.

Мы можем, используя фидуциальное распределение, оценивать гипотезы, например, что Mu_0 = 24.5, подсчитать что-то вроде p-value, то есть формально расчет будет точно таким же, как p-value, но вот интерпретация весьма вопросительна. Она будет примерно такая: вероятность (фидуциальная) того, что параметр Mu равен или меньше, чем 24.5, составляет примерно 33%; равен или меньше симметричного 25.5 также 33%, итого для двусторонности 66%.

Слева и справа в фиолетовых зонах по 33%

Значит согласно фидуциальному распределению, есть вероятность = 66%, что Mu примет значение, такое же или более экстремальное, чем 24.5. Вроде понятно, да?...

Но что такое эта “фидуциальная вероятность”? Да, это вероятность на базе соответствующего распределения, но ведь это распределение по сути модель. Это не “true” вероятность, а именно “доверительная”. Что озадачивало самого Фишера, он так и писал, что пока непонятно, что это, но возможно однажды мы это поймем (нет). Мне это напоминает вероятность принадлежность к классу, которую дает логрегрессионная модель: то есть это оценка от модели, а не как оно есть в данных.

Кажется, кроме Фишера этим подходом более никто и не занимался толком: ни развитой теории, ни мат. аппарата, вот он и стал историей. Поэтому подходов в статистике, вводя поправку, "4 минус 1". Потому что надо отдать должное Фишеру, который постоянно пытался (и часто успешно) совершенствовать статистику и ее методы. 

И все же я задумался, не может ли этот подход Фишера подавать  фидуциальные распределения как приоры в баейсовскую статистику, рассчитанные на самом деле с использованием по сути “развитыми” методами частотного? Может ли подход фидуциального вывода быть мостиком между частнотным и байесовским так, чтобы в последнем соблюдались ошибки 1-го рода и 2-го? Одна проблема тут сразу такая: ок, на базе данных мы подсчитает распределение параметра по Фишеру, но за какой период брать данные? На текущий момент ответов на эти вопросы у меня нет.

Report Page