P значениев статистике

P значениев статистике

P значениев статистике

P-значение



=== Скачать файл ===




















Recommend this entry Has been recommended Surprise me. Ещё раз про оценку научных данных и, наконец, про p-value jescid January 23rd, Ничего сложного в p-value нет, но, удивительно — большинство профессиональных биологов и биоинформатиков, с которыми мне пришлось общаться, не могли объяснить, что это такое — мне просто говорили: У меня одинажды был конкретный вопрос по определённой задаче, где мне надо было обрезать данные по p-value — поэтому мне нужно было знать, на какой выборке эта величина считалась и по какому значению фильтровать результат. Факт того, что учёные люди вообще не хотели знать, как оценивать качество результата без тупого обрезания по зараннее заданному значению, смысл которого они не понимали, меня довольно впечатлил. А альтернативно-одарённые гмо-шные выбегалы так и вообще зело любят бросать на публику заумные доводы, а публика, сводя глаза в кучку на них, тут же и теряет дар думать головой. Один из любимых коньков выбегал — p-value, которое они вставляют где только можно, чтобы произвести впечатление — видимо, это одно из немногих слов, которые они смогли усвоить на лекциях по статистике. То, что в интерпретации данных этого эксперимента p-value не используется, неадекватно для использования или используется другое его значение для оценки отличия данных от контрольных, выбегал не озадачивает. Итак, что же такое p-value и почему оба эти утверждения выше вообще говоря неверны? Допустим у вас есть игральная кость кубик с точками и вы точно знаете, что она не подпилена — то есть выпадение любой стороны равновероятно. Но это не значит, что из 60 подбрасываний у вас обязательно 10 раз выпадет 5ка. Если вы проведёте таких испытаний, то есть раз повторите кидание кубика по 60 раз — всего киданий, то у вас всякий раз в каждом испытании будет выпадать какое-то число 5к, кучкующееся около Но случаи, когда у вас из 60 подбрасываний 5ка выпадет всего 5 или 4 раза, ещё меньше, или, наоборот, выпадет, скажем, 15 и более раз не говоря уж о том, что 60 раз по 5ке из 60 подбрасываний будет совсем невероятным результатом будут явно куда менее частые, чем когда она будет выпадать 8, 9, 10, 11 или 12 раз из Ведь кубик у нас честный, не подпиленный. Если вы далее посчитаете сколько всего из испытаний у вас выпадет по 5ке из 60 киданий и построите график, где по оси Х отложите число выпаданий за испытание от 1 до 60 , а по Y — сколько всего раз из испытаний у вас случилось данное число выпаданий из 60 киданий, то картинка будет примерно такая, как показана справа. График сей нарисован для иллюстрации от балды даже хуже — сгружен с сети и подрисован, чтобы больше соответствовать данному примеру, по Х в реальности там будет уход в ноль, а не в 30 , но его общий вид соответствует действительности и да, это не гауссово, то есть нормальное распределение. Понятно, что мне недосуг раз кидать кубик, но общая картина будет примерно такая. Также я не занимаюсь здесь точным подсчётом всех вероятностей — в скольких вероятнее всего случаях из испытаний 5ка выпадет данное число раз из 60 киданий. Цифры взяты на глаз, интуитивно подходящие и близкие к реальным значениям. Теперь возьмём неизвестный нам кубик, у которого, возможно, какая-то из граней подпилена, или даже не одна грань. Или с кубиком всё в порядке — но он нам неизвестен, мы должны его проверить. Проведём с ним точно такое же число испытаний. Так вот p-value — это вероятность получить данный конкретный результат или ещё более крайний результат при условии того, что кубик честный нуль-гипотеза верна. А так как мы ещё учитываем и крайние результаты все те случаи, когда данная грань выпала больше чем 21 раз из 60 киданий , то такая вероятность будет немножко больше — скажем, 0. Вот эта цифра и есть p-value. Если вы кидаете свой кубик и вдруг обнаруживаете, что у вас из испытаний в 53 случаях данная грань выпала, скажем 18 раз, то p-value — для данного результата будет другое больше 0. Просто выбор результата другой, более ожидаемый. Мы прежде всего интересуемся теми результатами, которые наименее ожидаемы. Заранее ожидаемые результаты нам неинтересны для проверки кубика: Чтобы определить отличие данного результата от результата контрольной выборки правильный кубик — действительно ли есть отклонение от неё, надо хорошо понимать какой именно результат берётся из контрольной выборки, а какой из экспериментальной для сравнения, соответствуют ли они друг другу корректно ли сравнивать именно эти выбранные результаты , достаточно ли проведено испытаний для корректной оценки p-value очевидно теперь, что чем меньше испытаний, тем менее смысла в использовании p-value для оценки того, насколько результаты расходятся от контрольной выборки , а главное — каково распределение всех результатов в выборке и верно ли это распределение нами изначально выбрано. Вообще говоря оно необязательно нормальное, как у распределения результатов между 0 и 1 точно такой же пример можно привести с монеткой, но там распределение будет нормальное — см. Мною специально выбран такой пример, когда распределение результатов ни разу не нормальное. И это совсем не редкость. А теперь оцените каково поле для жульничества оных выбегал. Так что когда вам кто-то начинает что-то втирать про p-value — задумывайтесь как следует и проверяйте данные на все четыре пункта, указанных выше. Чем p-value отличается от правила столько-та сигм? Метод стьюдента это кажется называется. Или это расширение метода доверителных интервалов? Вот ещё не пойму. Есть какой-то Чи-критерий для сравнения распределений. Что лучше доверительные интервалы или Чи-критерий? У нас данных мало. Поэтому мне статистически анализировать не выпадало. Тест Стьюдента только для нормального распределения и применяется для оценки отклонения среднего измеряемого значения данной группы от другой или от контрольной. Как раз для небольшого кол-ва данных применяется. Остальное мне не встречалось на практике. Как раз я специально привожу не нормальное не гауссово. А для теста Стьюдента по пределению нужно нормальное, потому что весь смысл оценки разброса данных по стандартному отклонению теряется, если распределение не гауссово. Но даже если я приводу пример не с кубиком, а с монеткой, для которой распределение будет нормальное, это всё равно разные критерии. В оценке погрешностей данных иногда даже табличку приводят — где тест Стьюдента в одной колонки показан, а значения p-value — в другой. А p-value — можно ли считать такое уплытие значимым: Конкретные значения будут отличаться. И вот насколько именно они будут отличаться и будет показывать то, было ли значимым отклонение от контрольных измерений или нет. Он используется не для сравнения распределений, а для того, чтобы оценить вероятность того, что наблюдаемое распределение статистически не отличается от некоего ожидаемого. Для сравнения распределений в целом наиболее ходовой - наверное, критерий Колмогорова-Смирнова. Для сравнения определенных параметров средние, дисперсии есть свои критерии. Edited at Экспозиции этой Кунсткамеры показывают необходимость проверки всего до вероятностей ошибки первого рода: Вот так и надо народ учить статистике — use cases. На одних определениях никто ничего не догонит, кроме, разве что, того, как на статистике можно мухлевать, обосновывая корректность результатов или их некорректность, если надо объяснить публике, которая в статистике всё равно не шарит. Ваш вопрос не говорит о вашем понимании того, что написано выше и слабо релевантен тексту. Обычно требуют адекватность применения p-value сначала. Можете ещё здесь почитать тогда — там от Nature про более общие соображения для тех, кто не очень хочет разбираться с тем, что такое p-value по сути. Main Ratings Disable ads. Log in No account?

Сити верхний уфалей каталог

Расписание электричек ленинский проспект тайцы

Русторгшина пенза каталог шин

Благодарность школе от родителей на выпускной текст

Как сделать чизбургер прикол

Характеристика начальника отдела договоров

Карты по истории 11 класс

Amd radeon hd 5450 1gb характеристики

Делать деньги яндекс деньги

Report Page