Нейросетевая экспертная система медицинской диагностики - Программирование, компьютеры и кибернетика дипломная работа

Главная
Программирование, компьютеры и кибернетика
Нейросетевая экспертная система медицинской диагностики
Исследование общих сведений о медицинских экспертных системах, способных заменить специалиста-эксперта в разрешении проблемной ситуации. Обучение искусственных нейронных сетей в программе Statistica 7. Обзор программной реализации модуля кластеризации.
посмотреть текст работы
скачать работу можно здесь
полная информация о работе
весь список подобных работ
Нужна помощь с учёбой? Наши эксперты готовы помочь!
Нажимая на кнопку, вы соглашаетесь с
политикой обработки персональных данных
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Факультет Прикладной математики, информатики и механики
Кафедра математических методов исследования операций
Выпускная квалификационная работа бакалавра
НЕЙРОСЕТЕВАЯ ЭКСПЕРТНАЯ СИСТЕМА МЕДИЦИНСКОЙ ДИАГНОСТИКИ
Область исследований, посвященная формализации способов представления знаний и построению экспертных систем (ЭС), называют «инженерией знаний». Этот термин введен Е. Фейгенбаумом и в его трактовке означает «привнесение принципов и средств из области искусственного интеллекта в решение трудных прикладных проблем, требующих знаний экспертов». Иными словами, экспертные системы применяются для решения неформализованных проблем, к которым относятся задачи, обладающие одной или несколькими характеристиками из следующего списка :
- задачи не могут быть представлены в числовой форме;
- исходные данные и знания о предметной области неоднозначны, неточны, противоречивы;
- цели нельзя выразить с помощью четко определенной целевой функции;
- не существует однозначного алгоритмического решения задачи.
Все вышеперечисленные свойства являются типичными для медицинских задач, так как в большинстве случаев они представлены большим объемом многомерных, запутанных, а порой и противоречивых клинических данных. ЭС позволяют решать задачи диагностики, дифференциальной диагностики, прогнозирования, выбора стратегии и тактики лечения и др.
Среди экспертных медицинских систем особое место занимают так называемые самообучающиеся интеллектуальные системы (СИС). Они основаны на методах автоматической классификации ситуаций из реальной практики или на методах обучения на примерах. Наиболее яркий пример СИС -- искусственные нейронные сети.
Искусственные нейронные сети (ИНС; artificial neural networks) представляют собой нелинейную систему, позволяющую классифицировать данные гораздо лучше, чем обычно используемые линейные методы. В приложении к медицинской диагностике ИНС дают возможность значительно повысить специфичность метода, не снижая его чувствительность.
Наиболее важным отличием ИНС от остальных методов прогнозирования является возможность конструирования экспертных систем самим врачом-специалистом, который может передать нейронной сети свой индивидуальный опыт и опыт своих коллег или обучать сеть на реальных данных, полученных путем наблюдений. Нейронные сети способны принимать решения, основываясь на выявляемых ими скрытых закономерностях в многомерных данных. Положительное отличительное свойство ИНС состоит в том, что они не программируются, т.е. не используют никаких правил вывода для постановки диагноза, а обучаются делать это на примерах. В ряде случаев ИНС могут демонстрировать удивительные свойства, присущие мозгу человека, в том числе отыскивать закономерности в запутанных данных. Нейронные сети нашли применение во многих областях техники, где они используются для решения многочисленных прикладных задач: в космонавтике, автомобилестроении, банковском и военном деле, страховании, робототехнике, при передаче данных и др. Другое, не менее важное, свойство нейронной сети состоит в способности к обучению и обобщению полученных знаний. Сеть обладает чертами так называемого искусственного интеллекта. Натренированная на ограниченном множестве обучающих выборок, она обобщает накопленную информацию и вырабатывает ожидаемую реакцию применительно к данным, не обрабатывавшимся в процессе обучения . Схематично процесс применения обученной ИНС в медицине показан на рисунке 1.
Рисунок 1. Схема применения обученной искусственной нейронной сети в медицине
Примеры использования экспертных систем в медицине нельзя назвать единичными, они применяются во многих областях здравоохранения. Примечательно, что подавляющее большинство таких работ выполнено зарубежными исследователями и в основном они касаются возможностей использования ИНС в различных клинических ситуациях. Так, например, в области хирургии P.L. Liew и др. на основе ИНС создали систему прогнозирования риска развития желчнокаменной болезни у людей с избыточной массой тела. Авторы ретроспективно изучили антропоморфометрические, анамнестические, клинические и лабораторные данные 117 пациентов с ожирением, прооперированных за период с февраля 1999 по октябрь 2005 г. Была построена ИНС, обученная алгоритмом обратного распространения. Использовались 30 входных переменных, включая клинические данные (пол, возраст, индекс массы тела, сопутствующие заболевания), лабораторные показатели и результаты гистологического исследования. Прогнозирующую ценность ИНС сравнивали с моделью логистической регрессии, обученной на той же базе данных. ИНС продемонстрировала лучшую прогнозирующую ценность и более низкую ошибку, чем модель логистической регрессии. Наиболее важные факторы риска желчнокаменной болезни, по данным обеих методик, -- повышенное диастолическое артериальное давление, преморбидный фон, нарушение метаболизма глюкозы и повышение уровня холестерина крови.
В эндоскопии A. Das и др. использовали нейросетевые технологии для сортировки больных с неварикозными кровотечениями из верхних отделов желудочно-кишечного тракта. Была исследована эффективность ИНС, обученной по клиническим и лабораторным данным 387 пациентов с изучаемой патологией, верификация -- по данным 200 пациентов с проведением ROC-анализа. На выходе сети имелись две результирующие переменные: наличие или отсутствие признаков продолжающегося кровотечения и потребность в лечебной эндоскопии. Чувствительность нейронной сети составила > 80 %, прогнозирующая ценность - 92--96 %.
В онкоурологии P. Bassi и др. спрогнозировали 5-летнюю выживаемость пациентов, перенесших радикальную цист-эктомию по поводу рака мочевого пузыря. Для этого были разработаны и сравнены ИНС и модель логистической регрессии (МЛР). Выявлено, что единственными статистически достоверными предсказателями 5-летней выживаемости оказались стадия опухоли и наличие или отсутствие прорастания в соседние органы. Чувствительность и специфичность МЛР составили 68,4% и 82,8%, ИНС - 62,7% и 86,1% соответственно. Положительная прогнозирующая ценность МЛР -- 78,6%, ИНС - 76,2%, отрицательная прогнозирующая ценность - 73,9% и 76,5% соответственно. Индекс диагностической точности МЛР - 75,9%, ИНС - 76,4%. Таким образом, прогностическая ценность ИНС оказалась сопоставимой с МЛР, но нейросеть продемонстрировала определенные преимущества: ИНС базируется на удобном в работе, понятном программном обеспечении, позволяющем выявлять нелинейные связи между переменными, поэтому она более предпочтительна для использования в прогнозировании.
С. Stephan и др. применили ИНС для автоматизированного анализа биоптата предстательной железы. Методика основывалась на выявлении общего простат-специфического антигена (ПСА) и определении процента свободного ПСА. Чувствительность составила 95%, специфичность - 34%. При дополнении нейросети моделью логистической регрессии специфичность возросла до 95%.
F. K. Chun и др. использовали ИНС для выявления группы риска рака предстательной железы в сравнении с МЛР. ИНС также продемонстрировала более точные прогностические возможности.
В трансплантологии G. Santori и др. применили нейросетевые технологии в прогнозировании отсроченного снижения креатинина сыворотки крови у детей после трансплантации почки. Для выявления корреляции между входными переменными и искомым результатом у пациентов, подлежащих трансплантации почки, была создана искусственная нейронная сеть, обученная на 107 клинических примерах. Были отобраны наиболее важные переменные, коррелирующие с результатом: креатинин сыворотки крови в день пересадки, диурез за первые 24 часа, эффективность гемодиализа, пол реципиента, пол донора, масса тела в первый день после пересадки, возраст. Модель была откалибрована второй выборкой пациентов (n = 41). Точность нейронной сети в обучающей, калибровочной и проверочной выборках составила 89 %; 77% и 87% соответственно. Сравнительный логистический анализ показал общую точность 79%. Чувствительность и специфичность ИНС составили 87%, тогда как метод логистической регрессии продемонстрировал худшие результаты -- 37% и 94% соответственно.
В медицинской радиологии F. Dоhler и др. использовали нейронную сеть для классификации изображений МРТ с целью автоматизированного обнаружения гиппокампального склероза. ИНС была обучена на 144 примерах изображений и позволяла классифицировать изменения в ткани головного мозга относительно наличия склеротических изменений. E.E. Gassman и др. создали ИНС для автоматизированной идентификации костных структур и оценили надежность этой методики по сравнению с традиционными. Чувствительность и специфичность методики составили 87% и 82%. Кроме того, сегментацию структур кости ИНС выполнила в 10 раз быстрее.В неврологии A.T. Tzallas и др. применили нейросеть для прогнозирования эпилептических приступов на основе анализа электроэнцефалограмм. Прогностическая точность метода составила 98 - 100 %.
Нейронные сети представляют собой новую и весьма перспективную вычислительную технологию, дающую новые подходы к исследованию динамических задач в финансовой области. Первоначально нейронные сети открыли новые возможности в области распознавания образов, затем к этому прибавились статистические и основанные на методах искусственного интеллекта средства поддержки принятия решений и решения задач в сфере финансов. Способность к моделированию нелинейных процессов, работе с зашумленными данными и адаптивность дают возможности применять нейронные сети для решения широкого класса финансовых задач. В последние несколько лет на основе нейронные сетей было разработано много программных систем для применения в таких вопросах, как операции на товарном рынке, оценка вероятности банкротства банка, оценка кредитоспособности, контроль за инвестициями, размещение займов. Приложения нейронные сетей охватывают самые разнообразные области интересов распознавание образов, обработка зашумленные данных, дополнение образов, ассоциативный поиск, классификация, оптимизация, прогноз, диагностика, обработка сигналов, абстрагирование, управление процессами, сегментация данных, сжатие информации, сложные отображения, моделирование сложных процессов, машинное зрение, распознавание речи.
На рисунке 2 показана структура пары типичных биологических нейронов. Дендриты идут от тела нервной клетки к другим нейронам, где они принимают сигналы в точках соединения, называемых синапсами. Принятые синапсом входные сигналы подводятся к телу нейрона. Здесь они суммируются, причем одни входы стремятся возбудить нейрон, другие - воспрепятствовать его возбуждению. Когда суммарное возбуждение в теле нейрона превышает некоторый порог, нейрон возбуждается, посылая по аксону сигнал другим нейронам. У этой основной функциональной схемы много усложнений и исключений, тем не менее большинство искусственных нейронных сетей моделируют лишь эти простые свойства.
Хотя сетевые парадигмы весьма разнообразны, в основе почти всех их лежит эта конфигурация. Здесь множество входных сигналов, обозначенных x 1 , x 2 ,…, x n , поступает на искусственный нейрон. Эти входные сигналы, в совокупности обозначаемые вектором X , соответствуют сигналам, приходящим в синапсы биологического нейрона. Каждый сигнал умножается на соответствующий вес w 1 , w 2 ,…, w n , и поступает на суммирующий блок, обозначенный S. Каждый вес соответствует “силе” одной биологической синаптической связи. (Множество весов в совокупности обозначается вектором W .) Суммирующий блок, соответствующий телу биологического элемента, складывает взвешенные входы алгебраически, создавая выход, который мы будем называть Y.
Рассмотренная простая модель нейрона игнорирует многие свойства своего биологического двойника. Например, она не принимает во внимание задержки во времени, которые воздействуют на динамику системы. Входные сигналы сразу же порождают выходной сигнал. И, что более важно, данная модель нейрона не учитывает воздействий функции частотной модуляции или синхронизирующей функции биологического нейрона, которые ряд исследователей считают решающими.
Несмотря на эти ограничения, сети, построенные на основе этой модели нейрона, обнаруживают свойства, сильно напоминающие биологическую систему. Только время и исследования смогут ответить на вопрос, являются ли подобные совпадения случайными или следствием того, что именно в этой модели нейрона верно схвачены важнейшие черты биологического прототипа.
Функция F нелинейного преобразователя называется активационной функцией нейрона. Исторически первой была модель, в которой в качестве активационной функции использовалась ступенчатая функция или функция единичного скачка:
То есть по аналогии с биологическим нейроном, когда суммарное воздействие на входе превысит критическое значение, генерируется импульс 1. Иначе нейрон остается в состоянии покоя, то есть выдается 0.
Существует множество других функций активации. Одной из наиболее распространенных является логистическая функция (сигмоид).
При уменьшении ? сигмоид становится более пологим, в пределе при ?=0 вырождаясь в горизонтальную линию на уровне 0.5, при увеличении ? сигмоид приближается по внешнему виду к функции единичного скачка с порогом в точке x=0.
Более крупные и сложные нейронные сети обладают, как правило, и большими вычислительными возможностями. Хотя созданы сети всех конфигураций, какие только можно себе представить, послойная организация нейронов копирует слоистые структуры определенных отделов мозга. Оказалось, что такие многослойные сети обладают большими возможностями, чем однослойные, и в последние годы были разработаны алгоритмы для их обучения.
Многослойные сети могут образовываться каскадами слоев. Выход одного слоя является входом для последующего слоя. Подобная сеть показана на рис. 5 .
Рисунок 5. Двухслойная нейронная сеть.
Многослойные сети не могут привести к увеличению вычислительной мощности по сравнению с однослойной сетью лишь в том случае, если активационная функция между слоями будет нелинейной. Вычисление выхода слоя заключается в умножении входного вектора на первую весовую матрицу с последующим умножением (если отсутствует нелинейная активационная функция) результирующего вектора на вторую весовую матрицу.
Так как умножение матриц ассоциативно, то
Это показывает, что двухслойная линейная сеть эквивалентна одному слою с весовой матрицей, равной произведению двух весовых матриц. Следовательно, любая многослойная линейная сеть может быть заменена эквивалентной однослойной сетью. Однослойные сети весьма ограниченны по своим вычислительным возможностям. Таким образом, для расширения возможностей сетей по сравнению с однослойной сетью необходима нелинейная активационная функция.
Многослойная нейронная сеть может моделировать функцию практически любой степени сложности, причем число слоев и число элементов в каждом слое определяют сложность функции. Определение числа промежуточных слоев и числа элементов в них является важным вопросом при конструировании.
Среди многослойных нейронных сетей можно выделить четыре наиболее значимых и важных класса нейронных сетей:
· сети прямого распространения - все связи направлены строго от входных нейронов к выходным. Такие сети еще называют многослойным персептроном, по аналогии с обычным персептроном Розенблатта, в котором только один скрытый слой;
· реккурентные нейронные сети или сети обратного распространения - сигнал в таких сетях с выходных нейронов или нейронов скрытого слоя частично передается обратно на входы нейронов входного слоя;
· радиально базисные функции - вид многослойной нейронной сети, имеющий скрытый слой из радиальных элементов и выходной слой из линейных элементов. Сети этого типа довольно компактны и быстро обучаются. Радиально базисная сеть обладает следующими особенностями: один скрытый слой, только нейроны скрытого слоя имеют нелинейную активационную функцию и синаптические веса входного и скрытого слоев равны единицы;
· самоорганизующиеся карты или сеть Кохонена. Такой класс многослойных нейронных сетей, как правило, обучается без учителя и успешно применяется в задачах распознавания. Сети такого класса способны выявлять новизну во входных данных: если после обучения сеть встретится с набором данных, непохожим ни на один из известных образцов, то она не сможет классифицировать такой набор и тем самым выявит его новизну. Сеть Кохонена имеет всего два слоя: входной и выходной, составленный из радиальных элементов.
За определенную историю наблюдения за больными, накопился массив данных, которые сохранены в таблице системы STATISTICA. Вид соответствующей Таблицы данных представлен на Рисунке 6.
Рисунок 6. Фрагмент таблицы исходных данных
Целью исследования является построение нейросетевой модели, которая по заданному набору исходных данных (данные обследований больного, результаты анализов, лечение до поступления), на основе назначенного в стационаре лечения выдавала бы прогноз его лечения (значений приём в стационаре И-АПФ\АРА, БАБ, БКК, диуретиков, препаратов центрального действия) с достаточной точностью.
Факт нелинейности задачи не вызывает сомнения. Конечно, можно было бы попробовать решить задачу, воспользовавшись модулем STATISTICA Nonlinear Estimation, а именно при помощи предлагаемых данным модулем итеративных процедур "нащупать" вид функции. Однако здесь есть ряд неприятностей, которые значительно растягивают процедуру поиска решения. Важнейшей из них является формулировка гипотезы о явном виде изучаемой зависимости, которая совсем не является очевидной.
Без дополнительных исследований, о явном виде зависимости сказать что-либо сложно. Тем более, следует упомянуть, что мы не учли еще один фактор. В общем, решение подобной задачи методами нелинейного оценивания может растянуться очень надолго, а может так ни к чему и не привести. В таких критических ситуациях, когда известно, что
-зависимость между переменными есть;
-зависимость определенно нелинейная;
-о явном виде зависимости сказать что-либо сложно,
выручают нейросетевые алгоритмы. Рассмотрим способ решения данной задачи в модуле STATISTICA Neural Networks.
К сожалению, универсальных правил, говорящих о том, какой топологии нейронной сети стоит придерживаться для решения той или иной задачи нет. Поэтому, необходима разумная процедура поиска нужной сети.
Модуль Neural Networks системы STATISTICA включает в себя процедуру, организующую поиск нужной конфигурации сети. Эта процедура заключается в построении и тестировании большого количества сетей с разными архитектурами и послудующем выборе из них той сети, которая лучше всего подходит для решения поставленной задачи. Данный инструмент называется Intelligent Problem Solver. Для запуска модуля Neural Networks необходимо воспользоваться одноименной командой основного меню системы STATISTICA - Statistics. (рисунок 7)
Рисунок 7. Запуск модуля Neural Networks
Очень распространенным является следующий тезис: "нейронные сети представляют собой универсальную структуру, позволяющую реализовать любой алгоритм". Попробуем, слепо веря данному утверждению, построить нейронную сеть, которая бы "уловила" предлагаемую зависимость сразу (имеется в виду, без предварительного, разведочного анализа).
Одним из важнейших вопросов, до сих пор, не решенных современной наукой, является вопрос о структуре нейронный сети, которая была бы способна к воспроизведению искомой многомерной нелинейной зависимости. Да действительно, теорема Колмогорова о полноте, доказанная им еще 1957 году, утверждает, что нейронная сеть способна воспроизвести любую (очень важно - непрерывную) функцию. Однако она не прелагает исследователю рецепта по созданию такой сети. В 1988 году, ряд авторов обобщили теорему Колмогорова и показали, что любая непрерывная функция может быть аппроксимирована трехслойной нейронной сетью с одним скрытым слоем и алгоритмом обратного распространения ошибки с любой степенью точности. Таким образом, в нашем случае положительным аспектом является знание того, что сеть должна быть трехслойной, но опять-таки в распоряжении нет правил, устанавливающих зависимость между "любой степенью точности" и количеством нейронов на промежуточном, так называемом скрытом слое.
Резюмируя все вышесказанное, отметим, что универсальных правил, говорящих о том, какой топологии нейронной сети стоит придерживаться для решения той или иной задачи нет. Поэтому, необходима разумная процедура поиска нужной сети.
Модуль Neural Networks системы STATISTICA включает в себя уникальную процедуру, организующую поиск нужной конфигурации сети. Данный инструмент называется Intelligent Problem Solver. Воспользуемся этим инструментом и осуществим поиск нейронной сети, которая будет способна к решению нашей задачи.
Рисунок 8. Стартовая панель модуля Neural Networks
Во вкладке Quick (Быстрый) данного диалогового окна в разделе Problem Type ( Класс задач) предлагается осуществить выбор того класса задач, с которым мы столкнулись. Нашей целью является построение многомерной зависимости или, другими словами, многомерной нелинейной регрессии. Значит, в разделе Problem Type - Класс задач следует указать Regression (Регрессия).
Определившись с классом задач, необходимо указать переменные для проведения Анализа. Для того чтобы выбрать переменные, воспользуемся кнопкой Variables. При нажатии данной кнопки появляется диалоговое окно Select input (independent), output (dependent) and selector variables (Укажите входные (независимые), выходные (зависимые) и группирующие переменные). В данном диалоговом окне необходимо задать два списка переменных. Continuous outputs (Непрерывные выходящие), в нашем случае, - это переменные Приём в стационаре И-АПФ/АРА, Приём в стационаре БАБ, Приём в стационаре БКК, Приём в стационаре диуретиков и приём в стационае препаратов центрального действия . Continuous inputs (Непрерывные входящие), в нашем примере, - это с 1 по 61 исходный параметр.
Рисунок 9. Выбор переменных для анализа
В разделе Select analysis (Выбор анализа ) доступны две опции Intelligent Problem Solver и Custom Network Designer. Для автоматического подбора параметров нейронной сети требуется первая опция, которая устанавливается по умолчанию. Для продолжения Анализа необходимо нажать кнопку OK.
На следующем шаге появляется диалоговое окно настройки процедуры Intelligent Problem Solver.
Раздел Quick (Быстрый) содержит группу опций, отвечающих за время исполнения алгоритма поиска нейронной сети. На этой вкладке необходимо задать количество сетей, которые необходимо протестировать (выяснить подходят ли они для решения сформулированной задачи), а также указать, сколько из этих сетей войдут в итоговый отчет.
В разделе Networks tested (Количество тестируемых сетей) укажем 100, Networks retained (Количество сохраненных сетей) -- 10 (Рисунок 10)
На вкладке Types указывается, какие типы нейронных сетей будут использованы в процессе тестирования. Для решения задачи нелинейной регрессии больше всего подходит многослойный персептрон, поэтому выбираем сети, отмеченные на рисунке 11.
Рисунок 10. Задание количества тестируемых сетей
Далее, для организации процесса перебора и тестирования необходимо указать диапазон изменения количества нейронов в каждом слое нейронной сети. Рекомендуемые для данной задачи значения указаны на рисунке 12.
Рисунок 12. Указание размеров обучающей, контрольной и тестовой выборок
Теперь, после задания всех параметров обучения, для запуска процедуры поиска сетей необходимо нажать кнопку ОК.
Состояние алгоритма поиска отображается в диалоговом окне IPS Training In Progress (Процесс поиска сети).
Во время работы алгоритма поиска подходящей нейронной сети в этом диалоговом окне приводится информация о времени исполнения алгоритма, а так же о рассмотренных нейронных сетях. Цель алгоритма поиска - перебор ряда нейросетевых конфигураций и выбор наилучшей с точки зрения минимума ошибки на выходе сети и максимума её производительности.
В результате, каждая обученная и проверенная нейронная конфигурация описывается строкой в информационном поле диалогового окна. Наиболее важными показателями здесь являются Profile (Тип сети), Train (Select, Test) Performance (Производительность сети на обучающем (контрольном, тестовом) множестве) и Train Error (Ошибка обучения).В разделе Profile - Тип сети описывается топология нейронной сети, т.е. класс сетей, к которому она принадлежит (в нашем случае -MLP, то есть персептрон), количество входных и выходных переменных, количество скрытых слоев и число элементов на каждом скрытом слое. На рисунке 13 изображено диалоговое окно результатов поиска сети. Здесь приводятся 10 лучших нейросетевых конфигураций среди 100, рассмотренных программой.
Рисунок 13. Диалоговое окно результатов поиска сети
Для окончательного выбора единственной наилучшей сети сравним эти сети по значениям различных ошибок.
После выделения какой-либо сети в списке на рисунке 13 и нажатия кнопки Descriptive statistics появляется окно с характеристиками данной нейросетевой модели. (Рисунок 14). В нем приводятся значения Data Меаn (среднее данных) для каждого прогнозируемого параметра, Data S.D. (среднеквадратическое отклонение данных), Еrror Mean (средняя ошибка прогноза), Еrror S.D. (среднеквадратическое отклонение ошибки прогноза), Аbs E. Mean (средняя абсолютная ошибка прогноза), SD Ratio (отношение среднеквадратического отклонения ошибки прогноза к среднеквадратическому отклонению данных), Сorrelation (величина корреляции между реальными и спрогнозированными данными).
Рисунок 15. Таблица ошибок регрессии, построенной выбранной сетью
Выберем сеть с наилучшими показателями. Значение ошибки «SD Ratio» является наиболее пригодной для целей сравнения, потому как представляет собой число между 0 и 1, зависит лишь от величины каждой составляющей ошибки (не зависит от знака), а также довольно восприимчиво к выбросам. Эмпирическое правило гласит, что если SD Ratio не превышает значения 0.2, сеть подобрана хорошо, если SD Ratio находится в пределах от 0.2 до 0.4 - то удовлетворительно, а если больше 0,4 - то неудовлетворительно.
В нашем примере лишь одна сеть из сохраненных программой, оказалась близка к хорошему качеству прогнозирования, но только по одному параметру.
Исследуем поподробнее выбранную сеть (она имеет номер 13, то есть она в процессе тестирования была сформирована 13-й)
Архитектура этой сети проведена на рисунке 16. Эта сеть имеет 61 вход, 30 нейронов в первом слое, 29 нейронов во втором слое, 5 нейронов в третьем слое и 5 выходов.
Рисунок 16. Архитектура лучшей сети
Графической иллюстрацией качества работы нейронной сети является график зависимости наблюдаемых значений выходных переменных от предсказанных значений. Для построения такого графика необходимо воспользоваться кнопкой Graph X versus Y - График X от Y, расположенной во вкладке Plots - Графики. При этом, предварительно указав в качестве X - axis - Observed - Наблюдаемые, Y - axis - Predicted - Предсказанные. Результаты построения графиков приведены на рисунках17-21.
Рисунок 17. Приём в стационаре И-АПФ\АРА
Рисунок 20. Приём в стационаре диуретиков
Рисунок 21. Приём в стационаре препаратов центрального действия
Если модель построена хорошо, то точки этого графика должны располагаться как можно ближе к прямой, лежащей под углом 45 градусов к осям координат.
На этом графике отчетливо видно отсутствие какой-либо зависимости между наблюдаемыми и предсказанными значениями.
На первый взгляд может показаться, что мы получили, противоречащий теореме Колмогорова о полноте, результат. Однако, как мы уже упоминали ранее, теорема работает только с непрерывными функциями. В нашем же случае, имеются серьезные основания полагать, что функция изучаемого физического процесса не является непрерывной.
Судя по полученным результатам, среди множества данных есть и "островки стабильности". Иначе говоря, можно с большой долей уверенности предположить, что в некоторых областях пространства независимых переменных функция процесса ведет себя непрерывно.
Для нас крайне желательно такие области локализовать. Для этого осуществим разбиение данных на однородные группы, или проведем кластеризацию.
Термин кластерный анализ (впервые ввел Tryon, 1939) в действительности включает в себя набор различных алгоритмов классификации. Общий вопрос, задаваемый исследователями во многих областях, состоит в том, как организовать наблюдаемые данные в наглядные структуры.
Существует точка зрения, что в отличие от многих других статистических процедур, методы кластерного анализа используются в большинстве случаев тогда, когда вы не имеете каких-либо априорных гипотез относительно классов, но все еще находитесь в описательной стадии исследования. Следует понимать, что кластерный анализ определяет "наиболее возможно значимое решение". Поэтому проверка статистической значимости в действительности здесь неприменима, даже в случаях, когда известны p-уровни (как, например, в методе К-средних).
Нашу выборку данных желательно разбить на 2-4 кластера. Выберем количество кластеров 3 и разобъём по методу К -средних.
Общая логика метода: Предположим, уже имеются гипотезы относительно числа кластеров (по наблюдениям или по переменным). Можно указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.
Выберем в меню пункт Statistics- Multivariate Exploratory Techniques -Cluster Analysis
В открывшемся окне выберем метод К-средних (Рисунок 22).
Во вкладке Advanced выбираем 3 кластера и 10 итераций по умолчанию (Рисунок 23).
Рисунок 23. Выбор числа кластеров и итераций
Сохраняем полученный результат (Рисунок 24).
Рисунок 24. Выбираем Save Classifications and distances
Рисунок 25. Полученное разбиение на кластеры
Описанным выше способом в разделе 3.1 , строим нейронные сети для каждого кластера.
В результате для каждого кластера найден
Нейросетевая экспертная система медицинской диагностики дипломная работа. Программирование, компьютеры и кибернетика.
Курсовая работа по теме Производственно-техническая база системы автотехобслуживания
Реферат На Тему Государственный Стандарт Общего Образования
Реферат по теме Выборы в США. Полковник Аарон Бэрр
Сочинение По Английскому Мой Класс 6 Класс
Реферат: Война в Афганистане с 2001
Отчет по практике по теме Финансовый анализ бюджета муниципального образования города Казани
Курсовая работа по теме Налоги во внешнеэкономической деятельности и их влияние на результаты работы компании
Дневник По Клинической Практике Ветеринария
Надо Верить Сочинение
Писатель Написал Сочинение По Своему Рассказу
Курсовая работа по теме Ценовая политика event-агентства 'Крона'
Курсовая работа по теме Себестоимость продукции предприятия
Иван Шмелев Собрание Сочинений Купить
Курсовая работа по теме Философия истории
Дипломная работа по теме Особенности юридической ответственности в сфере управления строительством
Курсовая работа: Расчёт и проектирование маломощных биполярных транзисторов. Скачать бесплатно и без регистрации
Курсовая работа по теме Проблема социального сиротства
Дипломная работа: Исследование свойств продуктов циклизации алициклического 1,5,9-трикетона
Реферат по теме Демократия: теория и политическая практика
Русловая Структура Горных Рек Кыргызстан Курсовая Работа
Русловые исследования - Геология, гидрология и геодезия реферат
Влияние организационно-технологических особенностей производства на построение учета затрат предприятий различных отраслей экономики - Бухгалтерский учет и аудит курсовая работа
Сущность права и его функции - Государство и право презентация