Создание классификатора, основанного на нейронной сети и способного определять качество вина - Программирование, компьютеры и кибернетика дипломная работа

Создание классификатора, основанного на нейронной сети и способного определять качество вина - Программирование, компьютеры и кибернетика дипломная работа




































Главная

Программирование, компьютеры и кибернетика
Создание классификатора, основанного на нейронной сети и способного определять качество вина

Различные методы решения задачи классификации. Нейросетевые парадигмы, методы обучения нейронных сетей, возникающие при этом проблемы и пути их решения. Описание программной реализации классификатора, его функциональные возможности и результаты обучения.


посмотреть текст работы


скачать работу можно здесь


полная информация о работе


весь список подобных работ


Нужна помощь с учёбой? Наши эксперты готовы помочь!
Нажимая на кнопку, вы соглашаетесь с
политикой обработки персональных данных

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Когда-то вино было товаром роскоши, доступное лишь небольшой доле населения. Но благодаря развитию технологий производства и росту благосостояния среднестатистического жителя мира, каждый человек может купить бутылка вина и насладиться его вкусом.
Каждый производитель вина сталкивается с необходимостью его оценки и сертификации. Сертификации позволяет гарантировать, что вино соответствует стандартам и является безопасным для употребления продуктом. Оценка вина позволяет определить его качество с точки зрения человеком, то есть насколько хорош его вкус, запах и т. д. Ее результаты могут быть использованы для улучшения процесса производства, для распределения вин по брендам и определения их цены. Оценка иногда является частью процесса сертификации.
Существует два основных метода, которые используются при сертификации вина. Первый из них основывается на физико-химическом анализе. При этом проверяются, в частности, такие параметры, как цвет вина, наличие примесей, количество содержащегося алкоголя, сахаров и различных кислот. Вторым методом является сенсорный анализ. Он основан на использование в качестве оценочного прибора специально обученного человека - дегустатора. В процессе работы, дегустатор должен определить качество вина основываясь на своих знаниях и используя свои органы чувств.
Зависимость между физико-химическими свойствами вина и результатом дегустации является крайне сложной и запутанной, и в настоящее время она до конца не определена. Из этого следует, что с помощью физико-химического анализа сложно дать ответ на вопрос, насколько хорошо будет вино с точки зрения покупателя, и, следовательно, нельзя отнести вино к определенному бренду. С другой стороны, дегустатор определяет качество вина исходя из своих субъективных понятий о «хорошем» и «плохом» винах. Это приводит к тому, что вино, выигравшее некоторый конкурс, может не получить никаких наград в другом соревновании, а оценки разных дегустаторов, данные одному и тому же вину, могут сильно различаться. Подобные происшествия подрывают доверие к существующей системе оценивания вин, от чего могут пострадать как производители, которые не смогут разделить свою продукцию по уровню качества и, соответственно, цене. Так и потребители, которые потеряют возможность выбирать вино по качеству, и, по сути, будут приобретать «кота в мешке». Следовательно, в сфере производства винно-водочной продукции существует потребность в исследовании возможности создания некоторого классификатора, который бы мог определять качество вина по его химическому составу, руководствуясь лишь математическими алгоритмами.
Развитие информационных технологий привело к созданию ряда методов анализа данных. Подобные методы позволяют осуществлять поиск взаимосвязей между различными наборами данных. Как правило, работа идет с большими и сложными наборами информации, обработка которых требует больших вычислительных ресурсов. Появление данных методов дало толчок к развитию исследований в области создания классификаторов. В качестве примера можно привести работу 2007 года, в которой, используя вероятностную нейронную сеть, исследователи смогли с точностью в 94.77% правильно классифицировать год производства вина и место расположения виноградника [8]. В этой работе в качестве информации о вине использовались результаты хроматографии. В 2001 году нейронные сети использовались для определения трех сенсорных характеристик вина, произведенного в Калифорнии, основываясь на информации об уровне зрелости винограда и результатах химического анализа [12].
В данной работе исследуется возможность создания классификатора, основанного на нейронной сети и способного определять качество вина. В качестве данных для анализа используется информация о составе вин и оценках данных им дегустаторами. Набор данных охватывает вина, созданные в Португалии в провинции Минью с мая 2004 по февраль 2007 годов. Данные были предоставлены исследователями Paulo Cortez, Antonio Cerdeira, Fernando Almeida, Telmo Matos, Jose Reis в их статье «Modeling wine preferences by data mining from physicochemical properties» [9]. В ходе выполнения работы необходимо выполнить следующие пункты:
· Рассмотреть существующие математические методы классификации, и сравнить их с нейронными сетями применительно к данной задаче;
· Рассмотреть различные нейросетевые парадигмы, и оценить их с точки зрения задачи классификации;
· Построить математическую модель классификатора для решения данной задачи, реализовать и обучить его;
В данной работе в первой главе рассматриваются различные методы решения задачи классификации, и оценивается их применимость к задаче классификации винно-водочных изделий. Во второй главе анализируются различные нейросетевые парадигмы, методы обучения нейронных сетей, возникающие при этом проблемы и пути их решения. В третьей главе описано построение классификатора с учетом особенностей решаемой задачи. В четвертой главе приведено описание программной реализации классификатора, его функциональные возможности и результаты обучения. В пятой главе содержится анализ результатов тестирования классификатора.
Задача классификации заключается в определении, какому классу принадлежат наблюдаемые объекты, основываясь на некотором предварительно известном наборе пар, состоящих из описания объекта и класса, которому этот объект принадлежит. Описание объекта представляет собой набор измеренных характеристик.
Математическая постановка задачи выглядит следующим образом: есть множество непересекающихся классов и множество описаний объектов . Есть неизвестная зависимость между множествами Есть также некоторый известный набор пар, такой, что. Требуется на основе этого набора найти функцию, способную классифицировать любой объект из X.
Существует множество различных методов классификации объектов. Выбор метода для решения поставленной задачи необходимо осуществлять исходя из особенностей предметной области.
Для решения задач классификации в 1963 году В. Вапник и А. Червоненкис предложили метод, названный ими методом опорных векторов. Метод основан на поиске гиперплоскости в пространстве признаков, оптимально разделяющей объекты на классы. Набор признаков, характеризующий один определенный объект, называется вектором. Допустим, мы имеем набор пар , изображенный на рисункеРис. 1.
Рис. 1 . Пример разделяющей гиперплоскости
Гиперплоскостью в некотором пространстве называется подпространство с размерностью, меньшей на 1, чем размерность самого пространства. Тогда в двумерном пространстве гиперплоскостью будет прямая. Можно построить несколько прямых, разделяющих два класса, как показано на рисунке. Идея метода заключается в том, что для решения задачи классификации лучше всего выбрать такую гиперплоскость (а в данном случае - прямую), чтобы расстояние от нее до ближайших элементов классов было максимально. Пример подобной оптимально разделяющей гиперплоскости можно увидеть на рисункеРис. 1. Это прямая, нарисованная красным цветом. Вектора, которые расположены ближе всего к разделяющей гиперплоскости, называют опорными векторами. На рисунке они отмечены с помощью кругов [11].
Не всегда наборы векторов являются линейно-разделимыми. На рисунке Рис. 2 показан пример, в котором невозможно найти прямую линию, которая бы разделяла два класса. В таком случае, можно использовать преобразование, которое бы переводило вектора в пространство большей размерности. Тогда, согласно теореме Ковера, после такого преобразования, с высокой долей вероятности можно получить линейно-разделенные классы [1].
Рис. 2 . Пример линейно-не разделимых классов
Нейронная сеть представляет собой математическую модель биологической нейронной сети. Она состоит из множества простых устройств - нейронов, соединенных между собой. Каждый нейрон принимает сигнал, преобразует его, и затем посылает преобразованный сигнал другим нейронам.
Отличительной особенностью нейронных сетей является то, что они обучаются для решения некоторой определенной задачи. С математической точки зрения, в ходе обучения происходит задание коэффициентов связей между нейронами. Нейронная сеть способна в процессе обучения находить сложные взаимосвязи между элементами входных и выходных данных. Также, нейронные сети способны к обобщению, то есть выдавать правильный ответ на данных, которые не участвовали в обучение.
Это набор вероятностных методов классификации. Они основаны на теории, что если известны плотности распределения классов, то можно в явном виде выписать алгоритм классификации. Причем, при использовании этого алгоритма, вероятность ошибки будет минимальна. Принцип действия байесовского классификатора состоит из следующих шагов:
1 Вычислить для объекта функция правдоподобия каждого класса;
2 Вычислить апостериорные вероятности;
3 Отнести объект к тому класса, апостериорная вероятность которого оказалась самой высокой.
Если при решении задачи неизвестны плотности распределения классов, то их необходимо вычислить по обучающей выборке. Есть множество методов восстановления плотности распределения, и, вследствие этого, существует множество различные байесовских алгоритмов. Если предположить, что признаки, описывающие объект, являются независимыми, то можно упростить построение классификатора. Но, так как на практике, признаки редко бывают независимыми, это приведет к уменьшению точности классификации объектов [7].
Рассмотрим описанные в данном разделе методы решения задачи классификации с точки зрения их применимости к решению задач классификации винно-водочных изделий. Исходные данные обладают следующими характеристиками:
· Они разбиты на две группы: белые вина и красные вина. Неизвестно, насколько важен тип вина при определении уровня качества;
· Имеется довольно большая выборка примеров, в сумме около 6 тыс.;
· Каждый объект характеризуется 11 параметрами, что означает, что размерность пространства признаков невелика;
· Данные представлены в числовом виде.
Метод опорных векторов обладает большой вычислительной сложностью, и для его использования желательно иметь большее пространство признаков, чем имеется в данной задаче.
Изначально отсутствует статистическая информация об исходных данных, что затрудняет использование байесовского классификатора.
Нейронные сети способны к решению задач классификации, наборы данных в которых являются линейно-неразделимыми. К тому же, нейронные сети показали способность к аппроксимации произвольной функции с любой желаемой точностью [2]. Вследствие этого, использование нейронных сетей для решения данной задачи является предпочтительным вариантом.
Сразу после своего рождения человек не обладает никакой информацией об окружающем мире. Но он способен получить ее с помощью своих органов чувств, таких как зрительная система или слуховой аппарат. Получая сигналы о мире, человек реагирует на них некоторым образом. Его реакция способна вызвать изменения в поступающих сигналах, что, в свою очередь, вызовет другую реакцию. Некоторые сигналы могут быть однозначно распознаны как негативные, например боль, другие же будут восприниматься как позитивные - приятный запах или чувство сытости. Обладая от природы способностью к сопоставлению своих действий и последующего результата, человек вырабатывает алгоритмы поведения для минимизации негативных сигналов и оптимизации позитивных. Подобная способность к самообучению является крайне интересной, так как ее понимание позволит решить множество задач, например, создавать алгоритмы обработки информации, которые автоматически подстраиваются под вводимые данные с целью улучшения результата. Человек обладает такой возможностью благодаря его мозгу - биологической нейронной сети огромных масштабов.
Интерес представляет не только способность к самообучению, но и то, какие алгоритмы созданы человеческим мозгом для решения ряда ежедневных задач, такие как распознавание образов (человек способен с высокой точностью отличать людей друг от друга или принятие решений, особенно в условиях недостатка информации). Для таких задач существуют различные математические методы их решения, но зачастую они проигрывают человеку в скорости работы и точности. Следовательно, можно предположить, что достаточно точная модель человеческого мозга покажет сходную эффективность в таких задачах. Также, исследование модели, успешно справляющейся с некоторым классом задач, позволит больше понять как о самой проблематике задачи, и ее способах решения, так и об алгоритмах человеческого мышления.
Искусственная нейронная сеть, как следует из названия, представляет собой попытку построить такую модель. Понятие нейронных сетей включает в себя широкий класс объектов, различия между которыми могут быть довольно велики, но все они строятся на основе следующих принципов:
· информация в нейронной сети обрабатывается с помощью множества однотипных элементов. Такой элемент называется “нейрон”;
· каждый нейрон обладает входом, выходом, и некоторой функцией, преобразующей вход в выход. Данная функция называется функцией активации нейрона;
· выход любого нейрона может быть связан с входом одного или нескольких нейронов. Такая связь называется “синаптической”;
· синаптическая связь при передаче сигнала некоторым образом преобразует его. Обычно каждой синаптической связи в соответствие проставляется некоторое число, и при передаче сигнала он просто перемножается с этим числом;
· в случае если к входу одного нейрона присоединено несколько синаптических связей, то приходящие по ним сигналы некоторым образом преобразуются перед подачей в нейрон. Обычно они просто суммируются.
Искусственные нейронные сети, также как и биологические, обладают свойством отказоустойчивости, которое состоит из двух частей. Во-первых, нейронная сеть способна к обработке и распознаванию сигналов, отличающихся от тех, что ранее в нее поступали. Например, когда человек видит новую для себя модель автомобиля, он понимает, что это именно автомобиль, а не что-то другое. Такой вывод он способен сделать благодаря тому, что новый автомобиль похож, хоть и не полностью, на те, что он уже видел. Во-вторых, если по некоторой причине происходит повреждение нейронной сети, то она часто оказывается способной продолжить свою работу, пусть и зачастую с ухудшением качества результата [4].
Благодаря своим особенностям, нейронные сети нашли применение во многих областях, таких как:
· Авиационно-космическая отрасль: автопилоты, тренажеры для пилотов, детекторы неисправностей для различных подсистем самолета;
· Автомобильные системы автоматического управления;
· Банковская сфера: системы для оценки кредитоспособности клиентов, для автоматического определения использования краденых карт по особенностям совершенных транзакций;
· Армия: системы обнаружения, ведения цели, распознавание цели по радарному отклику;
· Электроника: нелинейное моделирование, компьютерное зрение, распознавание и синтезирование речи.
Мозг человека состоит из миллионов базовых элементов - нейронов. С точки зрения моделирования работы мозга, каждый нейрон можно разделить на три части: дендрит, аксон, и тело нейрона. Дендриты представляют собой длинные сети, задача которых заключается в распространении электрических сигналов к телу нейрона. Тело, в свою очередь, каким-то образом обрабатывает полученный сигнал и выдает ответ с помощью аксона, который распространяет его вдоль себя. Нейроны работают не независимо друг от друга, дендриты каждого нейрона соединены с аксонами других нейронов. Таким образом, в биологическом мозге происходит распространение сигналов от одного нейрона к другим. На рисунке Рис. 3 изображена схематическая схема нейрона.
Рис. 3 . Схема биологического нейрона
Часть структуры головного мозга закладывается при рождении и сохраняется в неизменном виде в течение всей жизни человека. Другие части мозга способны изменяться со временем. В ходе подобных изменений происходит изменение структуры связей между нейронами. Новые связи появляются, а старые исчезают. Какие-то связи усиливаются, в результате чего сигнал от одного нейрона до другого доходит почти в неизмененном виде. Другие связи могут ослабеть, и сигнал будет доходить плохо. Наиболее активно процесс формирования и изменения связей между нейронами происходит в начале жизни [6].
При создании искусственной нейронной сети происходит моделирование двух особенностей настоящей нейронной сети:
· В основе сети лежит использование простых базовых компонентов - нейронов;
· Нейроны соединяются друг с другом, и структура этих соединений определяется задачами, возложенными на сеть.
Несмотря на то, что скорость работы биологических нейронов и скорость распространения электрических сигналов по нервным волокнам между нейронами на несколько порядков меньше скорости, с которой могут функционировать электронные схемы, человеческий мозг способен справляться с объемными и вычислительно сложными задачами за крайне короткий промежуток времени. Подобная производительность возможна за счет того, что структура мозга представляет собой параллельную систему. В такой системе все нейроны работают одновременно. Для того, чтобы некоторый нейрон был способен произвести вычисления и определить свое состояние в следующий момент времени, ему необходима информация о текущем состояние только тех нейронов, которые расположены рядом с ним и к которым он подсоединен с помощью дендритов.
Искусственные нейронные сети также обладают способностью к параллельной обработке сигналов. И хотя для исследования и конструирования нейронной сети обычно используются программы, работающие на обычных компьютерах с последовательной системой выполнения команд, после завершения проектирования сети ее можно реализовать физически, получив преимущества параллельной обработки [6].
Рассмотрим структуру отдельного нейрона - базового компонента нейронной сети. Она представлена на рисунке Рис. 4.
Символами обозначены входные значения нейронов. Это могут быть как выходные значения других нейронов, так и входные данные. - весовые коэффициенты синаптических связей. Каждое входное значение умножается на соответствующий коэффициент. Затем, как следует из схемы, перемноженные значения суммируются. К полученному результату добавляется смещение . На рисунке, для упрощения структуры нейрона, представляется как синаптическая связь с весовым коэффициентом , соединенная с выходом “виртуального” нейрона, вход которого ни с чем не связан, а выходное значение всегда равно 1. Полученная сумма подается на вход функции активации , результат работы которой и будет выходным значением нейрона.
Смещение является важным понятием нейронной сети. Биологический нейрон реагирует на раздражитель, только если величина воздействия превышает некоторый определенный порог. Для имитации подобного поведения в искусственную нейронную сеть и введено понятие смещения. Для примера, допустим, что функцией активации нейрона является функция Хэвисайда, которая определяется следующим образом:
Причем Тогда при заданных весовых коэффициентах и входных значениях, выход нейрона можно регулировать путем изменения величины смещения, а именно коэффициента .
Как правило, конкретная функция активации выбирается исследователем в зависимости от особенностей исследуемой проблемы, а значения весов подбираются в ходе настройки сети под конкретную задачу. Подобная настройка зовется процессом обучения нейронной сети.
Для решения многих задач одного нейрона недостаточно. В таких случаях может потребоваться использование группы нейронов, работающих параллельно. Подобная группа нейронов называется слоем нейронной сети. Пример сети из одного слоя приведен на рисункеРис. 5.
В данной сети содержится R нейронов с одинаковой активационной функцией. В качестве входа в сеть выступает вектор размерности S, выходом является вектор размерности R. Каждый вход сети связан с каждым нейроном с помощью синаптической связи с весом , где i - номер входа, j - номер нейрона. Также у каждого нейрона есть смещение, представленное в виде нейрона с выходом, равным 1, и соответствующим весом связи, равным .
В случае, если необходимо задать слой сети, в котором часть нейронов обладает одной активационной функцией, а часть - другой, можно взять две сети, подобных той, что изображена на рисунке Рис. 5, и скомбинировать их в одну. Тогда обе сети будут иметь одни и те же входы, и каждая сеть будет генерировать часть выходного вектора.
Персептрон - это одна из первых моделей нейронной сети. Несколько возможных типов персептронов были предложены в 1957 г. Ф. Розенблаттом [4]. Описанный им персептрон предназначен для классификации линейно-разделимых сигналов. Изначально предполагалось, что персептрон будет реализован аппаратно, а не в качестве программы для компьютера, и позже был создан один из первых нейрокомпьютеров, который использовался для распознавания изображений, считывавшихся с набора фотосенсоров. Изначально персептрон состоял из трех слоев: сенсорный, ассоциативный и реагирующий (выходной), но позже был создан ряд модификаций. Схема оригинального персептрона с указанием слоев приведена на рисунке Рис. 6. Он был сформирован как приблизительная модель сетчатки [4].
Рис. 6 . Схема оригинального персептрона
В ходе итеративного обучения персептрона возможно, если выполнен ряд предположений, достигнуть таких значений весов, что нейронная сеть будет выдавать точный ответ для любого использованного в ходе обучения примера. Конечно, одним из таких предположений является предположение о существовании подобных весов.
Одной из интересных реализаций персептрона является вариант с использованием бинарных значений активации для сенсорного и ассоциативного слоев и значениями активации их множества {-1, 0, 1} для реагирующего слоя. Веса, соединяющие сенсорный и ассоциативный слой, принимают значение -1, 0 или 1, фиксированы, и задаются случайным образом.
Функцией активации ассоциативного слоя является индикаторная функция с некоторым фиксированным порогом, определяемая выражением (3).
Где, соответственно, - значение веса, соединяющего i-й вход с нейроном, - это i-й компонент входного вектора, - некоторое фиксированное пороговое значение. Таким образом, выходной вектор ассоциативного слоя состоит из единиц и нулей. Активационная функция нейрона из реагирующего слоя описывается следующей формулой:
В ходе тренировки персептрона происходит изменение только весов, соединяющих ассоциативный и выходной слои, остальные веса являются фиксированными. Сама процедура тренировки выглядит следующим образом:
2. Рассчитать значения ошибок между компонентами выходного и ожидаемого векторов;
3. Если сеть выдала ошибочный ответ, то на основании значения ошибки произвести изменение весов;
4. Повторять пункты 1-3 до достижения необходимого результата.
Рассмотри этапы тренировки более подробно. На первом этапе исследователь получает от сети выходной вектор. При рассмотрении разницы между ним и ожидаемым выходом, имеет значение только знак ошибки. То есть, нет никакой разницы между следующими двумя случаями:
· Сеть вернула в i-м компоненте выходного вектора 1, а ожидалось -1;
· Сеть вернула в i-м компоненте выходного вектора 0, а ожидалось -1.
В обоих случаях знак ошибки одинаков, и определяет направление, в котором в ходе корректировки должны изменяться весовые коэффициенты. Затем, на втором этапе, значения весов корректируются по формуле (5):
где - это скорость обучения, и она задается исследователем, - определяется знаком ошибки, - величина сигнала, прошедшего по соответствующей синаптической связи. Стоит заметить, что будут скорректированы только те веса, по которым прошел ненулевой сигнал, так как только такие веса внесли свою долю в величину ошибки. Если сеть выдала на тестовый пример правильный ответ, то веса не корректируются.
Обучение продолжается до тех пор, пока персептрон не перестанет совершать ошибки. Согласно теореме о сходимости обучения персептрона, если существует такой набор значений весов синаптических связей, который позволит персептрону выдавать верный результат на все обучающие примеры, то такой набор будет найден, и, более того, это произойдет за конечное число шагов [4].
Так как результатом работы нейрона в ассоциативном слое является 0 или 1, и веса между сенсорным слоем и ассоциативным не меняются в ходе обучения, то при построении классификатора можно упростить сеть, если вектор признаков объекта уже является бинарным. Тогда входной слой может играть роль ассоциативного слоя. Пример структуры сети для решения задачи об определении принадлежности объектов к одному классу приведен на рисункеРис. 7.
Хотя после своего появления в 1960-х годах, персептроны привлекли много внимания, и на них возлагались большие надежды, дальнейшее изучение показало, что набор проблем, который можно решить с их помощью, является крайне ограниченным. В то время, как персептрон успешно решал одни задачи, решение других, которые казались на первый взгляд ничуть не сложнее, оказалось для него невозможным.
Рис. 7 . Простейший классификатор на основе персептрона
Классическим примером является проблема реализации с помощью персептрона функции “исключающего или”, известная как проблема отделимости [13]. Это является следствием того, что однослойный персептрон способен решать задачу классификации только для линейно-разделенных наборов признаков.
Столкнувшись с проблемой линейно-неразделенных данных, в некоторых случаях можно попытаться преобразовать входные данные. Целью является нахождение такой функции, чтобы преобразованные величины были линейно-разделенными. В таком случае, задав соответствующие ассоциативные элементы, можно построить персептрон для решения данной задачи. Но, соответственно возникает вопрос, как выбрать необходимое преобразование. Ответ на этот вопрос не всегда возможно получить, и зависит он от конкретной задачи [2].
Однако то, что связи между входным слоем и ассоциативным фиксированы, и не могут быть адаптированы в ходе обучения под конкретную задачу, представляет собой большую проблему. Вследствие этого, при увеличении размерности входных данных, необходимое число нейронов, занимающихся предварительным преобразованием, и сложность соответствующих функций, растет крайне быстро. Минский и Паперт в своей книге “Персептроны” (1969) рассматривают разные структуры персептрона, в зависимости от использовавшегося в них преобразования входных данных. И в каждом случае они находят примеры проблем, которые не могут быть решены персептроном приведенной структуры [2].
Из рассмотренных ограничений персептрона следует, что необходимо сконструировать сеть с адаптивными весами между входным и ассоциативным слоями. Это приводит нас к рассмотрению многослойных сетей.
Одним из самых распространенных типов нейронных сетей являются многослойные сети. В основе структуры данного типа сетей лежит понятие слоя, рассмотренное ранее. Причем входы нейронов слоя связаны с выходами нейронов одного или нескольких других слоев.
Рис. 8 . Многослойная нейронная сеть
Набор “виртуальных” нейронов, с помощью которых в нейронную сеть подаются входные данные, называют входным слоем. Слой нейронов, чьи выходы считаются выходом сети, называется выходным слоем. Остальные слои нейронной сети имеют название скрытых слоев. В различной литературе входной слой может участвовать или не участвовать в подсчете общего количества слоев нейронной сети. Здесь и далее, входной слой не будет учитываться при указании количества слоев сети.
На рисункеРис. 8 указан пример двухслойной сети, у которой выход первого, скрытого, слоя соединен с входом второго, выходного, слоя. Для обозначения весов связей между выходами и входами нейронами двух слоев удобно использовать матрицы. Пусть вход слоя соединен с выходом слоя с i нейронами, а в самом слое содержится j нейронов. Тогда связь между слоями будет описывать матрица размера , составленная из коэффициентов , равных весу при синаптической связи, соединяющей выход i-го нейрона предыдущего слоя, с входом j-го нейрона описываемого слоя. При этом величины используют для описания смещения j-го нейрона. Если теперь задать вектор входных значений X размера j+1, в котором описывает входное значение j-го нейрона, а служит для описания смещения и поэтому равен 1, то можно получить вектор , составленный из значений активации нейронов.
Если соответствующим образом определить функцию активации , принимающую на вход вектор U, то получим формулу (7) для выхода слоя в матричной форме.
Многослойные сети прямого распространения, обучаемые методом обратного распространения ошибки, как правило, успешно решают задачи классификации и аппроксимации функции с любой, заранее заданной, точностью [6].
В 1988 году Брумхед и Лоу представили архитектуру нейронной сети, основанной на использование радиально-базисных функций в качестве функций активации. Радиально-базисные функции - это класс функций, значение которых зависит от расстояния от центральной точки и монотонно возрастает или убывает при увеличении этого расстояния.
Одной из самых распространенных функций из этого класса является функция Гаусса:
Эта формула определяет выход j-го нейрона в сети из N нейронов, когда на вход сети подается пример, описываемый вектором . описывает центр для j-го нейрона, - параметр, контролирующий гладкость функции.
Радиально-базисные функции могут быть использованы в сетях самого широкого класса, но, говоря о RBF-сетях, обычно подразумевают сеть определенной архитектуры. Данная сеть имеет один скрытый слой с нелинейной функцией активации, и выходной слой с линейной функцией активации. Схема данной сети приведена на рисунке Рис. 9.
Рис. 9 . Сеть радиально-базисных функций
Выходом такой сети является линейная комбинация значений выходов скрытого слоя.
Радиально-базисные сети позволяют достигнуть глобального минимума при оптимизации квадратичной функции ошибки [3]:
Радиально-базисные сети оказались весьма эффективны в решении задачи точной интерполяции функции в многомерном пространстве. Данная интерполяция названа точной в том смысле, что при подаче в сеть входного вектора данных из обучающего набора, сеть должна возвращ
Создание классификатора, основанного на нейронной сети и способного определять качество вина дипломная работа. Программирование, компьютеры и кибернетика.
Курсовая работа: Влияние групповых психолого-педагогических методов на развитие навыков общения у старших дошкольников
Участие прокурора в рассмотрении судами уголовных дел
Товароведная характеристика плавленых сыров
Курсовая работа по теме География газовой промышленности России
Реферат: Глобальный характер интернационализации высшего профессионального образования
Реферат Коллекторы Нефти И Газа
Реферат по теме Современное хозяйство развивающихся государств. «Новые индустриальные экономики»
Курсовая работа по теме Системи на кристалі
Что Сближает Людей Итоговое Сочинение На Дне
Иван Калита Реферат
Что Разрушает Дружбу Итоговое Сочинение Аргументы
Реферат: Искусство росписи пасхальных яиц
Реферат: Экономическая сущность тарифных мер регулирования внешней торговли
Реферат: Озоновая дыра. Скачать бесплатно и без регистрации
Курсовая Работа На Тему Планирование Найма, Подготовки И Переподготовки Кадров
Реферат: Развитие конного спорта в России XVIII - начала XX в
Реферат: Обеспечение экологической безопасности на военных объектах
Реферат: Расчет редуктора приборного типа
Реферат: Abortion Essay Research Paper AbortionA MATTER OF
Реферат: Участие субабонентов в отношениях, возникающих из договора энергоснабжения
Лютаўская і Кастрычніцкая рэвалюцыі 1917 года - История и исторические личности контрольная работа
Анализ эффективности системы мерчендайзинга в продвижении продукции на примере компании "Орими Трейд" - Маркетинг, реклама и торговля курсовая работа
О гносеологической природе феномена многозначности - Иностранные языки и языкознание статья


Report Page