Разработка подсистемы морфологического анализа информационной системы - Программирование, компьютеры и кибернетика дипломная работа

Разработка подсистемы морфологического анализа информационной системы - Программирование, компьютеры и кибернетика дипломная работа




































Главная

Программирование, компьютеры и кибернетика
Разработка подсистемы морфологического анализа информационной системы

Анализ существующих решений в сфере программных продуктов проверки орфографии. Анализ правил русского языка, которые используются при машинном анализе текста. Разработка алгоритмов морфологического анализа. Алгоритм анализа слова на возможные ошибки.


посмотреть текст работы


скачать работу можно здесь


полная информация о работе


весь список подобных работ


Нужна помощь с учёбой? Наши эксперты готовы помочь!
Нажимая на кнопку, вы соглашаетесь с
политикой обработки персональных данных

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
? Возможность просмотра всех форм заданного слова и его грамматических характеристик.
По сравнению с модулем проверки орфографии русского языка в MS Office, в «Орфо» имеется возможность добавления слов во всех словоформах и показ всех форм любого слова с его грамматическими характеристиками.
Рис. 1.1. Взаимодействие программ «Орфо» и Notepad
Рис. 1.2. Взаимодействие программ «Орфо» и ICQ
Проверка орфографии осуществляется: в популярных программах, в собственном редакторе и в большинстве редактируемых окон по «горячим клавишам» (рис. 1.3, 1.4).
Рис. 1.3. Проверка орфографии и подсказки в программе «Орфо»
Рис. 1.4. Проверка орфографии и подсказки в программе «Орфо»
? Грамматическая и стилистическая проверка.
Усовершенствованный грамматический и стилистический корректор использует более 40 групп правил и проверяет текст с точки зрения трех основных стилей письма: строго (все правила), для деловой переписки и для обычной переписки.
? Словарь синонимов, антонимов и родственных слов.
Словарь синонимов русского языка включает более 60 000 русских слов и выражений, образующих около 10 000 групп синонимов, 3 500 антонимов и 14 000 рядов родственных слов. Словарь синонимов располагает двумя возможностями: он распознает русские слова независимо от их формы в тексте и для любого слова предлагает синоним или антоним в соответствующей грамматической форме.
Полная расстановка переносов с возможностью пользователю выбрать качество переноса - книжное или газетное.
? Набор толковых словарей «Русская коллекция»
Весь спектр русских словарей, объединенных в набор Русская коллекция: Толковый словарь современного языка, Толковый словарь В. Даля, Синонимы, Антонимы, Паронимы, Этимологический словарь.
? Показ всех форм заданного слова и его грамматических характеристик.
? Справочник по русскому языку, который содержит свод правил русской орфографии и пунктуации.
? Для Microsoft Word предусмотрена возможность поиска и замены слов во всех формах, создание автореферата документа и формирование списка его ключевых слов (рис 1.5).
Рис. 1.5. Возможность поиска и замены слов в программе «Орфо»
Для более эффективной проверки орфографии предусмотрена возможность подключения дополнительных тематических словников по предметным областям (информационные технологии, коммерция, нефть и газ, техника, гуманитарные и точные науки, медицина и т.п.)
? Строительный (для русского языка). Содержит термины по различным отраслям строительного дела.
? Нефть и газ (для русского языка). Содержит термины, относящиеся к геологии, добыче и хранению нефти и газа, строительству, обслуживанию скважин, разработке месторождений и соответствующему оборудованию.
? Информационные технологии (для русского языка). Словарь содержит термины по вычислительным системам и сетям, архитектуре и элементам вычислительных машин, операционным системам, программному обеспечению.
? Словник по бизнесу (для русского, английского и немецкого языка). Содержит термины по бизнесу, бухучету, финансам и праву.
? Медицинский словник (для русского, английского, немецкого и испанского языка). Содержит термины по медицинской науке и практике.
? Научный словник (для русского и английского языка). Содержит термины из области математики, физики, химии, биологии, лингвистики.
? Технический словник (для русского и английского языка). Содержит термины по различным отраслям науки и техники (машиностроение, радиоэлектроника, автомобилестроение, авиационная и ракетно-космическая техника, пищевая и парфюмерная промышленность и т.д.)
? Гуманитарный словник (для русского и английского языка). Содержит термины из области культуры, религии, политики, музыки, психологии.
Таблица 1.1. Приложения, поддерживаемые программой «Орфо»
В таблице 1.1 указано, в каких приложениях и для каких языков поддерживаются предлагаемые опции:
«Все языки» означает, что данная опция реализована для всех встроенных в ОРФО языков в зависимости от приобретенной версии;
Таблица 3.1. Символы с кодами 128-255 (Кодовая таблица 1251 - MS Windows)
Алгоритм морфологического разбора состоит из двух частей:
2) В случае, если слово не найдено, производится попытка найти в этом слове ошибку.
На первом этапе используется словарь, состоящий из основ слов с префиксами и соответствующих этой основе окончаний. Поиск производится перебором. Одной словоформе может соответствовать много морфологических интерпретаций. Например, у словоформы стали две интерпретации:
· {СТАЛЬ, C, «но», («жр, ед, рд», «жр, ед, дт», «жр, мн, им», «жр, мн, вн»)};
· {СТАТЬ, Г, «нп, св», («мн, дст, прш»)}.
Второй этап выполняется, если слово не было найдено в словаре. В таком случае подразумевается, что слово содержит ошибку, и подсистема пытается определить, в каком месте слова допущена ошибка.
Если и на втором этапе не удалось найти словоформу, то считается, что слова нет в словаре.
1) Массив base (содержит основы слов),
2) Массив flex (содержит постфиксы),
3) Массив mrf (содержит морфологические признаки).
Данные массивы заполняются на основе словарей morphologi.dic
Для поиска по массивам и анализа ошибок используются следующие методы:
Словоформы, имеющие несколько значений части речи.
2. (перестановка двух соседних символов)
Бизнес-план выступает как объективная оценка собственной предпринимательской деятельности предприятия и в то же время необходимый инструмент проектно-инвестиционных решений в соответствии с потребностями рынка. В нем характеризуются основные аспекты предприятия, анализируются проблемы, с которыми оно столкнется, и определяются способы их решения.
Цель разработки бизнес-плана - спланировать хозяйственную деятельность предприятия на ближайший и отдаленные периоды в соответствии с потребностями рынка и возможностями получения необходимых ресурсов.
Состав, структура и объем бизнес-плана определяется спецификой вида деятельности, размером предприятия и целью составления. Не существует жестко регламентированной формы и структуры бизнес-плана. Как правило, в нем могут предусматриваться следующие разделы:
Дадим краткую характеристику наиболее значимых из его разделов.
Качественная характеристика товара; особенности и отличия товара, дающие преимущество перед аналогичными товарами конкурентов; потребности, которые позволяет удовлетворить новый продукт или услуга;
преимущества его дизайна; особенности упаковки; организация сервисного обслуживания. Перечень патентов и авторских свидетельств, которыми защищен продукт. Прогнозируемая цена продукта и прогнозируемый уровень затрат на его изготовление, примерная величина прибыли, которую будет приносить каждая единица товара.
Основные этапы исследования рынка. Потенциальные покупатели. Кто, сколько и когда будет готов купить данную продукцию в ближайшие несколько лет.
Обзор производителей аналогичных товаров и их объема продаж, дох оды, виды услуг, предоставляемые по сервисному обслуживанию. Доля внимания, уделяемая рекламе товара. Особенности продукции конкурента, а именно, основные характеристики, уровень цен, уровень качества, дизайн, возможности внедрения новых моделей, мнения покупателей.
Схема распространения товара. Методы продажи через собственные торговые точки и через оптовые торговые организации. Методика определения цен, ожидаемый уровень рентабельности на вложенные средства. Реклама: методы организации и величина средств, необходимых для реализации рекламного проекта. Методы стимулирования продаж. Организация сервисного обслуживания клиентов. Формирование общественного мнения о предприятиях и товарах, разработка методик, позволяющих добиваться хорошей репутации.
Вид предприятия (действующее или вновь создаваемое). Необходимые прои зводственные мощности. Места и условия закупки сырья, материалов и комплектующих. Предполагается ли производственная кооперация и с кем? Схема производственных потоков на предприятие. Как и куда будет поставляться с предприятия? Организация процесса контроля качества. Оценка возможных издержек производства и ее динамика на перспективу.
Организационная структура предприятия: взаимодействие все служб, коорд инация и контроль их деятельности. Оплата и стимулирования труда руководящего персонала. Определение профиля, уровня образования и опыта специалистов, а также оценка их заработной платы, необходимые для успешного ведения дел.
Форма собственности и правовой статус предприятия.
Освещаются проблемы, которые могут возникать у предприятия в процессе реализации проекта и основные методы защиты от потенциальных трудностей. С одержит следующие составные части: перечень возможных рисков с указанием вероятности их возникновения и ожидаемого ущерба от этого; организационные меры по профилактике и нейтрализации рисков: программу страхования от рисков.
Прогноз объема реализации. Баланс денежных расходов и поступлений. Табл ица доходов и затрат. Сводный баланс активов и пассивов предприятия. График достижения безубыточности.
Излагается план создания нового предприятия или расширения уже функци онирующего. При составлении этой части бизнес-плана предприятие обязано рассмотреть следующие вопросы: средства необходимые для реализации предлагаемого проекта; источник финансирования; сроки окупаемости и размеры ожидаемого дохода от реализации проекта.
Основными задачами планирования работ по теме являются:
- согласование выполнения отдельных этапов работ во времени, определение длительностей работ, обеспечение их во времени и выполнение их в установленные сроки;
- определение общего объема работ и потребное для его выполнение трудовых, материальных и денежных ресурсов;
- достижение наилучшего использования выделенных ресурсов.
Выполнение этих работ ведется в направлении составления календарных ленточных графиков выполнения работ по теме. Это обусловлено тем, что выполняемая тема имеет небольшое количество работ. Работы имеют простую взаимосвязь и малую параллельность. Круг исполнителей по теме малочислен.
Планирование НИР с применением ленточного графика ведется следующим образом:
- устанавливается последовательность работ;
- определяется продолжительность работ;
- определяется общий срок выполнения работ.
В перечне работ последовательно указываются номер и наименование работ в порядке их выполнения, а также наиболее вероятные сроки выполнения. Таблица 3.1.
Затем на основе данных таблицы 3.1. строится график выполнения работ рисунок 3.1.
Формирование требований пользователя к программному обеспечению
Обоснование актуальности поставленной задачи
Разработка и утверждение технического задания на создание программного обеспечения
Выбор возможных вариантов построения программного обеспечения
Разработка общего описания алгоритма функционирования программного обеспечения
Определение структуры и формы представления входных и выходных данных
Разработка структуры программного обеспечения
Разработка алгоритма программного обеспечения
Формирование текста программного обеспечения
Проверка возможности функционирования программного продукта
Корректировка программного продукта по результатам проверки
Подготовка технической документации на программный продукт
Подготовка отчета о проведение работ по теме
Цена на научно-техническую продукцию устанавливается между заказчиком и исполнителем на стадии заключения договора и оформляется протоколом соглашения о договорной цене.
В структуру цены включаются следующие статьи затрат:
- специальное оборудование для научных работ,
- затраты по работам сторонних организаций,
Одной из основных статей расходов является основная заработная плата персонала. По этой статье учитывается заработная плата начисленная пропорционально выполняемой работе по окладам для инженерно-технических работников (таблица 3.2).
К статье «дополнительная заработная плата» относятся выплаты, предусмотренные законодательством за не проработанное по уважительным причинам время: оплата очередных и дополнительных отпусков, выполнение государственных обязанностей и т.д.
Ее величина определяется в размере 27% от суммы основной заработной платы и составит:
Затраты по статье «единый социальный налог» определяются в процентном отношении (26) от суммы основной и дополнительной заработной плат.
(33348 руб. + 9004 руб.) х 0,26 = 11012 руб.
Проведение исследований потребовало определенных затрат, связанных с расходом канцелярских товаров. Эти затраты, включая транспортные расходы, принимаются в размере 2% от основной заработной платы инженерно-технических работников (таблица 3.2).
Затраты по статьям «работы выполняемые сторонними организациями», «специальное оборудование», «командировочные расходы» и «прочие расходы» не планируются.
На статью «накладные расходы» относятся расходы по управлению предприятием, а также расходы по содержанию и ремонту зданий, сооружений, оборудования и другие расходы.
Величина накладных расходов определяется по нормативу (200%) от основной заработной платы.
Результаты расчетов по статьям калькуляции представлены в таблице 3.3.
Стоимость темы представляет собой сумму всех статей калькуляции.
Договорная цена темы включает в себя оптовую цену предприятия и НДС.
В свою очередь оптовая цена предприятия складывается из стоимости темы и прибыли
Величина прибыли определяется по нормативу прибыли в процентах (30%) к стоимости темы.
Оплата работ выполняемых сторонними организациями
Тогда величина оптовой цены предприятия будет равна 156945 рублю.
120727 руб. + 36218 руб. = 156945 руб.
Налог на добавленную стоимость (НДС) определяется на основании общегосударственного норматива 18% от стоимости темы за минусом материальных затрат, но в связи с тем, что разрабатываемый программный продукт не подлежит тиражированию, то НДС не изымается.
И в этом случае договорная цена темы будет равна оптовой цене предприятия.
Разработка подсистем анализа веб-сайта с помощью Microsoft Access и Olap-технологий. Теоретические аспекты разработки подсистемы анализа данных в информационной системе музыкального портала. Olap-технологии в подсистеме анализа объекта исследования. курсовая работа [864,8 K], добавлен 06.11.2009
Анализ существующих программных решений для обучения студентов и контроля их знаний. Обзор лингвопроцессорных средств и обоснование их выбора. Алгоритмы решения и проверки упражнений на именную часть русского языка. Применение правил преобразования. курсовая работа [97,0 K], добавлен 29.01.2015
Методика исследования и анализа средств аудита системы Windows с целью обнаружения несанкционированного доступа программного обеспечения к ресурсам вычислительных машин. Анализ угрозы информационной безопасности. Алгоритм работы программного средства. дипломная работа [2,9 M], добавлен 28.06.2011
Содержательная часть языка программирования С++. Правила автоматной грамматики, классификация Хомского. Принцип построения графов, разработка проекта средствами среды программирования Builder C++. Алгоритм синтаксического анализа оператора вывода. контрольная работа [228,4 K], добавлен 22.05.2012
Анализ организационной структуры автоматизируемого подразделения, функции каждого сотрудника и принципы документооборота. Разработка структуры и алгоритмов информационной системы принятия решений. Описание архитектуры приложения и его основные функции. дипломная работа [273,4 K], добавлен 10.07.2017
Характеристика предприятия и его деятельности. Описание основных сущностей и их функций. Обоснование выбора системы управления БД и анализ имеющихся программных средств. Проектирование базы данных. Разработка интерфейса и алгоритмов реализации системы. дипломная работа [1,4 M], добавлен 18.10.2015
Обоснование выбора языка и среды программирования. Обзор и анализ существующих программных решений. Разработка графического и пользовательского интерфейса. Алгоритм бинарного поиска. Методы добавления, удаления элемента из дерева и вывода на экран. курсовая работа [1,3 M], добавлен 31.05.2016
Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д. PPT, PPTX и PDF-файлы представлены только в архивах. Рекомендуем скачать работу .

© 2000 — 2021



Разработка подсистемы морфологического анализа информационной системы дипломная работа. Программирование, компьютеры и кибернетика.
Курсовая Работа Маркетинг В Интернете
Контрольная работа по теме Изучение особенностей костей скелета в возрастном аспекте
Курсовая работа по теме Коммуникативные и организаторские склонности младших командиров
Курсовая работа по теме Территориальные особенности развития агропромышленного комплекса в России
Отчет По Учебной Практике Монтажник Рэа
Защита Дипломных Работ Образец
Курсовая работа: Разработка технологии сварки корпуса водила II ступени
Реферат по теме Характеристика экскурсионно-туристических центров РИМА
Реферат На Тему Ликвидность Экономики И Естественные Монополии
Курсовая Аттестация Работников
Сочинение На Тему Конкуренция Глазами Школьника
Доклады На Тему Новый Способ Выполнения Работы - Телерабочий
Отчет По Практике Вычислительная Техника
Курсовая работа: Ленинская концепция социализма. Скачать бесплатно и без регистрации
Сочинение На Тему Осень 100 Слов
Реферат по теме Основные путешествия П.К. Козлова
Контрольная работа: Коллекторный электродвигатель
Реферат Тему Київська Культура
Реферат Великая Отечественная Война 1941-1945 Архив
Реферат: Астрономия за 11 класс
Особое производство - Государство и право курсовая работа
Организация физиотерапевтического кабинета - Медицина реферат
Музыкальный коллектив "Терем-квартет" - Музыка реферат


Report Page