Информационно-поисковые тезаурусы - Программирование, компьютеры и кибернетика контрольная работа

Информационно-поисковые тезаурусы - Программирование, компьютеры и кибернетика контрольная работа



































Тезаурусы как инструмент для облегчения поиска языковых средств выражающих данное понятие. Виды, состав и структура тезауруса. Сущность информационно-поискового тезауруса по сохранности документов. Тезаурус терминов по морскому делу и парусному туризму.


посмотреть текст работы


скачать работу можно здесь


полная информация о работе


весь список подобных работ


Нужна помощь с учёбой? Наши эксперты готовы помочь!
Нажимая на кнопку, вы соглашаетесь с
политикой обработки персональных данных

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
ТЕМА : ИНФОРМАЦИОННО - ПОИСКОВЫЕ ТЕЗАУРУСЫ
1. Информационно-посковый тезаурус
Словари типа тезаурус или идеографические впервые разработаны в лингвистике. Тезаурусы предназначены для облегчения поиска языковых средств выражающих данное понятие (идею). Классическим примером поискового тезауруса является: тезаурус английских слов и выражений первое издание которого было подготовлено Роджестоном 1852 г. подобные тезаурусы созданы и для других естественных языков. Лингвистический тезаурус разработан в связи с автоматизированной подготовкой текста.
Синтагматические связи - это соотношение единицы языка в данном высказывании.
В институте русского языка РАН создан тезаурус семантических (смысловых) и синтагматических связей между словами и словосочетаниями , русский язык как словарно-программное средство. Объём тезауруса 64 000 слов и словосочетаний.
1. обеспечивать перевод с естественного языка на дескрипторный т.е для координатного индексирования документов и запросов.
2. отражать парадигматические отношения между лексическими единицами ИПТ, которые используются при составлении стратегии поиска.
Парадигматические отношения- это логические и ассоциативные отношения между ЛЕ ИПЯ.
3. служить терминологическим пособием.
ИПТ - это нормативный словарь дескрипторного ИПЯ с зафиксированными в нём парадигматическими отношениями ЛЕ.
Многоязычный ИПТ - это ИПТ содержащие ЛЕ взятые из нескольких естественных языков и представляющий эквивалентные по смыслу понятия на каждом из этих языков.
Целью создания ИПТ является повышение показателя поиска информации в ИПТ.
Макротезаурус - ИПТ включающий ЛЕ высокой общности и покрывающий широкую область знания.
Микротезаурус - специализированный ИПТ небольшого объёма составленный на основе выборки из более полного ИПТ и дополнительно включающий конкретные русские понятия определённой тематики.
Специализированный ИПТ или синоним монотематического ИПТ - ИПТ построенный для отражения области знания или практической деятельности.
Политематический ИПТ - ИПТ построенный для широкой совокупности областей знания.
Специализированный ИПТ - существует в большинстве науки и техники.
Количество разработанных микротезаурусов исчисляется только в нашей стране в несколько тысяч.
Макротезаурус и политематический ИПТ - предназначены для использования лексико-тематической основы при построении микротезауруса.
Политематический ИПТ включает только основную лексику той или иной отрасли и наиболее очевидные парадигматические отношения.
Микротезаурус включает специфические термины собствен. наимен. и развитую парадигмат.
В состав ИПТ входит вводная часть, основная часть (лексико-семантический указатель) и дополнительные части.
Вводная часть включает титульный лист и текстовые введения.
Введение содержит следующие данные:
1. цель создания и область применения ИПТ;
2. ссылки на источники используемые для сбора лексики ИПТ (др. ИПТ, терминологические словари);
3. описание порядка составления ИПТ;
4. описание состава и структуры ИПТ;
5. количественные характеристики ИПТ (общее число статей, число дескрипторов и аскрипторов);
6. перечень отношений между ЛЕ и методикой основания для их установления.
7. перечень всех символов и специальных сокращений допустимых для представления ЛЕ.
8. порядок алфавитного расположения ЛЕ.
9. описание состава и формы представления дополнительных данных в словарных статьях.
Лексико-семантический указатель - это основная часть ИПТ в которой в едином алфавитном ряду перечислены все дескрипторы и аскрипторы с указанием их парадигматических отношений.
ЛЕ ИПТ - слово, словосочетание, или лексическое значение компонентов сложного слова естественного языка включённое в ИПТ в качестве дескриптора или аскриптора.
Аскриптор (не дескриптор) - ЛЕ ИПТ которая в поисковых образах документов (запросов) подлежит замене на дескриптор при поиске или обработке информации.
В рамках дескрипторной статьи термины располагаются в следующем порядке:
1. заглавный дескриптор выделен при помощи шрифта. Например заглавными буквами;
3. лексическое примечание (краткое объяснение уточнение значения дескриптора);
4. аскрипторы или дескрипторы синонимы (которые следуют за индексом «С»);
5. вышестоящие дескрипторы следующие за индексом «в»;
6. нижестоящие дескрипторы следующие за индексом «а»;
7. дескрипторы связанные другими видами отношений.
Вышестоящий дескриптор, широкий дескриптор- это дескриптор обозначающий либо родовое понятие, либо целое по отношению к данному дескриптору обозначающий часть этого целого.
Нижестоящий дескриптор или узкий дескриптор - дескриптор обозначающий либо видовое понятие, либо часть представляющую вышестоящий дескриптор.
Дополнительные указатели служат для раскрытия учёта и контроля парадигматических отношений между дескрипторами, что требуется при составлении поисковых предписаний.
Списки указателей являются перечнем дескрипторов сгруппированных согласно принятой в ИПТ рубрикации.
При построении систематического указателя используется следующая о б щая категория:
1. название дисциплин и отраслей деятельности;
3. методы, процессы, операции, явления;
4. свойства, величины, параметры, характеристики;
5. отношения структуры, модели, законы, правила, абстрактные понятия.
Каждый дескриптор относится только к одной рубрике. Внутри рубрики дескриптор располагается в алфавитном порядке.
Иерархический - представляет собой перечень списков дескрипторов, причём каждый список начинается с дескриптора не имеющего вышестоящих.
После каждого дескриптора приведены непосредственно нижестоящие дескрипторы с указанием иерархических , путём применения нумерации. Либо графические обозначения уровня.
Основные преимущества дескрипторных ИПЯ:
Меньшая по сравнению с классификационным ИПЯ трудоёмкость разработки;
Возможность осуществить поиск по любому заранее заданному сочетанию характеристик входящих в ИПЯ;
Возможность автоматического процесса индексирования документов.
В основных отраслях характер дескрипторного ИПЯ затрудняет их использование для обмена информацией между системами с различными ИПЯ;
Неадекватное значение термина выбран в качестве дескриптора в различных дескрипторных ИПС.
2. Анализ информационно-поискового тезауруса
2. 1 Информационно-поисковый тезаурус по сохранности докуме н тов ( БАН )
1. Первый отечественный двуязычный тезаурус по сохранности документов, подготовленный в Библиотеке Российской академии наук. тезаурус насчитывает 5 166 терминов.
Издание представляет собой образец смешанного двуязычного (русско-английского) тезауруса. Основным языком выбран английский. Это значит, что в качестве дескрипторов выбраны английские термины, а русские термины приводятся как синонимы.
Настоящий информационно-поисковый тезаурус предназначен для индексирования документов и обработки запросов по обеспечению сохранности (хранению) документов в традиционных и нетрадиционных информационных системах. Тезаурус может использоваться как специальный двуязычный словарь при выполнении переводов с русского на английский и с английского на русский язык, а также как терминологический словарь справочник.
2. Дескрипторы часто определяют как классы условной эквивалентности терминов, поскольку имеется поисковая и обычная (общеязыковая) эквивалентность языковых единиц, и эти два вида лексической равнозначности терминов в дескрипторных словарях могут не полностью совпадать. Так, например, у лексических единиц, входящих в дескриптор «DERATISATION c. Дератизация, н. MICE, RATS», содержание понятий «мыши» и «крысы» относятся к семантическим категориям «живые организмы», «биологический фактор», а понятие «дератизация» - к лексической категории «операции». Но поскольку при проведении поиска информации различия в категориальном значении указанных слов являются не очень существенными и более важным является их информационно-поисковая эквивалентность, в тезаурусе по сохранности документов понятия «мыши» и «крысы» являются нижестоящими по отношению к термину «deratisation».
В лексико-семантическом указателе тезауруса расположены дескрипторные и аскрипторные статьи.
В рамках дескрипторной статьи термины располагаются в следующем порядке:
- заглавные дескрипторы выделены заглавными буквами;
- аскрипторы или дескрипторы синонимы, которые следуют за индексом «с»;
- вышестоящие дискрипторы следующие за индексом «в»;
- нижестоящие дескрипторы следующие за индексом «н».
3. В дескрипторных статьях тезауруса отсутствуют:
- дескрипторы связанные другими видами отношений.
2. 2 Тезаурус терминов по морскому делу и парусному туризму. (информационно - поисковый тезаурус). С оставитель В.Н. Белозеров. М о сква 2001
1. Тезаурус содержит около 2200 терминов с определениями и тезаурусными связями.
Настоящий словарь-справочник по морскому делу и парусному туризму является терминологическим словарем, в котором для каждого термина дано его определение, при необходимости -- примечания о характере использования, а также семантические связи с другим понятиями.
Наличие явного указания на семантические связи понятий в совокупности с раскрытием их содержания в определениях и комментариях позволяет использовать словарь как "программированный учебник", который ведет читателя от слова к слову, сообщая сведения о понятиях всей сферы интереса.
В состав словаря входит вся специальная терминология, необходимая для изложения материала по организации и проведению туристских плаваний на транспортабельных разборных судах по внутренним водоемам и прибрежным районам морей. Терминология этого вида деятельности дополнена лексикой классического парусного дела, парусного спорта, навигации, гидрографии, организации морских перевозок, что позволяет использовать словарь как справочник по морскому делу в целом.
Словарь состоит из настоящего введения и алфавитного лексико-семантического указателя терминологии. Элементом алфавитного указателя является словарная статья, состоящая из заглавной лексической единицы, определения, примечания и ссылок.
Тематику словаря можно отнести к следующим рубрикам Государственного рубрикатора научно-технической информации:
· 71.37.01 Общие вопросы туристско-экскурсионного обслуживания
· 73.34.01 Общие вопросы водного транспорта
· 77.01.33 Терминология. Справочники, словари, учебная литература по физической культуре и спорту
· 77.29.32 Парусный спорт. Виндсерфинг
2. Заглавная лексическая единица возглавляет словарную статью и в дескрипторных статьях выделена заглавными (прописными) буквами. В некоторых случаях в состав заглавной лексической единицы включены факультативные пояснительные слова в круглых скобках. Например: "УЗЕЛ (скорость)" в отличие от "УЗЕЛ (на тросе)".
Определение следует непосредственно после заглавной лексической единицы, отделено от нее тире и набрано шрифтом с уменьшенной высотой букв (в настоящем варианте петит не реализован). В некоторых случаях, когда определение термина очевидно из его внутренней формы, оно не приводится. В тех же случаях, когда термин можно определить с разных сторон и лишь в совокупности соответствующие определения описывают понятие, приводятся два или даже три определения, разделенные точкой с запятой.
КЛИВЕР -- треугольный косой парус, передняя шкаторина которого крепится к кливер-лееру, соединяющему стеньгу с ноком бушприта или утлегарем.
два определения (со стороны значения и со стороны формы):
АЗ -- флаг ВМСС, обозначающий русскую букву А; красный с косицами и белым квадратом у древка.
Важной частью статьи являются ссылки на другие термины или другие формы того же термина. Они позволяют знакомиться с содержанием тезауруса методом "навигации" по ссылкам и уточняют значение терминов, дополнительно раскрывая его через связи термина (набранного обычным светлым шрифтом). Если в статье приводится два или более ссылочных термина, имеющих одинаковый характер связи с заглавной лексической единицей, обозначение ссылки приводится только один раз в первой из строк.
Все термины, указанные в ссылках, являются заглавными лексическими единицами соответствующих статей, в которых можно получить дополнительную информацию о данном термине. Исключение составляют ссылки на обозначения и аббревиатуры.
В настоящем тезаурусе используются следующие виды ссылок, которые располагаются в указанном ниже порядке:
с -- в дескрипторной статье указывает на синонимичный аскриптор;
см -- в аскрипторной статье указывает на синонимичный дескриптор;
исп -- в аскрипторной статье указывает на несколько дескрипторов, среди которых нужно выбрать один, наиболее точно выражающий интересующее читателя понятие;
об -- условное обозначение данного понятия;
вц -- вышестоящий термин, обозначающий объект, включающий в себя данное понятие в качестве своей составной части;
вм -- множество, один из элементов которого обозначается заглавной лексической единицей;
нч -- нижестоящий термин, обозначающий часть объекта, выраженного заглавной лексической единицей;
нэ -- нижестоящий термин, обозначающий один из элементов множества, выраженного заглавной лексической единицей;
асх -- ассоциация по сходству объектов или понятий; асм -- ассоциация по смежности объектов, процессов или явлений; ант -- антоним, т.е. "противоположное" понятие;
ср -- ссылка на аскриптор, предлагающий данную заглавную лексическую единицу в качестве одной из альтернатив для выбора точного термина.
АЗИМУТ - направление в пространстве, выраженное относительно стран света
нв: азимут светила; истинный азимут; компасный азимут; магнитный азимут;
асм: круговая система азимутов; румбовая система азимутов; четвертная система азимутов
3. Настоящий словарь, рассматриваемый как тезаурус, подготовлен в соответствии с ГОСТ 7.25 -- 80.
1. ГОСТ 7.24-90. Тезаурус информационно-поисковый многоязычный.
2. ГОСТ 7.25-2001. Тезаурус информационно-поисковый одноязычный.
3. ГОСТ 7.74-96. Информационно-поисковые языки. Термины и определения.
Тезаурус для автоматического концептуального индексирования как особый вид тезауруса. Подходы к описанию отношений при разработке онтологий. Родовидовое отношение выше-ниже. Семантическое смещение. Формальная онтология. Сравнение поисковых механизмов. презентация [721,9 K], добавлен 19.10.2013
Отличительные особенности тезауруса для автоматического концептуального индексирования. Методы, используемые при формировании состава Общественно-политического тезауруса. Описание идеи алгоритма, основанного на учете структуры связного текста. презентация [38,0 K], добавлен 01.09.2013
Информационно-поисковый тезаурус, его определение и цель разработки. Организация быстрого и эффективного поиска документальной информации. Использование, структура, построение, сфера применения и перспективы развития информационно-поисковых тезаурусов. контрольная работа [17,6 K], добавлен 01.08.2009
Понятие тезаурусов, их классификация, назначение, принципы работы. Анализ языков программирования: HTML, Java, C++, Delphi. Создание предварительного проекта. Поэтапная разработка тезауруса. Тип семиотических средств, используемых для семантизации лексем. курсовая работа [988,5 K], добавлен 25.12.2014
Понятие информационно-поисковых систем. История возникновения сети Internet. Основные алгоритмы работы современных словарных информационно-поисковых систем. Быстрый поиск в базе данных и быстрое реагирование системы. Ранжирование результатов поиска. курсовая работа [101,1 K], добавлен 01.06.2012
Компоненты документальной информационно-поисковой системы. Результаты индексирования документов и запросов. Иерархическая, фасетная и эмпирическая классификационные схемы. Дескрипторные информационно-поисковые языки. Примеры дескрипторной статьи. презентация [59,2 K], добавлен 14.10.2013
Методы машинного обучения в задачах рубрикации, положительные и отрицательные примеры. Отсечение по центрам тяжести и ближайшим соседям. Оптимальный линейный сепаратор Support Vector Machines. Особенности применения тезауруса. Расчет веса конъюнкции. лекция [405,0 K], добавлен 01.09.2013
Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д. PPT, PPTX и PDF-файлы представлены только в архивах. Рекомендуем скачать работу .

© 2000 — 2021



Информационно-поисковые тезаурусы контрольная работа. Программирование, компьютеры и кибернетика.
Физическая Культура Древней Индии Реферат
Реферат по теме История Финляндии
Дипломная работа по теме Анализ и пути совершенствования организации труда в образовательном учреждении
Курсовая работа по теме Анализ объема производства и реализации продукции
Реферат: Особенности монтажа протяженных участков паропроводов и присоединения новых участков к существующим паропроводам
Контрольная Работа По Истории 5 Класс Годер
Дипломная работа по теме Исследование процедуры конкурсного отбора на гражданскую государственную службу
Реферат по теме Робототехнологические комплексы (РТК) и гибкие производственные модули (ГПМ) для различных видов мет...
Реферат по теме Анализ себестоимости промышленной продукции
Эссе Достоверные Источники Медицинской Информации
Контрольная Работа Неравенства 9 Класс Вариант 1
Курсовая работа: История Ордена "Победа"
Сочинение: И.А.Крылов
Реферат На Тему Стоунхендж - Загадка "Висячих Каменів"
Курсовая работа по теме Игра как одно из средств социализации дошкольников с задержкой психического развития
Краткое Сочинение Про Петра И Февронию
Курсовая работа по теме Анализ данных в MS Excel
Реферат: Ленінська доба і преса
Сочинение На Тему Труд Души
Контрольная Работа На Тему Национальный Банк Республики Беларусь И Его Роль В Обеспечении Стабильности Банковской Системы Беларуси
Акт відновлення незалежності України 30 червня 1941 р. і початок боротьби з німецькою окупацією - История и исторические личности реферат
Обязательство и ответственность субъектов предпринимательской деятельности - Государство и право контрольная работа
Система координат - Геология, гидрология и геодезия курсовая работа


Report Page