Схема классификации иерархическим методом

Скачать файл - Схема классификации иерархическим методом

Классификация фиксирует закономерные связи между классами объектов с целью определения места объекта в системе, которое указывает на его свойства. Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов — та процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами. С этой точки зрения классификация информации является важнейшим средством создания систем хранения и поиска информации, без которых сегодня невозможно эффективное функционирование информационного обеспечения управления. Классификатор — систематизированный свод однородных наименований, то есть классифицируемых объектов и их кодовых обозначений. Классификатор классификационная схема — систематизированный перечень наименований объектов, каждому из которых в соответствии дан уникальный код. Систематизация объектов производится согласно правилам распределения заданного множества объектов на подмножества классификационные группировки в соответствии с установленными признаками их различия и сходства. Применяется в автоматизированных системах управления и обработки информации. Классификатор является стандартным кодовым языком документов, финансовых отчетов и автоматизированных систем. Структура классификатора, как правило, должна иметь три блока: Кроме трехблочной структуры классификаторы могут иметь и двухблочную структуру, когда выделяются только блоки идентификации и наменований. В структуре классификаторов могут выделяться и другие виды блоков, а также разделы. Выбор структуры построения классификаторов определяется характером объектов классификации, типом задач, для решения которых предназначен классификатор, и используемыми методами классификации и кодирования. В классификаторах технико-экономической и социальной информации используются иерархический и фасетный методы классификации. Эти методы классификации должны отвечать следующим основным требованиям:. Иерархический метод является более традиционным. Получаемая на основе этого классификационная схема имеет иерархическую структуру. В ней первоначальный объём классифицируемых объектов детализируется на каждой следующей ступени классификации. В общем виде иерархическую классификационную схему можно представить в следующем виде:. Классификаторы, построенные на основе иерархического принципа, имеют неограниченную ёмкость, величина которой зависит от глубины классификации числа ступеней деления и количества объектов классификации, которое можно расположить на каждой ступени. Количество же объектов на каждой ступени классификации определяется основанием кода, то есть числом знаков в алфавите кода. Выбор необходимой глубины классификации и структуры кода зависит от характера объектов классификации и характера задач, для решения которых предназначен классификатор. Серьёзным недостатком иерархического метода классификации является жесткость классификационной схемы. Она обусловлена заранее установленным выбором признаков классификации и порядком их использования по ступеням классификации. Это ведёт к тому, что при изменении состава объектов классификации, их характеристик или характера решаемых при помощи классификатора задач требуется коренная переработка классификационной схем. Поэтому при разработке классификаторов следует учитывать, что иерархический метод классификации более предпочтителен для объектов с относительно стабильными признаками и для решения стабильного комплекса задач. К классификационным схемам классификаторам , построенным на основе иерархического метода классификации, предъявляются определенные требования, соблюдение которых повышает их качество и эффективность применения. Первым таким требованием является непересекаемость классификационных группировок, расположенных на одной ступени классификации. Это означает, что классификационные группировки. Второе общее правило заключается в том, что для разделения любой классификационной группировки на подчиненные группировки должен использоваться только один признак. Но это требование соблюдается только при использовании последовательного метода кодирования, при использовании же параллельного метода кодирования на определенной ступени классификации при иерархическом методе классификации могут одновременно использоваться несколько признаков, выбор которых определяется характером решаемых задач. Третьим требованием к иерархическому методу классификации является логичность и последовательность деления группировок на нижестоящие и полнота этого деления. В соответствии с этим требованием на верхних ступенях классификации должны использоваться признаки, к которым в дальнейшем будет обращено наибольшее число запросов. Полнота деления означает, что сумма подмножества всегда должна давать делимое множество объектов, не должна оставаться какая-то часть объектов, не вошедшая в состав классификационных группировок. При построении классификаторов иерархическим методом классификации необходимо соблюдать следующие правила:. Иерархический метод классификации характеризуется глубиной классификации и емкостью. Количество ступеней определяет глубину классификации, которая устанавливается в зависимости от степени конкретизации группировок и числа признаков, необходимых для решения конкретных задач. От глубины и количества группировок, образуемых на каждой ступени зависит емкость системы. Как правило, наибольшее количество последующих группировок устанавливается постоянным, либо для всей классификации, либо для данной ступени. Для систем классификации технико-экономической информации это число всегда равно десяти или кратному десяти. При иерархическом методе классификации практически не ограничивается глубина классификации информации, что дает возможность более детально анализировать предметы, явления или документы. Большая информационная емкость иерархического метода классификации позволяет использовать его для кодирования больших объемов технико-экономической информации. Несмотря на вышеперечисленные преимущества, этот метод имеет ряд существенных недостатков. Во-первых, это недостаточная гибкость структуры, обусловленная фиксированностью признаков классификации и заранее установленным порядком их следования, не допускающим включения новых объектов и классификационных группировок. Вследствие этого, изменение любого признака ведет к перераспределению классификационных группировок и необходимости переработки классификатора. Поэтому в классификаторах, построенных на основе иерархического метода, должны предусматриваться значительные резервные емкости. Во-вторых, этот метод классификации не позволяет осуществлять информационный поиск по любому произвольному сочетанию признаков. Вместе с этим у иерархического метода классификации есть достоинства, которые обеспечили ему широкое использование в различных классификационных схемах. В современных классификационных схемах классификаторах ТЭСИ широко используется и второй метод классификации — фасетный метод. При этом методе классификации заранее жесткой классификационной схемы и конечных группировок не создается. Разрабатывается лишь система таблиц признаков объектов классификации, называемых фасетами. При необходимости создания классификационной группировки для решения конкретной задачи осуществляется выборка необходимых признаков из фасетов и их объединение в определенной последовательности. В общем виде фасетную классификационную схему можно представить в следующем виде:. Такой принцип построения классификационных группировок делает классификатор на основе фасетного метода классификации очень гибким, хорошо приспособленным для использования в условиях большой динамичности характера решаемых задач. При изменении характера задач или характеристик объектов классификации разрабатываются новые фасеты или дополняются новыми признаками уже существующие фасеты без коренной перестройки структуры всего классификатора. При построении классификаторов на основе фасетного метода необходимо соблюдать следующие правила:. Основные преимущества фасетного метода классификации обусловлены его гибкостью. Изменения в любом из фасетов не оказывают влияния на остальные. Большая гибкость обуславливает приспосабливаемость метода классификации к меняющемуся характеру решаемых задач, для которых он создается. Фасетный метод классификации позволяет не только образовывать новые классификационные группировки из имеющихся фасетов, но и включать новые и исключать старые фасеты. Гибкость системы дает возможность осуществлять информационный поиск по любому сочетанию признаков. Это определяет хорошую приспосабливаемость метода к машинной обработке информации. В современных классификационных схемах часто одновременно используются оба метода классификации. Это обеспечивает возможность снизить влияние недостатков методов классификации и расширить возможность использования классификатора как конкретной формы реализации классификации информации в информационном обеспечении управления. Кодирование представляет собой процесс перевода информации, выраженной одной системой знаков, в другую систему, то есть перевод записи на естественном языке в запись с помощью кодов. Код — представляет собой условное обозначение объекта знаком или группой знаков по определенным правилам, установленным системами кодирования. Коды могут быть цифровыми, буквенными, комбинированными. Основная цель кодирования состоит в однозначном обозначении объектов, а также в обеспечении необходимой достоверности кодируемой информации. С помощью кодирования обеспечивается выполнение основных функций, связанных с обработкой экономический информации:. Представление информации в компактной форме приспосабливает ее к лучшей обработки средствами ЭВМ. С помощью кодирования упрощается и ускоряется запись данных первичного документа и последующая обработка на машинных носителях. Для того, чтобы классификационная схема стала средством для создания эффективной системы хранения документов обработки информации, ее поиска и информационного обмена, она должна быть дополнена системой условных обозначений, присваиваемых объектам и классификационным группировкам. Такие обозначения в разных классификационных справочниках могут называться индексами или кодами, a процесс их присвоения объектам классификации или классификационным группировкам — индексированием или кодированием. Знаки, составляющие индекс или код, называются их алфавитом. Такой алфавит может включать буквы, цифры, знаки пунктуации в их различных комбинациях. Так, индекс дела в номенклатуре дел представляет собой комбинацию знаков, которая включает индекс структурного подразделения, в котором создается и хранится дело, и порядковый номер дела внутри раздела, соответствующего данному структурному подразделению. Индекс какого-либо документа в универсальной десятичной классификации кроме индекса, отражающего основное содержание документа, может дополнительно включать индексы признаков, характеризующих документ язык документа, исторический период, автор, тип документа и другие. Индекс или код являются идентификаторами объекта классификации или классификационной группировки, и их основное назначение состоит в однозначном обозначении объектов классификации. Это своего рода формализованное имя объекта, которое должно обеспечивать возможность точного определения объекта классификации. Поэтому разработчики классификационных схем стремятся сделать индексы или коды мнемоничными, то есть такими, чтобы даже по внешнему виду, алфавиту кода пользователь мог определить объект и узнать возможно больше информации о характере объекта классификации, для обозначения которого использован этот код. Например, буквенный код России по Общероссийскому классификатору стран мира ОКСМ — RU, а код США — US. Соответственно код российского рубля по Обшероссийскому классификатору валют ОКВ RUR, а доллара США — USD. К методам кодирования предъявляются определенные требования, соблюдение которых способствует повышению качества классификатора. Методы кодирования могут носить самостоятельный характер — регистрационные методы кодирования, или быть основанными на предварительной классификации объектов — классификационные методы кодирования. Порядковый метод кодирования — это такой метод, при котором кодами служат числа натурального ряда. В этом случае каждый из объектов классифицируемого множества кодируется путем присвоения ему текущего порядкового номера. Данный метод кодирования обеспечивает довольно большую долговечность классификатора при незначительной избыточности кода. Этот метод обладает наибольшей простотой, использует наиболее короткие коды и лучше обеспечивает однозначность каждого объекта классификации. Кроме того, он обеспечивает наиболее простое присвоение кодов новым объектам, появляющимся в процессе ведения классификатора. Существенным недостатком порядкового метода кодирования является отсутствие в коде какой-либо конкретной информации о свойствах объекта, а также сложность машинной обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками. Этот метод кодирования не обеспечивает возможности размещения вновь появившихся объектов классификации в необходимом месте классификатора, так как резервные коды располагаются в конце ряда. По этим причинам порядковый метод отдельно редко применяется при создании классификаторов. Чаще всего он применяется в сочетании с другими методами кодирования. Серийно-порядковый метод кодирования — метод, при котором кодами служат числа натурального ряда с закреплением отдельных серий этих числе интервалов натурального ряда за объектами классификации с одинаковыми признаками. В каждой серии, кроме кодов имеющихся объектов классификации, предусматривается определенное количество кодов для резерва. Резерв кодов располагается в середине или в конце кода. Это является большим преимущество данного метода по сравнению с порядковым методом кодирования. Серийно-порядковый метод кодирования целесообразно применять для объектов, имеющих два соподчиненных признака. Данный метод кодирования обладает всеми преимуществами и недостатками порядкового метода кодирования. Несмотря на наличие в кодах построенных по этому методу кодирования, определенных элементов классификации, они чаще всего используются для идентификации объектов в сочетании с классификационными методами кодирования. Последовательный метод кодирования — метод, при котором код классификационной группировки и или объекта классификации образуется с использованием кодов последовательно расположенных подчиненных группировок, полученных при иерархическом методе кодирования. В этом случае код нижестоящей группировки образуется путем добавления соответствующего количества разрядов к коду вышестоящей группировки. Последовательный метод кодирования чаще всего используется при иерархическом методе классификации. Преимущества последовательного метода кодирования являются логичность построения кода и большая емкость. Вместе с тем он обладает всеми недостатками, присущими иерархическому методу классификации, а также ограниченными возможностями идентификации объектов. Использование последовательного метода кодирования связано с определенными трудностями, обусловленными тем, что в результате зависимости последующих разрядов кода от предыдущих применять этот код по частям нельзя, группировать объекты по различным сочетаниям имеющихся признаков сложно, практически невозможно вносить новые признаки и производить изменения в коде без коренной перестройки классификатора. Параллельный метод кодирования — метод, при котором код классификационной группировки и или объекта классификации образует с использованием независимых группировок, полученных при фасетном методе классификации. Для параллельного метода кодирования возможны два варианта записи кодов объекта:. Каждый фасет и признак внутри фасета имеют свои коды, которые включаются в состав кода объекта. Такой способ записи удобно применять тогда, когда объекты характеризуются неодинаковым набором признаков и различны их числом. Для определения групп объектов выделяется фиксированный набор признаков и устанавливается стабильный порядок их следования, то есть устанавливает фасетная формула. В этом случае не надо каждый раз указывать, значение какого признака приведено в определенных разрядах кода объекта. Параллельный метод кодирования имеет ряд преимуществ. К достоинствам рассматриваемого метода следует отнести гибкость структуры кода, обусловленная независимостью признаков, из кодов которых строится код объекта классификации. Метод позволяет использовать при решении конкретных технико-экономических и социальных коды только тех признаков объектов, которые необходимы, что дет возможность работать в каждом отдельном случае с кодами небольшой длины. При этом методе кодирования можно осуществлять группировку объектов по любому сочетанию признаков. Параллельный метод кодирования хорошо приспособлен для машинной обработки информации. По конкретной кодовой комбинации легко узнать, набором каких характеристик обладает рассматриваемый объект. При этом из небольшого числа признаков можно образовать большое число кодовых комбинаций. Набор признаков при необходимости может легко пополняться присоединением кода нового признака. Это свойство параллельного метода кодирования особенно важно при решении технико-экономических задач, состав которых часто меняется. Параллельный метод кодирования целесообразно использовать для кодирования однородных объектов, так как в противном случае реальной становится лишь незначительная часть сочетаний признаков, и емкость классификатора будет использоваться не полностью. Это является недостатком данного метода кодирования. Перечисленные классификационные методы кодирования характеризуются тем, что даже при глубокой классификации объектов код несет информацию о классификационной группировке, но не всегда идентифицирует конкретный объект, а коды, полученные на основе идентификационных методов, хорошо выполняя функцию идентификации объектов, практически не несут информацию об их свойствах. Поэтому идентификационные и классификационные методы кодирования чаще всего применяются в классификаторах в сочетании друг с другом. Одним из наиболее узких мест во всей технологии использования классификаторов информации является кодирование и ввод данных. Однако для реализации автоматизированного процесса кодирования требуются большие объемы памяти, так как вначале вся информация вводится на естественном языке, и связанные с этим большие трудозатраты. Другим направлением снижения трудозатрат в процессе кодирования и ускорения этого процесса является использование штриховых линейных кодов. Штриховой линейный код представляет собой комбинацию вертикальных полосок разной ширины и пробелов между ними. При этом за базу принимается ширина узкого элемента полоски кода. Широкие полоски должны быть кратными им по ширине или находиться с ними в определенных соотношениях. В основе штривового кода лежит цифровой код. В разных странах используются различные виды штриховых кодов. В каждом из них установлено определенное соотношение между широкимии узкими полосками и между полосками и интервалами между ними. Разработка штриховых кодов осуществляется Международной ассоциацией по нумерации ЕАН , коды которой являются наиболее распространенными в Европе. Наша страна с года также стала членом ЕАН. В году Госстандарт СССР утвердил РД 'Методические указания. Присвоение цифровых кодов товарам народного потребления'. Этим документом устанавливались правила присвоения товарам народного потребления цифровых торговых кодов. Эти цифровые коды служат основой для штриховых кодов, наносимых на ярлыки, упаковку и этикетки товаров. Такой цифровой торговый код строится в полном соответствии с кодом ЕАН Он состоит из тринадцати разрядов и имеет следующую структуру:. В этом коде, например, США и Канада имеют идентификаторы с 00 до 09, Франция — с 30 до 37, ФРГ — с 40 до 43, СНГ — 46, Япония — 49, Италия — с 80 до 83, Корея — 88 и так далее. В штриховом коде, построенном на основе ЕАН, каждому знаку цифрового кода соответствует комбинация из семи элементов — штрихов и пробелов между ними. Штриховой линейный код имеет следующий вид:. Штриховые коды могут использоваться кроме торговли также в таких областях, как медицина, банковское дело, промышленность и других. При этом в качестве цифровых кодов для них могут использоваться коды классификаторов ТЭСИ. Использование кодов ТЭСИ требует обеспечения высокой степени достоверности кодированной информации. В классификаторах ТЭСИ для выявления ошибок в кодах используется метод контрольных чисел. Контроль правильности записи кодов при обработке информация основан на принципе делимости чисел. Иначе его называют контролем по модулю. Суть метода заключается в том, что к коду добавляется еще один проверочный знак контрольное число , связанный с кодом определенной математической зависимостью, При вводе кодированной информации в базу данных, ее обработке или использовании в ЭВМ специальной программой контроля выполняется проверка этой зависимости по каждому коду. Если зависимость нарушается, машина выдает информацию о наличии ошибки в коде. Контроль по модулю широко используется в классификаторах ТЭСИ как у нас в стране, так и за рубежом. В качестве модуля используют различные числа, но наибольшее распространение получил в настоящее время контроль по модулю Для общероссийских классификаторов расчет контрольных чисел осуществляется в соответствии с методикой, разработанной ВНИИКИ'. В соответствии с этой методикой контрольным числом является остаток от деления на 11 суммы произведений весов на значения разрядов кода. Весом весовым коэффициентом является порядковый номер разряда в коде слева направо. Если разрядность кода больше 10, то набор весов повторяется. При использовании данного метода остаток может получить значение от 0 до Так как методика предусматривает использование одноразрядных контрольных чисел, то при получении остатка, равного 10, следует сделать повторный расчет контрольного числа со сдвигом строки весов. В этом случае весовой ряд начинается с 3 до 10, а если разрядность кода больше, то дальше веса идут с 1 до В случае повторного получения контрольного числа, равного 10, в качестве контрольного числа используется 0. В случае, если сумма произведений весов на значения разрядов получается меньше 10, то эта сумма и является контрольным числом. Использование контрольных чисел обеспечивает возможность обнаруживать и исправлять ошибки в кодированной документной информации, что повышает ее достоверность. При помощи методов классификации и кодирования проводится классификации информации по конкретным отраслям деятельности. Эта классификация находит свое отражение в создании общероссийских классификаторов ТЭСИ. Для изучения как применяются данные методы классификации на практике необходимо рассмотреть разработку общероссийских классификаторов ТЭСИ. Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника. Кодирование и методы кодирования.

Схема классификации иерархическим методом

Скачать файл - Схема классификации иерархическим методом

Тема № 1: Основные понятия в области классификации и кодирования

Кодирование и методы кодирования.

Классификация товаров, группы

Методы кодирования

Report Page