Определения

Определения

sergey shishkin

Модели информации и данных. Атом и универсум информации

В предыдущих главах мы подходили к рассмотрению интеллектуальных систем сверху вниз. Теперь же настало время подойти к проектированию системы в обратном направлении, «снизу вверх», который обычно определяет ограничения и общепринятые стандарты к построению систем. Как и прежде, мы будем основываться на требовании универсальности при проектировании интеллектуальной информационной системы. И в этом случае нам понадобится рассмотреть базовые структуры данных и процессов, а также подходы к управлению данными и процессами, которые должны быть частью универсальной модели данных.

Информатика известна как наука о способах получения, накоплении, преобразовании и использовании информации. В упрощенном понимании эта наука рассматривает информацию как последовательность битов, а операции – как различные логические преобразования.

Нам необходимо определиться с основополагающими вопросами, связанными с определением информации. Это следует сделать, поскольку в большинстве случаев происходит смешение понятия информации и данных. Так что давайте начнем с определений.

Информация – это сведения о некоторых объектах и процессах, которые могут храниться и передаваться между агентами информации. Например, годовые кольца на спиле дерева отражают информацию о его возрасте. Сами кольца являются данными, их носителем и, следовательно, агентом – дерево. Мы расшифровали эти данные о возрасте – это наша информация, мы ее носители. Также информация может трактоваться не только как сведения, но и как знания о некоторых объектах и процессах. Информация располагается на некотором носителе и является неотделимой от носителя, то есть информация не существует без носителя, а при разрушении носителя, разрушается и информация.

При этом информация может отражать некоторые факты или быть самостоятельной. Например, в поле мы можем увидеть некоторый механизм неизвестного нам назначения. С помощью зрения мы «сняли» этот механизм, следовательно, информация о существующем объекте отразилась в нашей памяти. Теперь мы знаем, что существует такой объект определенной формы, но непонятного назначения. С помощью умозаключений мы можем интерпретировать наличие и назначение этого объекта. Например, то, что он стоит в поле, означает, что это объект сельскохозяйственного назначения. Такие выводы являются интерпретацией, которая позволяет восстановить смысл вещей, не определенный явным образом.

Информация не является лишь отражением некоторого физического факта, поскольку она также описывает умозрительные объекты. Например, понятие конкатенации как операции «склеивания» объектов данных линейной структуры не имеет отражения в материальном смысле. Эта операция может быть спроецирована на некоторые физические объекты в качестве примера, но в оригинальном своем значении она является умозрительной операцией.

Данные – это представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе. Другими словами, данные – это формализованная или закодированная информация. При этом данные сами по себе являются информацией, поскольку они являются своего рода физическим объектом. В нашей реализации интеллектуальной системы мы стремимся к тому, чтобы закодировать любую информацию в данных, однако это не является самим собой разумеющимся процессом.

Данные являются некоторым кодом, который может храниться, транслироваться, копироваться и, в свою очередь, являться основой для хранения информации как, например, строковые данные. В таком случае информация и данные являются идентичными, при этом данные являются информацией. Но не наоборот, поскольку информация не является формализованной, как данные.

Слово «данные» происходит от латинского «datum», буквально означающего «факт», однако в настоящее время «данные» не определяются как факт. Данные не трактуются как некоторая данность, определенные свершившиеся или заданная информация, их современная трактовка связана с определенностью – типизированностью, упорядоченностью, формализованностью.

В контексте этих двух определений мы можем понять, что предметом исследований информатики обычно являются именно данные, а не информация. То есть основным объектом изучения информатики является «очищенная», типизированная или подготовленная информация в виде данных. Однако постановка задач, их выработка и анализ производится именно на менее формализованном уровне – на уровне информации. В частности, далее мы рассмотрим семантическую модель данных, описывающую данные, но с помощью информации.

С учетом вышесказанного прямо сейчас мы находимся на очень неявном водоразделе, где перемешиваются информация и данные. С одной стороны, мы не можем поставить знак тождественности между информацией и данными, а с другой стороны, все технологии, связанные с данными, называются информационными технологиями. И ведь действительно, данные непосредственно связаны с информацией. Таким образом, пока мы не погрузились в пучины одного и другого, давайте на берегу договоримся о том, как разделять эти понятия.

Информация не является типизированной, не имеет ограничений по размерности. Всё, что касается типов (например, целочисленные значения), для информации является свойством, но не определяющим типом. Подробнее эти аспекты будут рассмотрены ниже. Данные, напротив, основываются на типах и конкретной размерности.

Процедура реализации информации в данных будем называть кодированием. А процедуру «декодирования» данных в информацию, то есть наделение данные смыслом (семантикой) будем называть интерпретацией данных.

Также существенным различием между информацией и данными является субъективность. Данные являются объективными, то есть мы воспринимаем их такими, какие они есть – все видят предметы в окружающем мире примерно одинаково, и зрение транслирует нам объективные данные. Информация же является субъективной в силу того, что каждый человек или группы людей со схожими взглядами, знаниями и понятиями интерпретируют и рассматривают один и тот же предмет по-разному. Например, маркшейдер рассматривает землю как породу, земледелец оценивает её плодородность, а строитель – плотность грунта для постройки дома.

Обратимся к вопросу об элементарном представлении информации.

Report Page