Элементарная структура информации

Элементарная структура информации

sergey shishkin

Модели информации и данных. Атом и универсум информации

В обычном, традиционном понимании элементарной единицей информации является бит. Однако это не единица информации, а единица данных! Давайте разберемся, в чем тут разница. Информация – это сведения или знания. Следовательно, информация представляется нам как некоторое смысловое выражение.

Например, «Лампочка горит» или «Лампочка не горит» будет элементарным значением состояния лампочки. Это состояние лампочки мы можем закодировать в единицу данных, а именно в бит. В то же время значение некоторого абстрактного бита говорит лишь о его собственном состоянии. Мы про него можем сказать, что «значение бита такой-то ячейки памяти – 0», это будет интерпретацией данных, но на абстрактном смысловом уровне. Если же мы знаем нагруженность этого бита состоянием лампочки, то посмотрев на значение бита, мы можем сделать вывод о состоянии лампочки.

Отношение информации к данным состоит в том, что информация обладает смыслом. Данные не связаны со смыслом, но могут являться основой для получения информации. То есть, информация может быть закодирована в данных. Также данные могут восстановить информацию, если они нагружены смыслом. В соответствии со смысловой нагрузкой данные могут быть интерпретированы. Кроме того, данные могут нести представление информации, когда они являются текстом некоторого сообщения, наделенного смыслом.

Например, предложение на русском языке несет смысловую нагрузку. Мы можем использовать Unicode или другую кодовую страницу для преобразования символов в языковые данные. В этом случае, используя преобразование данных в символы, мы получим информацию, закодированную в данных. Однако если мы применим другую кодовую страницу для расшифровки – например, ASCII к тексту в Unicode, мы не сможем понять содержимое данных, а, следовательно, не сможем извлечь смысл из кодов.

Ремарка: перекодированные данные в текст являются информацией только если закодированный текст имеет смысл.

Другим примером является реверс-инжиниринг программного кода, также известный как декомпиляция. При анализе чужого программного кода можно проследить логику, но невозможно понять, почему программа была написана именно таким образом, и чего хотел добиться автор определенными программными выражениями. Код, сгенерированный в языках программирования по технологии. Net корпорации Microsoft, является байт-кодом, а, соответственно, к нему может быть применен реверс-инжиниринг, который восстанавливает названия переменных, внутренних процедур, внутренних классов и пр. Всё это является хорошим материалом для понимания смысла программы, поскольку придает семантическую (смысловую) ясность. Разработчики, всячески стремящиеся противодействовать подобного рода анализу, придумали специальные программы обфускаторы, которые заменяют эти названия на другие, не несущие никакого смысла, а также которые противодействуют реверс-инжинирингу кода, поскольку добавляют в идентификаторы – названия переменных, методов и пр. запрещенные символы с точки зрения языков программирования (спецсимволы, пробелы и пр). Люди, всё же желающие анализировать код придумали программы деобфускаторы, которые позволяют сделать корректным код после декомпиляции при его реверс-инжиниринге. Разумеется, оригинальные названия переменных и других элементов кода деобфускаторы вернуть не в состоянии. Получается, что обфускаторы уничтожают смысл кода программы через искажение названий идентификаторов (переменных, названий процедур, классов и пр.), и, следовательно, восстановить смысл можно только из анализа операций с определенным методом, свойством, классом, переменной и пр.

Таким образом, само понятие битов и других структур данных, насколько являются необходимыми для хранения информации, настолько же они являются техническими структурами.

Если с единицами данных всё более-менее понятно, в таком случае что является единицей информации? Каким образом мы можем выделить смысл, и каким образом мы можем определить его элементарную составляющую?

Мышление человека основывается на образах. Образы тесно связаны с понятиями. И в целом, понимание образов происходит от чувств человека как источников восприятия мира. Например, лимон ассоциируется с желтым цветом, продолговатой формой фрукта и его кислым вкусом, который мы можем тут же представить.

Образ является единицей информации, но он слабо определяем. По большому счёту образ – это собирательный элемент информации, поскольку образы связаны с различными ощущениями от различных органов чувств, и, кроме того, часть представлений человека вообще не связывается с чувственными образами, например, различные абстрактные понятия, такие как, понятие «данные» или «наука». Такие понятия назовем аналитическими. Кроме того, образ нельзя назвать элементарным элементом информации в представлении человека, поскольку образ – это обычно целая сложная структура объектов в визуальном представлении, букет составляющих в обонятельном представлении, композиция звуков в аудиальном представлении и т. д. Образы часто сопоставляются с некоторым словом, то есть одно слово описывает сложный образ в виде набора объектов. Например, при слове «карта» Вы можете себе представить топографию какой-либо местности.

Основываясь на представлениях о логике мышления человека, а также о логических операциях, можно сделать следующее заключение. Возьмем какое-либо слово в смысле понятия или выражения. Выбранное понятие или выражение нагружено связями с другими словами, свойствами, понятиями и представлениями. Если последовательно применять к выбранному слову операцию абстрагирования, то наше понятие будет терять связи со свойствами или с другими понятиями. В конце концов, оно будет представлять собой только одно название, даже без какого-либо определения в форме словесного выражения. Например, представим лимон. Последовательно отбрасываем от понятия лимон его свойства – цвет, структуру, вкус, физическое представление, запах и т. п. Это можно делать через последовательные превращения лимона в более абстрактные понятия – «цитрусовые», фрукты, плоды, растительные продукты и так далее. В результате мы получаем понятие «нечто».

Объединяя понятия – от самого абстрактного и до самых сложных, имеющих сотни связей, можно дать им единое название – «знак».

Знак может быть абстрактной сущностью без каких-либо связей, и также он может иметь произвольное количество связей, в том числе репрезентации в виде чувственных образов. Таким образом, знак, с одной стороны, является элементарной единицей информации и, с другой стороны, может отражать любое сложное понятие.

Для простоты понимания знак можно воспринимать как какой-либо объект или понятие.

При этом знак является всеобъемлющей и единой структурой информации за счет возможности его связывания с другими знаками. Это очень важная особенность знака как структуры, поскольку с использованием такого представления знака в данных пропадают ограничения на структуру данных – на глубину свойств и связей. Отсутствие ограничений – очень важная характеристика, которая также имеет влияние на объединение данных и метаданных в единую структуру.

Одним из главных свойств знака является репрезентация. В психологии репрезентация определяется как уподобление или образ, дающий впечатление об оригинале. Репрезентации формируются у человека через различные репрезентативные системы: визуальную, аудиальную, кинестетическую и т. д. Образ, который мы обсуждали выше, является свойством знака как один из вариантов репрезентаций – мыслительной имитации или ассоциации с предметом.

Давайте будем реалистами, и не будем углубляться в такие сложные и неоднозначные задачи, как определение, каким образом следует хранить представление запаха или вкуса, поскольку они потребуют решения задач по идентификации запаха и вкуса. Выше я сделал оговорку, что мы отойдём от этих тем, поскольку они не являются основным объектом исследования.

Вместе с простыми, и со сложными визуальными, аудиальными и другими образами мы воспринимаем, распознаем и выражаем понятия через естественный язык. А это значит, что и текст на естественном языке является репрезентацией, поскольку через раскрытие существа понятий на естественном языке, будь то английский, русский или какой-либо другой язык, мы можем воспринять, проанализировать, воспроизвести, понять и транслировать информацию о некотором объекте.

Естественный язык служит универсальным средством представления информации. Тем не менее, язык не всегда является наилучшим средством выражения информации. Во-первых, естественный язык в силу своей универсальности в некоторых случаях менее эффективен, чем специализированные средства. Этот факт хорошо известен в различных областях деятельности, например, в музыке, где существует своя нотная грамота. Во-вторых, естественный язык ориентирован на вольный стиль общения и не обеспечивает необходимой точности регистрации и передачи информации. Но следуя требованиям универсальности, мы придерживаемся естественного языка как наилучшего средства выражения образов.

Знак не может быть изолированным объектом, он должен существовать в некоторой среде. Будучи связанным с другими знаками, назовём её информационной средой. Сюда входит язык, контекст, специфика употребления знака и пр.

Ранее я подробно описал агентов, чтобы показать, что информация в основном не является уделом закрытой архитектуры. В силу своего основного свойства она должна распространяться. Но при этом информация может преобразовываться, видоизменяться внутри и вне агентов. Поэтому информация может различаться внутри и вне агентов.

Информация может находиться внутри агента – это та информация, которой обладает агент. Назовем её собственной информацией.

Когда агент получает информацию извне, он должен принять и согласовать её в соответствии со своими внутренними образами, знаниями и представлениями. Этот процесс называется восприятием или перцепцией.

Если агент, напротив, хочет передать собственную информацию во вне, процесс формирования сообщений называется вербализацией. Вербализация и восприятие являются базовыми коммуникационными процессами. Далее в основном мы будем рассматривать собственную информацию агента.

Report Page