Кодирование текстовой информации ascii

Кодирование текстовой информации ascii

Кодирование текстовой информации ascii

Кодирование информации, ASCII



=== Скачать файл ===




















С точки зрения ЭВМ текст состоит из отдельных символов. Вспомним некоторые известные нам факты: Множество символов, с помощью которых записывается текст, называется алфавитом. Число символов в алфавите — это его мощность. Формула определения количества информации: В алфавит мощностью символов можно поместить практически все необходимые символы. Такой алфавит называется достаточным. Единице измерения 8 бит присвоили название 1 байт: Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти. Каким же образом текстовая информация представлена в памяти компьютера? Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в двоичном коде. Это значит, что каждый символ представляется 8-разрядным двоичным кодом. Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до или соответствующий ему двоичный код от до Таким образом, человек различает символы по их начертанию, а компьютер - по их коду. Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, символов — это вполне достаточное количество для представления самой разнообразной символьной информации. Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу. Понятно, что это дело условное, можно придумать множество способов кодировки. Все символы компьютерного алфавита пронумерованы от 0 до Каждому номеру соответствует восьмиразрядный двоичный код от до Этот код просто порядковый номер символа в двоичной системе счисления. Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки. Для разных типов ЭВМ используются различные таблицы кодировки. Международным стандартом для ПК стала таблица ASCII читается аски Американский стандартный код для информационного обмена. Таблица кодов ASCII делится на две части. Международным стандартом является лишь первая половина таблицы, то есть символы с номерами от 0 , до Структура таблицы кодировки ASCII Порядковый номер Код Символ 0 - 31 - Символы с номерами от 0 до 31 принято называть управляющими. Их функция — управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т. Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы. Символ 32 - пробел, то есть пустая позиция в тексте. Все остальные отражаются определенными знаками. Вторая половина кодовой таблицы ASCII, называемая кодовой страницей кодов, начиная с и кончая , может иметь различные варианты, каждый вариант имеет свой номер. Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита. Для букв русского алфавита также соблюдается принцип последовательного кодирования. Вторая половина таблицы кодов ASCII К сожалению, в настоящее время существуют пять различных кодировок кириллицы КОИ8-Р, Windows. MS-DOS, Macintosh и ISO. Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую. Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 'Код обмена информацией, 8-битный'. Эта кодировка применялась еще в ые годы на компьютерах серии ЕС ЭВМ, а с середины х стала использоваться в первых русифицированных версиях операционной системы UNIX. От начала х годов, времени господства операционной системы MS DOS, остается кодировка CP 'CP' означает 'Code Page', 'кодовая страница'. Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac. Кроме того, Международная организация по стандартизации International Standards Organization, ISO утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP С конца х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode. Это разрядная кодировка, то есть в ней на каждый символ отводится 2 байта памяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов. Попробуем с помощью таблицы ASCII представить, как будут выглядеть слова в памяти компьютера. Внутреннее представление слов в памяти компьютера Слова Память file disk Иногда бывает так, что текст, состоящий из букв русского алфавита, полученный с другого компьютера, невозможно прочитать - на экране монитора видна какая-то 'абракадабра'. Это происходит оттого, что на компьютерах применяется разная кодировка символов русского языка. Символы с номерами от 0 до 31 принято называть управляющими. Стандартная часть таблицы английский. Альтернативная часть таблицы русская.

Козлова е и конституционное право россии 2015

Описание 2 серии великолепный век

Как заряжать внешний аккумулятор

Кодирование информации 3

Вента 15 мойка воздуха

Очищающее молочко для лица как пользоваться

Здравый смысл комаровский

Характеристика поместного дворянства в романе евгений онегин

Проблемы сохранения человеческих ресурсов экология

Справочный материал «Кодирование текстовой информации»

Как набрать петли для эластичной резинки

Государственный бюджет входит в состав

Расписание автобусов кушва нижний тагил 116

Сколько стоит мотор хонда

Характеристика услуг коммерческого банка

Технические характеристики ваз 11183

Игры где надо запускать ракеты

Кодирование текстовой информации в компьютере

Как лечить насморк видео

Рак и петух характеристика

Как сварить русский борщ

Понятие материального и идеального в философии

Сколько калорий в яичнице из 2 яиц

Report Page