Кодирование алфавитно-цифровой информации

05 Янв 2009  |  Автор:  |  Рубрика: Статьи  | 

Кодирование алфавитно-цифровой информацииЗарубежные компьютеры, совместимые с ЭВМ IBM РС, имеют единую кодировку символов, т.е. таблицу кодов, в которой каждому изображаемому на экране символу соответствует код от 0 до 255. Однако в этой таблице отсутствует символы кириллицы (русские буквы). Поэтому в бывшем СССР и Болгарии были созданы различные модификации таблицы кодов IBM, содержащие символы кириллицы для кодирования алфавитно-цифровой информации.
Следует учитывать, что эти кодировки не согласуются между собой и, как следствие, программы, выдающие сообщения на русском языке, при переносе на компьютер с другой кодировкой работают неправильно. Что касается символов с кодами 0 — 127 (управляющие коды, латинские буквы, цифры, знаки пунктуации и т.д.), то все эти кодировки совпадают с кодировкой IBM на основании ASCII — кода (American standart code for information interchange — американский стандартный код для обмена информацией; внедрен в 1963 году). В связи с этим программы, которые выводят на экран сообщения на английском языке, будут работать одинаково и не зависят от того, какая кодировка символов используется в компьютере.
Коды от 0 до 31 и 127 являются управляющими.

Для некоторых команд используются управляющие ASCII — коды, например: 7 — звонок, 10 — перевод строки, 13 — возврат каретки, 24 — отмена строки, 127 — забой знака.
Для большинства из них формируются так называемые ASC — последовательности, т.е. наборы байтов, первый из которых имеет код ESC (десятичный номер 27). После ESC следует байт с кодом команды, которым может быть любой символ ASC — кода. Затем идут байты с параметрами команды ( если они необходимы).
С помощью ESC — последовательностей можно устанавливать большое число различных шрифтов, задавать графический режим, определять любые собственные знаки, выравнивать текст на странице, устанавливать интервал между строками и символами, производить табуляцию, выбирать различные наборы знаков для расширенной таблицы ASCII-кода и т.д.
Символы с кодами от 32 до 126 являются также общими для всех кодировок.
Из пяти наиболее распространенных кодировок для кодирования алфавитно-цифровой информации с использованием кириллицы наиболее удачными считаются альтернативная кодировка ГОСТа и модифицированная альтернативная кодировка ГОСТа. В этих кодировках символы кириллицы расположены на тех позициях, где в кодировке IBM расположены относительно редко используемые символы национальных алфавитов и греческие буквы.

Альтернативная кодировка ГОСТа и модифицированная альтернативная
кодировка ГОСТа отличаются в основном кодами с 242 по 255.

google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru

Отзывов нет | Нам важно ваше мнение!

К сожалению, отзывы пока закрыты.