BigEdu.ru
» » » Двоичное кодирование текстовой информации
Вернуться назад

Двоичное кодирование текстовой информации

Двоичное кодирование текстовой информации.

p align="justify">Традиционно для кодирования одного символа используется 1 байт (8 двоичных разрядов). Это позволяет закодировать N = 28 = 256 различных символов, которых обычно бывает достаточно для представления тексто­вой информации (прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д.).

Начиная с 60 годов, компьютеры все больше стали использоваться для обработки текстовой информации.

Традиционно для кодирования одного символа используется 1 байт (8 двоичных разрядов). Это позволяет закодировать N = 28 = 256 различных символов, которых обычно бывает достаточно для представления тексто­вой информации (прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д.).

При двоичном кодировании текстовой информации каждому символу ставится в соответствие своя уникальная последовательность из восьми нулей и единиц, свой уникаль­ный двоичный код от 00000000 до 11111111 (десятичный код от 0 до 255).

Присвоение символу конкретного двоичного кода - это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 по 32) соответствуют не символам, а операциям (перевод строки, ввод про­бела и т.д.). Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв, поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ-8 («Код обмена информацией 8-битный»). Эта кодировка применяется на компьютерах с операционной системой UNIX.

Наиболее распространенная кодировка- это стандартная кириллическая кодировка Microsoft Windows, обозначаемая сокращением СР1251 («СР» означает «Code Page», «кодовая страница»). Все Windows-приложения, работающие с русским языком, поддерживают эту кодировку.

Таблица 3.2. Кодировки символов

Двоичный код Десятичный код КОИ8 СР1251 СР866 Mac _ ISO
00000000 0
00001000 8 Удаление последнего символа (клавиша Backspace)
00001101 13 перевод строки (клавиша Enter)
00100000 32 пробел
00100001 33 !
01011010 90 Z
01111111 127 п
128 - Ъ А А к
11000010 194 Б В - - Т
11001100 204 Л м i i i i Ь
11011101 221 Щ э - Ё н
11111111 255 ь я

нераэ.

пробел

нераз. пробел п

Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft - кодировка СР866.

Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Мае).

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Как видно из таблицы, одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы. Каждая кодировка задается своей собственной кодовой таблицей.

Например, последовательность числовых кодов 221, 194, 204 в кодировке СР1251 образует слово ЭВМ, тогда как в других кодировках это будет бессмысленный набор символов.

К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов. При работе в приложениях Windows предусмотрена возможность автоматической перекодировки документов, созданных в приложениях MS-DOS. При работе в Интернет с использованием броузеров Internet Explorer и Netscape Communicator происходит автоматическая перекодировка Web-страниц.

В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а N = 216 = 65536 различных символов. Эту кодировку поддерживает платформа Microsoft WindowsOffice 97.

Двоичное кодирование графической информации

С 80-х годов интенсивно развивается технология обработки на компьютере графической информации. Компьютерная графика позволяет создавать и редактировать рисунки, схемы, чертежи, преобразовывать изображения (фотографии, слайды и т.д.), представлять статистические данные в форме делово

Внимание, отключите Adblock

Вы посетили наш сайт со включенным блокировщиком рекламы!
Ссылка для скачивания станет доступной сразу после отключения Adblock!

Скачать
Рефераты по информатике и программированию Двоичное кодирование текстовой информации. p align="justify">Традиционно для кодирования одного символа используется 1 байт (8
Оценок: 1007 (Средняя 5 из 5)

Наверняка у вас есть товары или услуги, продажа которых приносит вам максимальную прибыль. Для быстрого старта в сети вам необходимо создание посадочной страницы (одностраничного сайта), на которой будет размещена информация о маржинальных товарах/услугах интернет магазина. За 8 лет опыта разработки конверсионных страниц мы выработали оптимальную структуру, которая позволит привлекать через landing page больше продаж. На такую структуру «одевается» ваш контент — фирменный стиль, тексты, фотографии, уникальные торговые предложения, после чего страница выходит в свет. Разработка лендинга и запуск в сети — до 7 рабочих дней. Стоит отметить, что в разработку самой посадочной страницы входит и написание копирайтером продающих текстов для вашего бизнеса, чтобы каждый посетитель страницы захотел совершить покупку именно у вас. Результат: качественно разработаная продающая посадочная страница, которая готова приносить вам новых клиентов.

© 2016 - 2022 BigEdu.ru