Новини високих технологій
» » Кодування ASCII (American standard code for information interchange) - базова кодування тексту для латиниці

Кодування ASCII (American standard code for information interchange) - базова кодування тексту для латиниці

19-09-2017, 10:18
2 347
За даними Міжнародного Союзу електрозв'язку, в 2016 році Інтернетом з тією чи іншою регулярністю користувалося три з половиною мільярди людей. Більшість з них навіть не замислюються про те, що будь-які повідомлення, що посилаються ними через ПК або мобільні гаджети, а також тексти, які відображаються на різних моніторах, насправді являють собою комбінації з 0 і 1. Таке подання інформації називається кодуванням. Воно забезпечує і значно полегшує здійснення її зберігання, обробки та передачі. У 1963 році була розроблена американська кодування ASCII, якій і присвячена дана стаття.


Кодування ASCII (American standard code for information interchange) - базова кодування тексту для латиниці

Представлення інформації в комп'ютері

З точки зору будь-електронно-обчислювальної машини текст являє собою набір окремих символів. До їх числа належать не тільки букви, включаючи великі, але і знаки пунктуації, цифри. Крім того, використовуються спеціальні символи«=»,«&», «(» і прогалини. Безліч символів, з яких складається текст, називається алфавітом, а їх кількість — потужністю (позначається, як N). Для її визначення використовується вираз N = 2^b, де b — число біт або інформаційний вага конкретного символу. Доведено, що алфавіт потужністю 256 символів дозволяє представити всі необхідні символи. Так як 256 являє собою 8 ступінь двійки, то вага кожного символу дорівнює 8 біт. Одиниця виміру 8 біт називається 1 байтом, тому прийнято говорити, що двійковий код будь-якого символу в тексті, що зберігається на комп'ютері, займає один байт пам'яті.

Як здійснюється кодування

Будь-які тексти вводяться в пам'ять персонального комп'ютера за допомогою клавіш клавіатури, на яких написані цифри, букви, розділові знаки та інші символи. В оперативну пам'ять вони передаються в двійковому коді, тобто кожному символу зіставляється звичний для людини десятеричный код від 0 до 255 якому відповідає двійковий код від 00000000 до 11111111.


Побайтовое кодування символів дозволяє процесору, що виконує обробку тексту, звертатися до кожного символу окремо. У той же час 256 символів цілком достатньо для представлення будь-якої символьної інформації.

Кодування символів ASCII

Ця абревіатура англійською розшифровується як American standard code for information interchange. Ще на зорі комп'ютеризації стало очевидно, що можна придумати найрізноманітніші способи кодування інформації. Однак для перенесення інформації з однієї ЕОМ на іншу потрібно було розробити єдиний стандарт. Так, у 1963 році в США з'явилася таблиця кодування ASCII. В ній будь-якому символу комп'ютерного алфавіту поставлений у відповідність його порядковий номер у двійковому представленні. Спочатку кодування ASCII використовувалася лише в Сполучених Штатах, а потім стала міжнародним стандартом для ПК.

Зміст таблиці

Коди ASCII діляться на 2 частини. Міжнародним стандартом вважається лише перша половина цієї таблиці. У неї входять символи з порядковими номерами від 0 (кодується як 00000000) до 127 (код 01111111).

Порядковий номер N



Кодування тексту ASCII



Символ



0 - 31



00000000 - 00011111



Символи з N від 0 до 31 називають керуючими. Їх функцією є керівництво процесом виведення тексту на монітор або друкуючий пристрій, подача звукового сигналу і т. п.



32 - 127



00100000 - 01111111



Символи з N від 32 до 127 (стандартна частина таблиці) — прописні і рядкові букви латинського алфавіту, 10-ві цифри, знаки пунктуації, а також різні дужки, комерційні та ін. символи. Символом 32 позначається пробіл.



128 - 255



10000000 - 11111111



Символи з N від 128 до 255 (альтернативна частина таблиці або кодова сторінка) можуть мати різні варіанти, кожен з яких має свій номер. Кодова сторінка використовується для завдання національних алфавітів, які відмінні від латинського. Зокрема, саме з її допомогою здійснюється кодування ASCII для російських символів.

В таблиці кодування прописні і рядкові букви йдуть одна за одною в алфавітному порядку, а цифри - за зростанням значень. Такий принцип зберігається і для російського алфавіту.

Керуючі символи

Таблиця кодування ASCII спочатку створювалася для прийому і передачі інформації за таким вже давно не використовується пристрою, як телетайп. У зв'язку з цим у набір символів були включені недруковані, використовувані в якості команд для керування цим пристроєм. Подібні команди застосовувалися і в таких докомпьютерных методи обміну повідомленнями, як азбука Морзе та ін
Найпоширенішим «телетайпным» символом є NUL (00 «нульовий»). Він і донині використовується в більшості мов програмування, позначаючи ознака кінця рядка.

Де застосовують кодування ASCII

Американський стандартний код необхідний не тільки для введення текстової інформації за допомогою клавіатури. Його також використовують у графіку. Зокрема, у програмі ASCII Art Maker зображення різних розширень являють собою спектр символів кодування ASCII. Подібні продукти бувають двох типів: виконують функцію графічних редакторів шляхом перетворення зображення в текст і конвертують «малюнки» в ASCII-графіком. Наприклад, відомий смайлик є яскравим прикладом кодировочного символу.
ASCII може використовуватися і при створенні документа HTML. У такому випадку ви можете вводити певний набір знаків, а при перегляді сторінки на екрані з'явиться символ, який відповідає даному коду. ASCII необхідний і для створення багатомовних сайтів, так як знаки, які не входять у конкретну національну таблицю, замінюються ASCII-кодами.

Деякі особливості

Для кодування текстової інформації в кодуванні ASCII спочатку використовували 7 біт (один залишався порожнім), однак сьогодні вона працює як 8-бітна. Букви, розташовані в колонках, що знаходяться зверху і знизу, відрізняються один від одного тільки одним-єдиним бітом. Це значно знижує ступінь складності перевірки.

Застосування ASCII Microsoft Office

При необхідності цей вид кодування текстової інформації може використовуватися в текстових редакторах корпорації Microsoft, таких як Notepad і Office Word. Однак при наборі тексту в такому випадку буде неможливо використати деякі опції. Наприклад, ви не зможете здійснювати виділення жирним шрифтом, так як кодування ASCII зберігає тільки зміст інформації, ігноруючи її загальний вигляд і форму.

Стандартизація

Організація ISO прийняла стандарти ISO 8859. Ця група визначає восьмібітних кодування для різних мовних груп. Зокрема, ISO 8859-1 — це Extended ASCII представляє собою таблицю для Сполучених Штатів і країн Західної Європи. А ISO 8859-5 — це таблиця, що використовується для кирилиці, в тому числі для російської мови. По ряду історичних причин стандарт ISO 8859-5 використовувався дуже недовго. Для російської мови на даний момент реально застосовуються кодування: CP866 (Code Page 866) або DOS, яка часто називається альтернативною кодуванням ГОСТ. Вона активно використовувалася до середини 90-х років минулого століття. На даний момент практично не використовується. КОІ-8. Кодування була розроблена у 1970-80-ті роки, і на даний момент це загальноприйнятий стандарт для поштових повідомлень в Рунеті. Вона широко використовується в ОС сімейства Unix, у тому числі Linux. «Російський» варіант КОІ-8 називається KOI-8R. Крім того, існують версії і для інших кириличних мов, наприклад українського. Code Page 1251 (CP 1251 Windows - 1251). Розроблений корпорацією Microsoft для забезпечення підтримки російської мови в середовищі Windows. Основною перевагою першого стандарту CP866 було збереження псевдографических символів на тих же позиціях, що і в Extended ASCII. Це дозволяло запускати без змін текстові програми, закордонного виробництва, такі як відомий Norton Commander. На даний момент CP866 застосовується для програм, розроблених під ос Windows, які працюють в повноекранному текстовому режимі або в текстових вікнах, в тому числі в FAR Manager. Комп'ютерні тексти, написані в кодуванні CP866 останнім часом зустрічаються досить рідко, однак саме вона застосовується для російських імен файлів в "Віндоус".

"Юнікод"

На даний момент найбільш широке поширення отримала саме ця кодування. Коди "Юнікод" розділені на області. Перша (від U+0000 до U+007F) включає символи ASCII з кодами. Потім слідують області знаків різних національних писемностей, а також пунктуаційні знаки та технічні символи. Крім того, частина кодів "Юнікод" зарезервована на випадок виникнення необхідності включити нові символи в майбутньому.
Тепер ви знаєте, що в кодуванні ASCII кожен символ представляється як комбінація 8 нулів і одиниць. Неспеціалістам ця інформація може здатися непотрібним і нецікавим, але хіба вам не хоче знати, що відбувається «в мізках» вашого ПК?!
Цікаво по темі
ID вертольота в Unturned. Рекомендації по ID предметів у грі
ID вертольота в Unturned. Рекомендації по ID предметів у грі
Якщо вам потрібен вертоліт в Unturned, то вам в першу чергу потрібно дізнатися рекомендації по консольним командам, а потім вивчити його ID.
ASCII символи: опис, таблиця кодів і види
ASCII символи: опис, таблиця кодів і види
Кодування ASCII була розроблена понад півстоліття тому і протягом багатьох років була найпопулярнішою в світі. У цій статті розглянемо, як
Спосіб кодування інформації за допомогою чисел. Двійкове кодування
Спосіб кодування інформації за допомогою чисел. Двійкове кодування
У процесі розвитку людство прийшло до усвідомлення необхідності зберігати і передавати на відстані ту чи іншу інформацію. В останньому випадку
Вільна таблиця символів Юнікоду
Вільна таблиця символів Юнікоду
Unicode - це міжнародний стандарт кодування символів, що дозволяє одноманітно відображати тексти на ...
Рядковий оператор в Pascal - string
Рядковий оператор в Pascal - string
Програмування постійно пов'язане з роботою з деякими даними, зокрема, з рядками. Рядковий оператор задається однаково в більшості мов, у тому числі в
Htaccess (кодування): налаштування, приклади використання
Htaccess (кодування): налаштування, приклади використання
Кожна людина, займаючись серфінгом в інтернеті, набредал на такі веб-сторінки і сайти, які некоректно відображаються. Наприклад, відкривши