Новини високих технологій
» » ASCII символи: опис, таблиця кодів і види

ASCII символи: опис, таблиця кодів і види

14-09-2017, 11:30
6 123
Як відомо, комп'ютер зберігає інформацію в двійковому вигляді, представляючи її як послідовності одиниць і нулів. Щоб перевести інформацію у форму, зручну для людського сприйняття, кожна унікальна послідовність цифр при відображенні замінюється на відповідний символ. Однією з систем співвіднесення бінарних кодів з друкованими та керуючими символами є кодування ASCII. При сьогоднішньому рівні розвитку комп'ютерних технологій від користувача не вимагається знання коду кожного конкретного символу. Однак загальне розуміння того, як здійснюється кодування, є вкрай корисним, а для деяких категорій спеціалістів і зовсім необхідним.


Створення ASCII

У первісному вигляді кодування була розроблена 1963 році і потім протягом 25 років двічі оновлювалася. У вихідному варіанті таблиця символів ASCII включала 128 символів, пізніше з'явилася розширена версія, де перші 128 символів були збережені, а кодами з задіяним восьмим бітом поставлені у відповідність відсутні раніше символи.
Протягом багатьох років дана кодування була найпопулярнішою в світі. У 2006 році провідне місце зайняла Latin 1252 а з кінця 2007 року по теперішній час лідируючу позицію міцно тримає Юнікод.

Комп'ютерне подання ASCII

Кожен ASCII-символ має власний код, що складається з 8 знаків, що представляють собою нуль або одиницю. Мінімальним числом у такому поданні є нуль (вісім нулів у двійковій системі), який і є кодом першого елемента в таблиці.


Максимальним двійковим кодом у вихідній версії ASCII є нуль + сім одиниць, а в розширеній версії – вісім одиниць, оскільки підключається восьмий біт.

Керуючі символи

Керуючими символами називаються знаки, що не мають графічного представлення використовуються для організації тексту, управління пристроями і т. д. Вони можуть означати початок або кінець тексту, табуляцію, генерацію звукового сигналу, різні операції для роботи по телетайпу (телетайп – машина для передачі даних по електричній каналу), дозвіл виводу даних на пристрої, скасування дії та ін
В таблиці символів ASCII позиції з 0 до 31 а також 127 виділені під керуючі символи. Всього таких знаків 33.

Інші символи

Решту 95 позицій відведені під розділові знаки і знаки математичних операцій, десяткові цифри, літери латинського алфавіту, що розрізняються регістром: «А» великої і «а» рядкової відповідають різні коди таблиці символів ASCII.

Номери символів у таблиці

Якщо людина займається розробкою програмного забезпечення або виконує деякі інші завдання з області інформаційних технологій, йому необхідно знати номери ряду символів ASCII. Як згадувалося вище, позиції 0-31 і 127 займають керуючі символи. Номер 32 закріплений за пробілом, номера 33-47 і 58-64 відведені під знаки пунктуації та основні математичні операції.
Латинські літери розташовані за абеткою і мають номери з 65-го по 90-й. Рядкові букви також розташовані за алфавітом, їх позиції – з 97-ї по 122-ю. Залишилися номери (91-96 і 123-126) закріплені за квадратними і фігурними дужками, косий і прямий рисою, а також деякими діакритичними знаками.
Повну таблицю символів зручному графічному поданні можна побачити на зображенні, наведеному вище. На малюнку нижче демонструються номери знаків у російській таблиці символів ASCII.

Розширена ASCII

Оскільки вихідний варіант кодування розроблявся в розрахунку на американського користувача, в ньому не були передбачені не тільки різні види писемності та національні алфавіти, але навіть зручне використання діакритичних знаків, активно употребляющихся в європейських мовах.
Для формування розширеної кодування був задіяний 8-й біт. Дана версія включає в себе символи національних європейських алфавітів і фонетичної транскрипції, елементи графіки, що використовувалися для малювання таблиць, ряд математичних знаків. Деякі символи ASCII сьогодні використовуються рідко. Зокрема, це стосується знаків, службовців для малювання таблиць, оскільки за роки, що минули з моменту розробки розширеної кодування, були впроваджені набагато більш зручні способи графічного представлення таблиць.

Національні варіанти кодування

До появи розширеного варіанту ASCII для відображення національних алфавітів використовувалися перероблені версії кодування, де на місці латинських літер розташовувалися російські, грецькі, арабські символи. Два коду в таблиці були відведені під перемикання між стандартною US-ASCII і її національним варіантом.
Після того як ASCII стала включати не 128 а 256 знаків, поширення набув варіант кодування, при якому вихідна версія таблиці була збережена в перших 128 кодах з нульовим 8-м бітом. Знаки національної писемності зберігалися у верхній половині таблиці (128-255-я позиції). Знати безпосередньо коди символів ASCII користувачеві не потрібно. Розробнику програмного забезпечення зазвичай достатньо знати номер елемента в таблиці, щоб при необхідності розрахувати його код, використовуючи бінарну систему.

Російська мова

Після розробки на початку 70-х років кодувань для скандинавських мов, китайської, корейської, грецької та ін., створенням власного варіанту зайнявся і Радянський Союз. Незабаром був розроблений варіант 8-бітового кодування під назвою КОИ8 зберігає перші 128 кодів символів ASCII і виділяє стільки ж позицій під літери національного алфавіту та додаткові знаки. До впровадження Юнікоду КОИ8 домінувала в російському сегменті інтернету. Існували варіанти кодування як для російської, так і для українського алфавіту.

Проблеми ASCII

Оскільки кількість елементів навіть у розширеній таблиці не перевищувала 256 можливість вміщення в одну кодування декількох різних писемностей була відсутня. У 90-ті роки в Рунеті з'явилася проблема «крокозябр», коли тексти, набрані російськими символами ASCII, відображалися некоректно. Проблема полягала в невідповідності кодів різних варіантів ASCII один одному. Згадаймо, що на позиціях 128-255 могли розташовуватися різні знаки, і при зміні однієї кириличного кодування на іншу всі букви тексту замінювалися на інші, мають ідентичний номер в іншій версії кодування.

Поточний стан

З появою Юнікоду популярність ASCII різко пішла на спад. Причина цього криється в тому факті, що нова кодування дозволила вмістити знаки майже всіх письмових мов. При цьому перші 128 символів ASCII відповідають тим же символів у кодуванні Юнікод.
У 2000-му ASCII була найпопулярнішою кодуванням в інтернеті і використовувалася на 60 % проіндексованих «Гуглом» веб-сторінок. Вже до 2012 року частка таких сторінок впала до 17 %, а місце найпопулярнішою кодування зайняв Юнікод (UTF-8). Таким чином, ASCII є важливою частиною історії інформаційних технологій, однак її використання в подальшому бачиться малоперспективним.
Цікаво по темі
Заміна термопасти на ноутбуці Lenovo Z570: інструкція
Заміна термопасти на ноутбуці Lenovo Z570: інструкція
Час від часу система охолодження на ноутбуці може давати збої, чому комп'ютер сам вимикається або "гальмує" в процесі роботи. Цілком можливо, заміна
Спосіб кодування інформації за допомогою чисел. Двійкове кодування
Спосіб кодування інформації за допомогою чисел. Двійкове кодування
У процесі розвитку людство прийшло до усвідомлення необхідності зберігати і передавати на відстані ту чи іншу інформацію. В останньому випадку
Вільна таблиця символів Юнікоду
Вільна таблиця символів Юнікоду
Unicode - це міжнародний стандарт кодування символів, що дозволяє одноманітно відображати тексти на ...
Рядковий оператор в Pascal - string
Рядковий оператор в Pascal - string
Програмування постійно пов'язане з роботою з деякими даними, зокрема, з рядками. Рядковий оператор задається однаково в більшості мов, у тому числі в
Htaccess (кодування): налаштування, приклади використання
Htaccess (кодування): налаштування, приклади використання
Кожна людина, займаючись серфінгом в інтернеті, набредал на такі веб-сторінки і сайти, які некоректно відображаються. Наприклад, відкривши