Кодування даних
Щоб працювати з даними різних видів, необхідно уніфікувати форму їх подання, а це дозволяє зробити кодування даних. Кодуванням ми займаємося досить часто, наприклад, людина мислить дуже розпливчастими поняттями, і щоб донести думку від однієї людини до іншої, застосовується мова. Мова – це система кодування понять. Щоб записати слова мови, застосовується знову ж таки кодування – абетка. Проблемами універсального кодування займаються різні галузі науки, техніки, культури. Згадаймо, що креслення, ноти, математичні викладки – це також деяке кодування різноманітних інформаційних об'єктів. Аналогічно, універсальна система кодування потрібна для того, щоб велику кількість різних видів інформації можна було б обробити на комп'ютері.
Підготовка даних для обробки на комп'ютері (подання даних) в інформатиці має свою специфіку, пов'язану з електронікою. Наприклад, хочемо проводити розрахунки на комп'ютері. При цьому нам доведеться кодувати цифри, якими записано цифри. На перший погляд, цілком природним є кодування цифри нуль станом електронної схеми, де напруга на деякому елементі дорівнюватиме 0 вольт, цифру один - 1 вольт, двійку - 2 вольт і т.д., дев'ятку - 9 вольт. Для запису кожного розряду числа в цьому випадку буде потрібен елемент електронної схеми, що має десять станів. Однак елементна база електронних схем має розкид параметрів, що може призвести до появи напруги, скажімо, 3,5 вольт, а воно може бути витлумачено як трійка і як четвірка, тобто потрібно на рівні електронних схем "пояснити" комп'ютеру, де закінчується трійка, а де починається четвірка. З іншого боку, доведеться створювати дуже непрості електронні елементи виробництва арифметичних операцій із числами, тобто на схемному рівні повинні бути створені таблиця множення – 10х10 = 100 схем та таблиця додавання – теж 100 схем. Для електроніки 40-х р. (час, коли з'явилися перші обчислювальні машини) це було непосильне завдання. Ще складнішим виглядало б завдання обробки текстів, адже алфавіт містить 33 літери. Очевидно, таке кодування обчислювальних систем не спроможне.
У той самий час дуже просто реалізувалися кодування з урахуванням електронних схем із двома стійкими станами: є струм – 1, немає струму – 0, є електричне (магнітне) полі – 1, немає – 0. Універсальну форму подання даних для подальшої обробки їх засобами обчислювальної техніки. Передбачається, що дані розташовуються в деяких осередках, що представляють упорядковану сукупність із двійкових розрядів, а кожен розряд може тимчасово містити один із станів – 0 або 1. Тоді групою з двох двійкових розрядів (двох біт) можна закодувати 22 = 4 різні комбінації кодів (00, 01, 10, 11); аналогічно, три біти дадуть 23 = 8 комбінацій, вісім біт або 1 байт - 28 = 256 і т.д.
Отже, внутрішня абетка комп'ютера дуже бідна, містить лише два символи: 0, 1, тому і виникає кодування всього різноманіття типів даних – чисел, текстів, звуків, графічних зображень, відео та ін. – лише цими двома символами, з метою подальшої обробки засобами обчислювальної техніки.
