Стиснення даних
Одну й ту саму інформацію можна закодувати за допомогою інформаційних повідомлень різної довжини. Наприклад, у разі використання системи Unicode, де для подання символу виділено 16 біт (2 байти), для запису слова «мир» знадобиться 6 байт, а у разі використання системи ASCII, де для подання символу виділено 8 біт, — удвічі менше (3 байти). Очевидно, що у разі використання в тексті набору з 256 символів система кодування Unicode для нього надлишкова.
Стиснення даних — це процедура перекодування даних з метою зменшення їхнього обсягу.
Стиснення базується на усуненні надлишковості інформації, зокрема на заміні часто повторюваних послідовностей коротшим значенням (кодом). Такими послідовностями можуть бути масиви пікселів однакового кольору в растровому зображенні, слова в тексті тощо. Наприклад, кожна тисяча символів тексту, записаного українською мовою, містить літер «о» чи «і» на порядок більше, ніж, скажімо, «ф», та найбільше в ній, звісно, пробілів. Тож якщо для найпоширеніших символів використати коротші коди (менші за 8 біт), а для менш поширених — довші (понад 8 біт), то текст у цілому займе менше пам'яті, ніж у разі застосування стандартного кодування.
Буває стиснення без втрат, коли вихідні дані можна відновити без викривлень, і з втратами, коли дані можна відновити лише з викривленнями, які, проте, можуть бути непомітними для людини.
Стиснення без втрат застосовують до текстової інформації, а стиснення із втратами — до звукової, графічної та відеоінформації, і саме воно дає змогу значно зменшити обсяги даних. У цьому разі на основі спеціальних досліджень визначають, якою інформацією можна пожертвувати. Відомо, наприклад, що зір людини дуже чутливий до зміни яскравості й значно менше — до колірного відтінку, тому під час стиснення фотографічних зображень інформацію про колір частини пікселів можна видалити. їхній колір у ході розпакування зображення визначатиметься за кольором сусідніх пікселів.
Стиснення із втратами виконується у таких поширених форматах, як JPEG (графічний формат), МРЗ (аудіоформат) та MPEG (відеоформат).