Lossless компресия Уикипедия

В този план, има и други приложения, вижте. Компресия.

компресия без загуба на данни се използва в много приложения. Например, тя се използва във всички файл архиватор. Тя се използва и като компонент в компресия със загуби.







се използва компресия без загуби, когато самоличността на важни компресирани данни на оригинала. Типичен пример - изпълними файлове и изходния код. Някои графични формати файлове (като PNG) използват само компресия без загуби, докато други (TIFF. MNG или GIF) файлове могат да използват компресия със загуби, тъй като и без загуби.

Компресиране и комбинаторика [| ]

Лесно е да се докаже теоремата.

За всяко N> 0 е алгоритъм за компресия без загуби, което е:

  1. Всеки файл, който е не повече от N байта, или листа от една и съща дължина, или намалението.
  2. Файлът вече не е от това, Н. е сведена до най-малко един байт.

Доказателство. Без ограничение на общността можем да предположим, че А файла е намалял с дължина точно Н. Нека азбуката като # X03A3; , Помислете снимачната площадка # X03A3; 0 # X222A; # X03A3; 1 # X222A; # X2026; # X222A; # X03A3; N # X2212; 1 # X222A; \ Cup \ Sigma ^ \ чаша \ ldots \ чаша \ Sigma ^ \ чаша \>. В този набор от 256 0 + 256 + 1 # X2026; 256 N + # X2212; 1 + 1 256 файлове ^ + \ ldots + 256 ^ + 1> източник, а не компресира повече от 256 256 0 + 1 + # X2026; 256 N + # X2212; 1 256 ^ + \ ldots + 256>. Следователно, функцията за декомпресия е двусмислен. противоречие. Това доказва теоремата.

Въпреки това, тази теорема не хвърли сянка върху компресия без загуби. Факт е, че който и да е алгоритъм за компресиране може да бъде променен, така че да увеличава размера на не повече от 1 бит: ако алгоритъмът намалена файла, пише "1", а след това на сгъстен последователност, ако се увеличи - пише "0", а след това на оригинала.

Така несвиваеми фрагменти няма да доведат до неконтролирано "издуват" архива. "Реал" е с дължина N файлове е много по-малко от 256 N> (да кажем, че те са с ниско информация ентропия) - например, че е малко вероятно, че комбинацията от букви "NULL" се срещнаха в смислен текст и цифрови аудио нива не може за една проба да скочи от 0 до 100%. Освен това, в резултат на специализация в определен тип алгоритми данни (.. текстови, графични, звукови и т.н.), е възможно да се постигне по-висока степен на компресия: например, се оценяват в архиватор универсални алгоритми компресират звука с около една трета (1.5 пъти) докато FLAC - 2.5 пъти. Повечето от специализирани алгоритми са от голяма полза за файловете, "чужди" видове: например, аудио данни не компресират алгоритъм, разработен за текстове.







метод за компресиране без загуби [| ]

Като цяло, по смисъла на компресия без загуби е, че подреждането всяка редовността, и с оглед на това закономерности генерира втора последователност в оригиналните данни, която напълно описва оригинала. Например, за кодиране на двоични последователности, в които броят на нули и единици малки, които можем да използваме тази замяна:

В този случай, шестнадесет бита

Те ще се преобразува в тринадесет бита

Такава замяна е код префикс. тоест има такава функция: ако напишете кратък линия без интервали, ние все още ще бъде в състояние да го поставите на пропуските - и по този начин се възстанови оригиналната последователност. Най-добре познат префикс код е код Хъфман.

Повечето алгоритми за компресиране без загуби работят на два етапа: първият се генерира от статистически модел на постъпващите данни, и втората показва входящите данни в двоичен представителство, като се използва модела за "вероятност" (т.е. общите данни), които се използват по-често от "не-вероятност" ,

Статистически модели на алгоритми за текст (двоични или текстови данни като изпълними файлове) включват:

Алгоритми за генериране на кодиращата последователност от битове чрез:

методи за компресия без загуби [| ]

Добавете връзки към източници. предмет на които е темата на тази статия (или част) като цяло, съдържащ елементите в списъка данни като примери. В противен случай, дял може да бъде изтрита.

Многофункционален [| ]

  • Изпълнете Дължина Encoding - проста схема, давайки добра компресия на данни, които съдържат много дублиращи се стойности
  • LZW - използва се в GIF, и много други.
  • Изпуснете - използва се в софтуерна, подобрената версия на цип и PNG, като част от процеса на компресиране.
  • LZMA - използва 7-цип.

Аудио компресия [| ]

Компресиране графика [| ]

текст компресия [| ]

Примери за алгоритми [| ]

  • Семейството на Lempel-Ziv алгоритми
  • УПИ (Run дължина, кодираща - дължина кодиране)

Примери за формати и приложения [| ]

Вижте също [. | ]

Бележки [| ]