Lossless компресия Уикипедия
В този план, има и други приложения, вижте. Компресия.
компресия без загуба на данни се използва в много приложения. Например, тя се използва във всички файл архиватор. Тя се използва и като компонент в компресия със загуби.
се използва компресия без загуби, когато самоличността на важни компресирани данни на оригинала. Типичен пример - изпълними файлове и изходния код. Някои графични формати файлове (като PNG) използват само компресия без загуби, докато други (TIFF. MNG или GIF) файлове могат да използват компресия със загуби, тъй като и без загуби.
Компресиране и комбинаторика [| ]
Лесно е да се докаже теоремата.
За всяко N> 0 е алгоритъм за компресия без загуби, което е:
- Всеки файл, който е не повече от N байта, или листа от една и съща дължина, или намалението.
- Файлът вече не е от това, Н. е сведена до най-малко един байт.
Доказателство. Без ограничение на общността можем да предположим, че А файла е намалял с дължина точно Н. Нека азбуката като # X03A3; , Помислете снимачната площадка # X03A3; 0 # X222A; # X03A3; 1 # X222A; # X2026; # X222A; # X03A3; N # X2212; 1 # X222A; \ Cup \ Sigma ^ \ чаша \ ldots \ чаша \ Sigma ^ \ чаша \>. В този набор от 256 0 + 256 + 1 # X2026; 256 N + # X2212; 1 + 1 256 файлове ^ + \ ldots + 256 ^ + 1> източник, а не компресира повече от 256 256 0 + 1 + # X2026; 256 N + # X2212; 1 256 ^ + \ ldots + 256>. Следователно, функцията за декомпресия е двусмислен. противоречие. Това доказва теоремата.
Въпреки това, тази теорема не хвърли сянка върху компресия без загуби. Факт е, че който и да е алгоритъм за компресиране може да бъде променен, така че да увеличава размера на не повече от 1 бит: ако алгоритъмът намалена файла, пише "1", а след това на сгъстен последователност, ако се увеличи - пише "0", а след това на оригинала.
Така несвиваеми фрагменти няма да доведат до неконтролирано "издуват" архива. "Реал" е с дължина N файлове е много по-малко от 256 N> (да кажем, че те са с ниско информация ентропия) - например, че е малко вероятно, че комбинацията от букви "NULL" се срещнаха в смислен текст и цифрови аудио нива не може за една проба да скочи от 0 до 100%. Освен това, в резултат на специализация в определен тип алгоритми данни (.. текстови, графични, звукови и т.н.), е възможно да се постигне по-висока степен на компресия: например, се оценяват в архиватор универсални алгоритми компресират звука с около една трета (1.5 пъти) докато FLAC - 2.5 пъти. Повечето от специализирани алгоритми са от голяма полза за файловете, "чужди" видове: например, аудио данни не компресират алгоритъм, разработен за текстове.
метод за компресиране без загуби [| ]
Като цяло, по смисъла на компресия без загуби е, че подреждането всяка редовността, и с оглед на това закономерности генерира втора последователност в оригиналните данни, която напълно описва оригинала. Например, за кодиране на двоични последователности, в които броят на нули и единици малки, които можем да използваме тази замяна:
В този случай, шестнадесет бита
Те ще се преобразува в тринадесет бита
Такава замяна е код префикс. тоест има такава функция: ако напишете кратък линия без интервали, ние все още ще бъде в състояние да го поставите на пропуските - и по този начин се възстанови оригиналната последователност. Най-добре познат префикс код е код Хъфман.
Повечето алгоритми за компресиране без загуби работят на два етапа: първият се генерира от статистически модел на постъпващите данни, и втората показва входящите данни в двоичен представителство, като се използва модела за "вероятност" (т.е. общите данни), които се използват по-често от "не-вероятност" ,
Статистически модели на алгоритми за текст (двоични или текстови данни като изпълними файлове) включват:
Алгоритми за генериране на кодиращата последователност от битове чрез:
методи за компресия без загуби [| ]
Добавете връзки към източници. предмет на които е темата на тази статия (или част) като цяло, съдържащ елементите в списъка данни като примери. В противен случай, дял може да бъде изтрита.
Многофункционален [| ]
- Изпълнете Дължина Encoding - проста схема, давайки добра компресия на данни, които съдържат много дублиращи се стойности
- LZW - използва се в GIF, и много други.
- Изпуснете - използва се в софтуерна, подобрената версия на цип и PNG, като част от процеса на компресиране.
- LZMA - използва 7-цип.
Аудио компресия [| ]
Компресиране графика [| ]
текст компресия [| ]
Примери за алгоритми [| ]
- Семейството на Lempel-Ziv алгоритми
- УПИ (Run дължина, кодираща - дължина кодиране)