Опрос

Какой архиватор наиболее эффективный?:

Новички

Виктор Васильев
Юрий Антонов
Сергей Андреевич
Генадий
Avanasy

Карта групп методов сжатия


Статистические

Преобразующие

Поточные

Блочные1''

" Поточные

Блочные

Для "слов", модель "Источник с памятью"

CM, DMC, все РРМ

CMBZ, pre­conditioned PPMZ

Все LZ, в т.ч. LZH и LZW

ST, в т, ч. BWT

Для "элементов", модели "Источник без памяти" или "Анало­говый сигнал"

Адаптив­ный HUFF

Статиче­ский HUFF

SEM, VQ, MTF, DC, SC, DWT

DCT, FT, фрак­тальные методы

Для "элементов" или "битов"

Адаптив­ный ARIC

Статиче­ский ARIC

RLE, LPC, в т.ч. дельта

PBS, ENUC

Каждая группа (ветвь, семейство) содержит множество методов. Исклю­чением является блочно-ориентированный СМ - это относительно мало ис­следованная область. Авторам не известны другие практические реализа­ции, кроме компрессоров СМ Булата Зиганшина и "pre-conditioned PPMZ" Чарльза Блума.

Статистические методы оперируют величинами вероятностей элементов напрямую (или величинами относительных частот1, что по сути то же са­мое), а преобразующие используют статистические свойства данных опо­средованно. Есть и методы смешанного типа, но их меньше.

Все поточные методы применимы и к блокам, но обратное неверно. Блочные методы неприменимы к потокам, поскольку не могут начать вы­полнение, пока не задана длина блока, заполненного данными, подлежащи­ми сжатию.

В первой строке "карты групп" - методы для источников с памятью, по­рождаемые ими данные выгодно трактовать как слова. Однако методы для потоков "слов" оперируют, как правило, элементами заданного размера, а не словами, поскольку разбиение потока элементов на слова заранее в общем случае неизвестно.

Во второй строке - методы для источников без памяти и аналоговых сигналов. Эти данные при сжатии невыгодно рассматривать как слова.

Не все методы для потоков R-битовых "элементов" применимы к "би­там" (только те, которые в третьей строке "карты").

Очевидно, что невыгодно применять методы для "элементов" - к "сло­вам" или "битам". Менее очевидно, что невыгодно и обратное: применять методы для потоков "слов" к данным без значимых вероятностных взаимо­связей, к "элементам" или "битам".