|
▼KAZさん:
>「データ圧縮ハンドブック」は統計モデルのかなりのテクニックがかいてありますが、それらは全てやってもLZHに負けると?う〜む謎。
まあ、速度とかパフォーマンスにかなり重点を置いていますので(ある程度無視するんじゃなかったのか?)、最高のものとはいえないでしょう。
とりあえず、現時点でのスペックは、
16ビットの算術符号であること(高速化のため)<かなり高速と思われます
最大約3MBのワークを必要とする(大抵そんなには使わないけど)
圧縮率が、ERINA でつかっている1次ハフマンより1〜2割良い。
こんなところです。
もちろん、ERISA が最大のターゲットとしているデータだと LZH よりもだいぶ圧縮率はいいです。
ちなみに、まったくのエントロピー符号のみ(差分処理などを行わない)での比較をすると、ERISA と ERINA では以下のようなサイズの差があります。(性能評価のページにある画像です)
photo.bmp : 1407 KB
ERINA : 1143 KB
ERISA : 1047 KB
scape.bmp : 901 KB
ERINA : 619 KB
ERISA : 470 KB
eri.bmp : 698 KB
ERINA : 361 KB
ERISA : 257 KB
PPMの統計モデルのツリーの構成を、パターンデータに特化してあげれば、パターンデータでは圧縮率が上がるのですが、マルチメディア系のデータだと圧縮率が伸び悩むので、とりあえずこんなんでいこうかと…(汗)
|
|