研究テーマ
研究テーマ:複素ウェーブレットを用いた動画像圧縮
概要:
ウェーブレットを用いた画像圧縮では JPEG2000,動画像圧縮では 3D Wavelet が有名であると思いますが,この際に用いられる離散ウェーブレットは
Daubechie 9,7 フィルタなどの実数型ウェーブレットです.このようなウェーブレットの最大の利点は,冗長性を持たないウェーブレットであるということです.つまり,NxN
の原画像に対し離散ウェーブレット変換を行なうと NxN のウェーブレット係数 (スケーリング係数も含め) が発生します.ウェーブレット変換により情報量が増えないため,このウェーブレット係数を量子化し,エントロピー符号化を行なうことでビットストリームが生成されます.
一方で,実数型ウェーブレットの欠点は,シフト不変性が欠如していること,HH サブバンドは ±45° のエッジを混在して保持していること,です.
シフト不変性とは入力信号と出力信号の位相が変化しない性質です.これが欠如していると,画像レベルにおいては,高域サブバンド Level により,画像中のエッジを正確に捉えられたり捉えられなかったりします.また,動画像レベルにおいては,おそらく動物体を正確に追跡できないということになるでしょう
(今後,検討).加えて,位相相関法などを用いることが出来ません.
HH サブバンドにおける ±45 ° のエッジの混在は,量子化後の復元画像において主観品質を劣化させる checkerboard artifact
を生成してしまいます.
このような現在主流の実数型ウェーブレットに対して,複素ウェーブレットは,実数型ウェーブレットを実数部と虚数部に配置した複素数として実現されます.このため,複素数の長所を生かすことができます.その長所とは,シフト不変性の成立と高域サブバンドにおけるエッジの分離です.
複素ウェーブレットでは,シフト不変性を成立させ,かつ,高域サブバンドにおいて,±15°,±45°,±75° の 6 方向のエッジを分離して保持できます.
しかし,このような特性の代償として,複素ウェーブレットは 4:1 の冗長性を持ちます.つまり, NxN の原画像に対し複素ウェーブレット変換を行なうと
2Nx2N ものウェーブレット係数が発生します.元の原画像の 4 倍もの情報量を生み出してしまいます.
動画像圧縮の目的は,冗長性の排除であることより,この冗長性の増加は致命的なように思われます.しかし,有名な Matching pursuit
法のように冗長性を持つウェーブレット係数の中から画像の特性を最も良く表す係数を順に抽出してゆくと,冗長性を持たないウェーブレット係数よりも少ない係数で同程度の画像特性を表現できます.このような手法が存在するため,一概に冗長性ウェーブレットが動画像符号化に向かないとは言えないと思っています.
結局,複素ウェーブレットの動画像圧縮のポイントは,シフト不変性の成立,高域サブバンドにおけるエッジの分離,という特性を上手に活用し,4:1 の冗長性を極限まで削除した場合に,離散ウェーブレットよりも優れた符号化効率が得られていることです.
目指すところ:
今日,MPEG や H.264 などのブロックベースの MC + DCT のハイブリッド符号化により,劣勢に立たされているウェーブレット変換を用いた動画像符号化の勢力を少しでも回復すること.
Key words:
複素ウェーブレット,スケーラビリティ,JPEG2000,SPIHT,動画像圧縮,Noise Shaping,zero-tree coding
技術詳細:
追って更新します...