English Version is Here
富永研究室システム開発プロダクト
2001年8月
早稲田大学 富永英義 研究室
高木真一
takagi@tom.comm.waseda.ac.jp
ISO/IEC MPEG1/2/4やITU-T Hシリーズなどに代表されるディジタル映像圧縮の国際標準化により
DVDやディジタル放送などが普及し、またWindows Media Technologies,Real Producer,Quick Time
などのディジタルエンコーダ・デコーダなどの普及により、ディジタルコンテンツの生成が
容易になるなど、ディジタルコンテンツが我々の周囲にあふれてきています。また、インターネットの急速なブロード
バンド化により、コンテンツが通信ネットワーク上をストレスなく流通する基盤ができつつあります。
そうした状況において、散在する大量の映像や音楽などのディジタルマルチメディアコンテンツ
群の中から、自分の希望とするコンテンツをすばやく探してくる効率的な仕組みが待ち望まれて
います。また、コンテンツがあふれている中で、余計なものを取り除く仕組みも大変重要と
いえます。
これらの課題を解決するために、われわれは映像検索エンジンと映像編集支援システム
に関する2つのシステムを開発いたしました。
※これらのシステムは、日本国内においては2001年9月に早稲田大学で開催されたMPEG-7シンポジウム
におけるデモセッションにおいて出展させて頂きました。2002年4月のNAB(場所:ラスベガス),
2002年5月のMPEG-7 3rd Awareness Event(場所:ワシントンD.C.)でも出展予定です。
このシステムは、大量の映像アーカイブの中から自分の希望する
映像を素早く取得するための映像検索エンジンです。
われわれの開発したデモシステムでは、テレビ放送チャンネルを
映像アーカイブに例え、受信した映像の中に希望の映像(現時点
では、TVコマーシャルを想定)が含まれていれば、それを素早く
キャッチするシステムとして映像検索エンジンを実装しました。
この検索エンジンの特徴は、その検索にかかる処理量が少ない
ことです。映像と映像を照らし合わせる際に、すべての画素に対
して検索をかけると、非常に大掛かりな装置が必要であり、また
処理時間もかかることから、映像中の特徴情報を抜き出し、それ
同士を比較することにより、検索のために必要とする処理量の
少ない検索エンジンとして実現することができました。
補足:この検索で使用する映像中の特徴情報は、我々富永研究室が提案した
ISO/IEC 15938 Mutlimedia Content Description Interface(MPEG-7)
Part3(Visual Part)のColor Layout Descriptor記述子に相当
します。
Scene Judge Man〜Vidoe Editing Support System〜
このシステムは、映像ストリームの中から自分の欲しくない部分を取り除き
本当に必要な部分だけを素早く取り出すための仕組みを提供します。
具体的には映像から、その映像のカメラ操作(Panning ,Zooming )を自動分析し、
各シーンごとのカメラ操作の安定性、手ぶれの度合いなどの情報を
ユーザが簡単に素早く把握することができます。
このシステムを使うことによって、例えば以下のことができるように
なります。
利用シーン1.
小型のディジタルビデオカメラなどを使って撮影した旅行映像
は、大抵の場合専門でない人がいい加減に撮影するため、カメラ操作に
安定性がなく、手ぶれシーンなどをたくさん含んでおります。
しかし、部分的にでもきちんと撮影された部分があるわけですが、
それが映像ストリームのどこにあるかを把握するには、市販の映像
編集ソフトを使えばよいものの、結構な労力を要します。
そこで、このScene Judge Manを使うことで、簡単で素早く
映像中のカメラ操作の状態を把握することができ、手ぶれのない
映像がどこにあるのかを簡単に知ることができます。
もちろん、Scene Judge Manには、それらのカメラ操作情報など
に基づいた簡易な編集機能を装備しており、ダイジェスト版
の生成を簡単に行うことができます。(例えば、「カメラ操作が安定
したシーンを中心につなぎ合わせて、5分程度にまとめて欲しい」
という要求に簡単に応えることができます。)
利用シーン2.
テレビ局の映像編集の方が、その日のスポーツ中継映像から、
ダイジェスト映像を作成する場合などにも応用が可能と
考えられます。とくかく時間が限られている場合において、
カメラワークの安定しているシーンを自動的に把握
することができれば、その作業時間を大幅に削減する
ことができるようになります。
注意点:このシステムは、カメラ操作の安定性などを客観的に判断する
もので、その映像作品の良し悪しを評価しようとするものではありません。
<参考>MaP7
我々は,膨大な文書であるMPEG7の仕様書(特にPart5 : Multimedia
Description Scheme)を読む際の補助システムを開発しました.MPEG7
の仕様書は,ツール間の継承関係を明確にするために,型中心主義
(Type centric approach)で書かれています.そのため,DS(Description
Scheme)やD(Descriptor)間のスキーマの構造を調べる際に,仕様書の
様々な箇所を追っていく必要があり,理解するまでに非常に多くの労力が必要
でした.このシステムでは,そのような労力を軽減するために,
各DSやDのスキーマ間をハイパーリンクで結び,継承先のスキーマを
瞬時に表示するとともに,その日本語解説も閲覧できるようにしました.
また,膨大な数のDSの検索を容易にするため,DSの名前に含まれる
文字列を入力することで,そのスキーマと解説を検索できるよう工夫
しました.2001年6月時点で,MPEG7 FCD(Final Committee Draft)の
Part2(DDL:Description Definition Language),Part3(Visual),
Part5(MDS:Multimedia Description Scheme)の全てのDS,Dに対応して
おります.
※このシステムは,利用者が少しでも役に立てばと思って公開しており
ます.解説内容はあくまで参考として御利用下さい.もし御意見等が
ありましたら,ご指摘下さい.
(c) TOMINAGA Lab., WASEDA Univ.