多言語ビデオトランスクリプタとアノテーションに基づくビデオトランスコーディング
概要
映像や音声を含むマルチメディアコンテンツは、テキストコンテンツに比べて、内容に基づく処理が極めて困難である。そこで我々は、マルチメディアコンテンツの検索・変換を行う上で必要となるインデックス情報を生成・加工するための多言語ビデオトランスクリプタを提案する。本システムは、多言語音声を含むビデオデータからトランスクリプトを自動生成し、シーン情報やオブジェクト情報と関連づけ、それをアノテーションと呼ばれるメタ情報としてビデオに関連付ける処理を半自動的に行うものである。また、アノテーションに基づくマルチメディアコンテンツの高度利用として、ビデオトランスコーディングの例を紹介する。