メタデータマネージメントの最近のブログ記事

 

コンピュータで映像制作するグループが共通して直面する問題の一つに、膨大な動画素材の共有という要求がある。一般的な事務データならファイルサーバの共有ボリュームに保管して、ネットワークを利用するユーザーが自由にアクセスすることで解決する。だが、非圧縮の映像素材は、キャプチャーをおこなったマシンや、CGをレンダリング出力したマシンに直付けされた膨大なディスクスペースと、高速のアクセスを要求され、をおいそれと移動もままならない。他のマシンからプレビューを簡単に行うことは不可能に近い。
大容量すぎるデータゆえ、ファイルサーバでの共有も行うところは少ない。
システムに予算をかけられるところではファイバーチャネルなどのSAN環境を構築して、はじめから共有を実現している。しかし多くのプロダクションではオーバースペック(金額)の設備になりやすい。
重要なところは、どのマシンに、どのような素材が保管されているかを一括して検索、管理できれば、かなりの無駄が省けるわけだ。

☆アセットマネージメントのためのデータベース管理システム「thiiDa」
今回紹介するのは「株式会社ビジュアル・プロセッシング・ジャパン」(http://www.vpj.co.jp)の提唱する、「thiiDa」(ティーダ)というネットワークにある素材を一括管理するデータベースシステムだ。

動作環境として、サーバ自体はWindows2000/XPでのSQLサーバで作動するが、素材を管理する対象はWindowsのみならず、Apple Macintosh、SGI、Linuxと、CGや映像、画像制作に必要な環境を網羅している。
検索可能な対応フォーマットは以下のとおりだ。

・ iff
・ avi
・ cin
・ pic
・ rgb,sgi
・ rpf
・ tiff,tif
・ als,alias,pix,alsz
・ ct,ct16
・ jpeg,jpg
・ mov
・ rla
・ tga,targa
・ yuv,qtl
・ etc…

ごらんのように、業務利用のCG、画像、動画フォーマットの多くをサポート済みだ。

ティーダの特徴はデータベースへの登録をローカルマシン上で動作する「thiiDaデーモン」と呼ばれる常駐型のソフトが自動的に行ってくれる点だ。Windows、Mac、SGI、Linuxに準備されている。
専用クライアントからはデーモンの作動している各クライアントが保有する最新データを、転送量の軽いプレビュー用プロキシ-画像で確認することができる。
しかも素材の管理状態が把握しやすい階層構造を保持したまま検索が可能だ。

インストールは管理が必要なマシンすべてに「thiiDaデーモン」を導入することから始まる。
監視するディレクトリを指定したら、あとは操作を気にする必要はない。新規にデータが作成されると、デーモンはプロジェクト名、ファイル名、ファイル保存先、ファイルフォーマット、ファイルサイズ、画像の縦横サイズ、色深度、ファイル所有者、ファイル作成日、最終更新日など、検索に必要な情報をデータベースへ自動的に書き込んでくれる。さらに、データ検索用の低解像度データ(プロキシー)も自動的に作成してくれる。これは便利だ。
もちろんレンダリングイメージなどは、画像を修正、保存するたびに最新のものへ更新される。

プロジェクト管理から見てみよう。
ティーダではファイルサーバやクリエータのローカルマシンなど、ネットワーク上のさまざまな場所にあるデータを、そのまま移動せずに場所情報をデータベースで一元管理できる。
ティーダのインターフェースは、わかりやすい画像のサムネールと、ファイル操作のためのエキスプローラでシンプルに構成されている。
プロジェクト名を定義すると仮想的に、さまざまな場所にある素材を一元管理が可能だ。
作業に必要な素材を確認したら、エキスプローラの任意のディレクトリへドラック&ドロップするだけでオリジナルデータの転送を行うことができる。
動画の閲覧、確認もプロキシで低解像度のプレビュー再生が可能だ。

「画像サンプル(C)ARTBEATS」

データ検索、プレビュー
自動的に記録されるファイル作成日や更新の情報や、さまざまなメタデータをキーに高速な検索が行える。一度検索した状態から、さらに絞込検索も可能だ。
重要なポイントは、ティーダは実際のメディアファイルを検索するわけではないので、高速で、ネットワークトラフィックも最小に押さえることが可能だ。

アーカイブ、バックアップ
ティーダはアーカイブに対しても有効だ。通常ではデータをストレージテープなどにアーカイブすると、データはHDDから削除されるため、データのトラッキングは困難を極めるが、ティーダでは、データをアーカイブしてもデータベースに記録や、プロキシー映像は残るので、通常のファイルと同様に検索が可能だ。プロキシーにはオフライン表示がされ、アーカイブテープを特定できるため、そのテープから簡単にレストアさせることができる。戻す先も記録があるため正確に復活させることができるのだ。


さて、さまざまに便利なティーダだが、取って置きのオプションを紹介しよう。
それは「Discreetインターフェース」だ。
映像制作のハイエンドシステムとして重宝されるDiscreet社のInferno/Flame/Smokeなどで採用されているStoneディスクアレイシステムは、従来では一度InfernoのHDDを経由しないと外部から映像データをやりとりできなかった。
これは素材の移動ですら高価なInfernoルームの貴重な時間を無駄にする原因となっている。
しかもHDDからStoneにコピーするのも結構な時間がかかっていた。
そこでティーダのオプションを使うとStoneのディスクへネットワークから直接アクセスすることが可能になる。つまり、映像を直接書き込むことや、連番画像として取り出すことが容易にできるようになるのだ。
目からうろこが落ちるように感じられるかたもいるだろう。

現在は単純なメタデータの検索に限られるが、動画像の中で特徴を検索できるようなインデックス機能を充実していったら、さらに使いやすくなるだろう。今後に期待したい。

 


デジタル映像コンテンツの活用にインデックスが有用なことは何度も紹介してきたが、今回登場するのは音声情報からのインデックスを目指すフォトロン社のナレッジ・マネージメント・システム(Power Index)だ。
棚に埋もれている映像情報の活用に、内容の検索を行う機能が求められること自体は必然的なものだ。
「たしか、こんなことを言っていたビデオがあったはずだ。」「あんな表現をしていたケースの詳細を見直したい。」など、探したいときにはビデオタイトルから思い出すわけではないのが人間の記憶というものだ。

問題は、時間軸を有する映像情報のどこに、何が含まれるかを指し示す手がかりをつける作業が、膨大なコストとなって実現を阻んできていることだ。
後処理で人手をかけることは現実的でないのだ。
そこにシステムの自動化が望まれている。

Power Indexは、ビデオコンテンツに含まれる音声情報をデジタイズして解析し、文字情報として内容を検索する機能を提供してくれる。
ナレーターの音声などが文字情報として記録されているので、キーワードなどで検索することや、原稿として閲覧することも可能だ。
しかも、その作業を自動化して簡単な操作で実現するところが特徴となっている。

さっそく製品を見てみよう。
「コンテンツが作りやすい」「コンテンツが見やすい」「システムの拡張性がある」、をコンセプトに開発されたPower Indexは、映像の取込から登録、データベース管理までを自動化し、そのデータをWebビューワから検索/表示することができる。

コンテンツ作成部分を最大限自動化し、コンテンツ作成時の負担を軽減すると共に、映像に対して音声認識/サムネイル/メタ情報等の付加価値情報を与えることにより、単なる映像ではなく「意味のある映像」資産として管理を行うことが可能な映像ナレッジマネジメントシステムになっている。
NGシーンの排除など簡単なビデオ編集や、データベースへ登録するキーワードの列挙など手作業で行う場合も、作業者の大幅な助けになることは間違いない。

システムはエンコーダクライアント/サービスサーバ/ビューワクライアントの3つから構成されている。システム導入後の拡張性及び他システムとの連動を実現すべく、システム全体がMicrosoft社の「.NETテクノロジー」上に開発されており、システム全体としてXML Webサービスになっている事も大きな特徴の一つだ。

<コンテンツ作成支援機能:Power Indexエンコーダクライアント>
動画コンテンツ作成において面倒と思われる、キャプチャ/エンコード作業及びデータベースへの登録作業の支援を行うのがPower Indexエンコーダクライアントだ。最大の特徴はほぼ全ての作業が自動化されることにより大幅な省力化を実現した。

A:自動データ作成機能
ワークフロー機能を使用し、データの取込みからサーバへの登録までを、ほぼ人手を介すこと無く自動で作業を行うことが可能だ。もちろん全ての操作をマニュアルで行うことも出来、さらに操作ナビゲーションにより操作が分からなくなった場合はシステム側で自動支援を行うことができる。

B:画像インデックスの自動生成
インデックス情報として、サムネイルとメタ情報を持てる。サムネイルは、インデックスデータ作成時に自動的に生成される他、任意の場所を指定・登録することも可能だ。メタ情報は、ユーザー情報やDVカメラなどから基本情報を自動的に収集する他、任意事項の入力も可能だ。

C:音声認識
音声認識エンジンとしては、日本語ディクテーションエンジンとして定評のあるアドバンスト・メディア社のAmi Voiceを採用。面倒なエンロール作業を必要とせず、不特定話者に対する音声認識を行うことが可能だ。この音声認識後のテキストをキーとして、任意動画へのランダムアクセスも可能だ。

<サービス配信:Power Indexサービスサーバ>
データの保存及びビューワクライアントへの配信を行う。
拡張性にすぐれたXML Webサービスになっている。


<検索・表示機能:Power Indexビューワクライアント>
データベースに登録された膨大な動画データを検索・表示することは容易ではない。この作業を簡易化するために、ビューワ機能として強力な検索と階層表示機能を実装した。また、サムネイルもしくは再生中の画像と一緒に表示されるテキストデータから任意の再生部分へのジャンプも可能としている。

A:多彩な検索機能
検索機能として音声認識したテキストに対する全文検索のほか、メタ情報検索・日付時刻検索を実装。また、これらの検索機能を組合せて使用することも可能だ。

B:登録データの階層表示
現在登録されているメタデータを階層的に表示する機能により、サーバに蓄積されている情報が階層構造的に見ることが出来る。分類作業をシステム側で支援するという機能だ。

<拡張性:Power Indexアーキテクチャ>
システムの導入にあたって、拡張性は常に求められる要因となる。また、今後のシステム構築においてはXML Webサービス技術を用いた、「繋がるシステム」間の接続を前提としたシステム設計が標準となろう。この様なニーズにお応えするために、Power Indexは、Microsoft.NETテクノロジーを全面採用することにより、システム全体としてXML Webサービスに対応する事を可能にした。このことにより、既存のシステムとの連携を実現するなど柔軟な拡張性をもつことが可能になっている。

<システム標準構成>
エンコーダクライアント:
映像のキャプチャ/編集/インデキシング及びサーバ転送を行う。

サービスサーバ:
Power Indexデータの保存及びビューワクライアントへの配信を行う。

ビューワクライアント:
ASP.NETにて生成されたデータをInternet Explorer上で表示する。

DVコンバータ:
ビデオ信号をDVデータに変換する

※ 上記ソフトウェア/ハードウェアが標準構成(5,000,000円)に含まれる。ビューワクライアントは5クライアントライセンスが付属となる。

開発の進むフォトロン社のPower Indexは、時代の要望するデジタルアーカイブとデータ検索への有効な道筋を示している。音声情報の意味性を考えたとき、映像の内容を指し示す有効なインデックスのひとつとして、これからも高精度化と簡易な操作性を推し進めていってもらいたい。

デジタル・コンテンツの有り様を考えると、後処理で苦労して取り出しているメタデータそのものは、制作段階では存在し、捨てられている情報がほとんどだ。
今後の制作システムには、メタデータの自動リンク機能などの拡張を意識して支援ソフトのデザインをしていただけるよう、メーカーに期待したい。

 

 

ブロードバンドネットワークのキラーコンテンツと呼ばれる映像プログラムだが、果たしてライブ放送を前提としてきたテレビ(ビデオ)素材を転用するだけですむのだろうか。
インターネットの存在は、地球規模の映像ネットワークを可能にしてしまった。
各国地域の時差だけでなく、さまざまな価値観を持ち、生活時間帯の異なる人たちの共有できるコンテンツサービスは、放送時間をプログラムした在来型の既存の放送でのライブサービスでは不向きだった新しい領域を開拓してくれる。
時間軸(リニア)で構成される映像のインデックスとしてビデオテープの背ラベルに記述してあるだけの情報では不足なのは言うまでもない。
ビデオオンデマンドと呼ばれるサービスは、文字通りほしいときに、ほしい映像をいつでも見ることができるサービスだ。

さて、そこで、私たちはどのように「ほしい」映像を探したらよいのだろう。
主演の俳優?監督の名前?それとも内容の一部だろうか?何かのシーンで意味を探すのだろうか?
この疑問はそのまま逆に検索するという行為に必要な情報を意味している。
データベースに映像の情報を記録する場合、何を登録したらよいのだろう。
そこで、「何かの情報」と言う部分を映像に付随するメタデータと言い換えることが重要になる。
メタデータとは、コンピュータ用語としてはポピュラーだが、映像の情報に関連が濃厚になったのは、デジタルアーカイブの必要に迫られたからに他ならない。
デジタルアーカイブには検索性能の向上が求められているのだ。
検索にはさまざまな手段が用いられるが、その対象になるデータがなければ検索不可能だ。実際の映像はあっても探し出すことができないのだ。

これからの放送局は1日24時間の放送だけではなく多チャンネルの放送コンテンツを意識する必要がある。コンテンツの創出には多くの情報が必要なことは言うまでもない。
さらに自社送出素材だけでなく、競争社会である以上、当然ライバルの動向も記録しておく必要がある。取り上げようとするテーマの扱い方などは、差別化を考慮する重要なポイントとも言える。同様にスポンサーに対する企画持込の資料にもなる。

制作会社ではメタデータを新しい商品として位置付けることもできるはずだ。

 

しかし、情報処理には思わぬ価値を生む代わりに、地道な作業もついて回るものだ。制作で収集し、使用してきた資料をデジタルデータとして検索可能な情報に加工できれば、これはかけがえのない貴重なメタデータそのものになるのだ。
番組企画当初の企画書は、そのままプロフィールシートの変わりになる。
取材ノートはかけがえのない情報の宝であるし、接触担当者のデータベースは、プロデューサーやディレクターの命綱でもある。
ビデオ編集により生み出されるEDL(エディットデシジョンリスト)は克明なカットアドレスそのものである。
制作作業と同時進行で自動的にたまっていくデータならいざ知らず、作業終了語に、これらのデータを整理して一からの入力していく作業には、多大な手間がかかる。

膨大な時間作業を多人数でカバーするには、送出を続けるコンテンツが多すぎるのだ。
そこで、メタデータを自動抽出する方法が求められる。

さまざまなシステムが提案されているが、そのベースになる技術を見てみよう。
映像の管理業務に必要な機能とは、人手に頼らず自動的に映像の中からある特徴を探し出してくれることだ。
映像の中の特徴を調べるポイントは、シーンの切り替わりや、字幕の表示、色情報をもった物体の検出、物体進入の認識など、さまざまだ。人の目であれば映像の意味や解釈などの意味情報が理解できるが、記録するポイントには具体的なアドレス検出(タイムコード)を併用する必要がある。

それでは基礎技術を紹介しよう。

■カット点検出
カット点検出では映像シーンの変わり目を画像変化(色の変化)が多い個所を認識してカット点を検出する。
このソフトはノンリニア編集環境でBIN表示される映像の整理などに利用されている。
■ディゾルブ検出
映像の連続するフレームの明るさ(輝度)が徐々に一定の割合で変化する単調変化性を認識してディゾルブを検出する。
■ワイプ検出
ワイプを使用した映像が、元のシーンと後から表示されるシーンとの境目で明るさの差(輝度差)が大きいことを認識してワイプを検出する。
■スチル検出
映像中の静止状態になっている区間はフレームの明るさ(輝度)の変化が少ないことを認識してスチルを検出する。

■テロップ検出
映像中のテロップが表示されている領域では、高輝度でフレーム間の明るさ(輝度)の変化が少ないことを認識してテロップの開始点、終了点を検出する。
演出的にテロップを挿入する画面は決めの映像が多いので、インデックス表示すると時間をかけずに全体の流れを把握することに有効だ。
■パンズーム認識
映像が上下左右に移動した場合模様情報の移動量を求めることでパンの有無を認識する。また、拡大、縮小率を求めることでズーム率を検出する。
この機能を利用してビデオ映像からパノラマ写真の制作や、ズームを利用した高解像度の高解像度写真の合成などに利用できる。

■侵入監視(動き)検出
画像上に設定したスリットに対して人物や物体が通過する事象を検出する。
連続撮影している中から動きのある部分をリストアップすることが実現できる。

■色物体認識
色の情報を元に映像中の色を1フレームずつチェックし対象物に関する情報として、対象物がフレームに表示されていいるかどうかの判定結果、開始点、終了点、位置情報などを出力する。

このような認識を自動的に行い記録をさせることで、より正確に必要な映像へすばやくたどり着くことが可能なる。

VODのアセットマネージメント
データベースに記録できるメタ情報と、映像の時間位置情報をリンクすることでオンデマンドのビデオ検索に利用できるシステムとしてストリームビデオ配信ネットワークへ登場したシステムがある。
Virage」はストリーミングビデオとデータベースによる管理を商用利用することを提案している。
アセットマネージメント機能を強化して映像の中にあるさまざまな情報を検索対象にしているのだ。従来のパソコンでの画像解析技術をプラグインの形で取り込めるようにデザインしてあるのが特徴だ。記録できる情報に「クローズドキャプション」などの文字放送データや、IBMの音声認識を取り込むなど多彩な情報が収集できる。
面白いところでは顔の検出を行うプラグインが紹介されていた。これは「フェイスイット」というコンシューマー向けソフトの機能を利用したもので、事前に記録してある人物の顔を画面の中から探してくれるものだ。
Virageはアメリカで多くの放送局で採用され、放送素材のWeb展開へ拍車をかけている。日本でも進出が予想されるシステムだ。

さて、最後に日本語のビデオOCRについてご紹介しよう。
テロップ検出を行うシステムが実際のビデオ画面を捉えても、読み出しができないと検索には不便だ。先のVirageも、現時点では日本語の文字を読み込むことができない。
そこで紹介するのが「ビデオタイムマシン i-Telop」だ。

テロップの表示された画面は意味的に説明を付加したい意図のある重要なシーンである場合が多いので、テロップ検出はインデックスとして大変有効だ。
しかも、その文字を読み込み、テキスト情報として認識してデータベースへ自動的に登録してくれる。
利用法は簡単だ。キーワードで検索したり、探したい日付の時間帯でテロップの表示された画面だけを一覧表示することができる。その画面をクリックするとMPEG-4(WindowsMedia8)の動画がストリームで再生される。
ネットワークで利用できるので、テープ管理の手間がいらない。
24時間稼動して映像を記録しつづける。同時に無人でテロップ文字の取り込みを行ってくれる。
放送記録を義務つけられている放送局のライブラリーには重宝な検索システムといえるだろう。 

このアーカイブについて

このページには、過去に書かれたブログ記事のうちメタデータマネージメントカテゴリに属しているものが含まれています。

前のカテゴリはマルチライブです。

次のカテゴリはモバイルです。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

メタデータマネージメント: 月別アーカイブ

Copyright 1996-2007 & copy; DreamCraft