動画圧縮コーデックの最近のブログ記事

 

DVDを創ろうと考える諸兄へ

これからはHDTVよりネットワーク配信のビデオが重用になる。

そう独断で前置きをしながら話をしたいと思う。

なぜなら、今の日本でコストが増えるHDTVがもたらすビジネスメリットを制作の立場で見つけ難いと思っているからだ。映像屋の商品はコンテンツと、制作技術である。ご賛同頂けると思うが、現実の制作見積りに並ぶのは機材のレンタルや、頭数の拘束時間を日当で計算する人材派遣に似た項目である。違った商品形態を考えなくてはならない。

権利問題を考えていく中で、まずは映像を商品としたときの納品形態の変化に注目していただきたいのである。そして、その制作課程で権利の所在を模索する試みも行なっていただきたいのである。

従来の完パケ納品のVTR原版を野菜に例えるなら、農家が出荷する野菜そのものであろう。

食品は加工することで納品形態を変えて、新しい商品へと変貌して行く。

野菜炒めになった時に、利益率も素材とは違う次元へ変化していく。

映像も期待される利用シーンの変化に先んじて、加工技術を取り入れ、新しい納品形態に映像ビジネスを成り立たせていきたいものだ。

そのきっかけとなりそうなのがDVDであり、ネットワーク配信のストリームビデオなのだ。

 

今月はDVD制作を考える上で避けて通れない、ビデオをMPEG2へエンコードする作業を考えて見たい。

ビデオ制作の現場から考えるとVTRという機械は、ブラックボックスとして程よい映像の入れ物だったと言えよう。従来、記録方式を変えることは、すなわちデッキを交換することだった。実際の記録方式がベータカムであろうとDVCAMであろうと、出力コネクターから出てくるビデオ信号だけ意識していれば編集は良かったものだ。しかし、DVDの場合は記録方式に目を向けないと、品質をコントロールすることができない。

 

瑞々しいビデオ品質を守る圧縮の「いろは」

ビデオの編集室で見るマスターテープは美しい物だ。それが配布用のVHSなどにダビングされてくると、がっかりするほど品質が落ちてしまう。そんな経験をお持ちの方が多いだろう。この品質を上げることはアナログコピーであるかぎり至難の業だ。

ところが、デジタルメディアであるDVDは、極端な話、マスターそのままのデーターを入れる事も出来るのである。

注意していただきたいのは、現時点では入れる事は出来ても再生不可能なシロモノに成ってしまう。だが、再生能力さえ追いついてくれば原版データと寸部違わぬ 物が作ることが可能になっているということだ。

ここで、DVDというディスクメディアの機械的な再生能力という制約を知っておく必要が出てくる。現在のDVD規約では映像のビットレートの最大は9.8Mbpsに制限されているのだ。1秒間に9.8Mビットの転送に映像を押さえ込むには高度な圧縮技術が必用になる。

この工程をエンコードと呼び、実行する物をエンコーダと言っている。

ビットレートを限界まで高くすれば品質は向上するが、当然、収録できる時間は減ってしまう。必用な時間を収録しつつ、最良の品質のパラメータやビットレートを探ることがノウハウになってきているのだ。

エンコーダいろいろ

一口でエンコーダと言っても、昨今売り出されている数10万円のそれから、メーカーの威信をかけた数億円のシステムまでピンキリの激しい世界で、「いったい何が違うんだ!」と迷われている諸兄も多いことだろう。実は、そのピンで作られたデータも、キリで作られたデータも同じ環境で再生できるのだ。それは、MPEG2が再生のみを保証する規格だからだ。MPEG2のファイルを作るだけなら安価に出来る。

再生こそ同一に出来るファイル構造になっているが、そのファイルの作り方のプロセスにルールはない。安価なエンコーダと高価なエンコーダの違いは、プロセスのアルゴリズムの違いなのだ。

さて、いったいプロセス処理が違うと、どのような差になってくるのだろう。高性能エンコーダとは、なにをしてくれるのだろう。

今回試用させていただいたのは三菱電機のEN-250と、カスタムテクノロジー社のシネマクラフトシリーズだ。

EN-250はDVD制作に「シナリスト」と併用で多く用いられるエンコーダボードであるが、ビデオサーバー用などの汎用エンコーダとしても定評がある。

シネマクラフトシリーズは最高機種のハードエンコーダの他に、高性能のリアルタイム・ソフトエンコーダをラインアップしている。

耐える圧縮と破綻する処理の違い

ビデオ素材の中で、エンコードしやすい素材と、しにくい素材があることを確認しておこう。特に弱い素材をあげてみよう。

 

  • 1:画面が微妙に変化し続ける映像(水面や手持ちカメラの素材など)
  • 2:輝度差のある映像(テロップやハイライトのエッジや炎など)
  • 3:赤の再現性(人の肌色、原色の水着など)
  • 4:直線の処理(建築物などの人工的な輪郭やテロップ文字、ワイプなど)
  • 5:白の階調と、黒の階調処理(フェードインなどや、空の抜けと影の陰影など)

これらの素材は注意して確認しないとノイズ発生がしやすいものだ。

そこで、わざと高圧縮(2Mbps)にして強引にノイズを発生させてみた。

A:スモーキーノイズ

これは移動していく女性の髪の毛を取り込んで拡大した物だ。

煙がかかったように質感が失われている。動きの激しいシーンには顕著に表れる。

B:ブロックノイズ

輝度差の激しい場所付近にモザイク状の四角いブロックが並んで、質感が失われている。

合わせて色ムラやノイズの発生も見られる。水着の女性などは、特に多くの情報量 を必要とするようだ。

他の部分はきれいに再生しているのに、画面の中の部分的にノイズが発生するのはどうしてだろう。

それはMPEG2の圧縮原理に関係がある。

 

簡単にMPEG2の圧縮をおさらいしてみよう。

MPEG2の始めのカットは必ず「Iフレーム」(画面全部の情報を持ったインデックス・フレーム)から始まる。次のフレームになったら前のIフレームに対して変化した部分の情報だけを記録するのだ。

計算の単位は画面を4×4の16分割したブロックから始まる。

そのブロック単位で前のビデオフレームといっしょの映像が映るようなら情報は記録せずに同じである旨記録される。絵に変化があった場合、さらに細かくそのブロックの中を4×4の16分割して変化を探る。そこで変化のあったブロックはさらに分割して検証を繰り返して行く。情報量 (ビットレート)の上限を決めなければ、情報分配は、破たんをすることなく、美しい画面 情報を毎秒30フレームのビデオ画像すべてに割り当ててしまうが、膨大な情報量 を時間単位で規制することで、どこの情報を間引いていくかの判断が必要になってくるのだ。

言い変えると、次の時間までにどのような動きがあり、どの程度、情報量を消費するかの推測による判断処理が失敗したところから破たんをしていくわけだ。

この場合、破たんした小さなブロックセルから順次大きなセルまで同じような描画情報が与えられてしまうので、質感の無い平坦なブロックが出現することになる。

この予測処理をする仕組みをMPEG2圧縮アルゴリズムと呼び、各メーカーの特徴となってくるのだ。

技術的な難しさは予測する条件が多くなるほど激増する。

時間単位で均一な情報を分配するCBR(コンスタントビットレート)では、画面 の中で決まった情報量を割り当てれば良いから処理は簡単になる。しかし、静止画に近い画像にはもったいないほどの情報量 を与えることになり、逆に動きの激しいシーンには割り当てる情報量が足りずに無残な圧縮破たんを招く事になる。

そこで流動的にビットレートを配分し、動きの激しいシーンに多くの情報を与えて、静止画のようなシーンには節約した情報量 を与えることで、結果的に平均値が予定した情報量になるように加減するのがVBR(バリアブルビットレート)だ。この能力にエンコーダの価格差が象徴される。

予測計算が出来なかったブロックの記録は、いい加減な近似値に塗られる事になる。

さらにその周辺ブロックも同様の結果になることで、大きな面積のノイズ発生と認識されてしまう。

そうは言っても先読みすることは難しいので、あらかじめ何度もビデオを再生して各フレームに必要な情報量 の分配を記録して計算するのがマルチパスVBRだ。高価なエンコーダにはもれなくこの機能がある。VBRは、最小、最大、平均のビットレートを指定し、最低2パスの作業が必要だ。1パス目は映像の複雑さを調べるためにCBRまたは1パスVBRを実行し、この作業で得られた複雑さをフレーム毎に記述したファイルを作成する。2パス目以降は、その情報を元にして個々のフレームに配分するビット量 を計画し、それに従って実際のエンコードを行なうのだ。パスを重ねる毎に画質を改善できるため、ハリウッドの映画では平均的に20回から60回のパスをエンコードで行なうとの話もある。高圧縮と高画質を両立させるため、エンコードは膨大な時間を費やす作業なのだ。

最近の技術は、できるだけ1パスでベストな数値を予測することに向いている。わずかなバッファーに貯めた時間の中で将来を予測する技術がエンコーダの性能といっても過言ではない。

作業時間が数倍も違うと時間単価が気になる業界だけに、今後は1パスVBRを目指していくに違いない。(しかし安価な製品の予測のへたな1パスVBRなどはCBRと同じだ)

それにしても今回お借りした300~600万円クラスのエンコーダは安心して高品質の映像を作りだしてくれた。

ここでカスタムテクノロジー社シネマクラフトエンコーダの作業画面を見ながら、エンコード作業を紹介しよう。

同社のエンコーダはIntel PentiumIIIプロセッサで導入されたStreaming SIMD Extensions命令に最適化した処理を行い、高画質で驚異的な圧縮スピードを実現している。

最上位機種は専用筐体にフレームキャプチャーカードと、デコーダカードを組み合わせて提供される「Pro」¥4,200,000である。

EN-250同様にVTRからSDI入力を得てリアルタイムに処理を行うオンラインエンコーダだ。エンコード作業の状態がリアルタイムにプレビューできる高級機で、圧縮の画面 を見ながら作業を進められることは、高品質な映像を目指す場合に心強い。

特徴は独自のアルゴリズムによる「動き検出」で、動画を複数枚同時に何回もスキャンして「誤り動きベクトル」を訂正しながら動作する。

一般的なエンコーダの実装においては2フレーム以上離れているフレームの動き検出で、テレスコピックサーチ(過去の動きから未来の動きを予測し、その部分の周辺だけを動き検索する手法)が用いられるが、急激な輝度変化や、複雑な動きをする映像では予測が外れることが多い。これに対して「動き検出アルゴリズム」では、全ての隣り合うフレームの動きを調べてから、追いかけるように2フレーム以上の動き検出を行うので良好な結果 が得られる。

また、シーンチェンジにおいては、自動的にIフレームが設定され、このフレームから始まるGOPは自動的にClosed GOP(GOP内のフレームが他のGOPに属するフレームを参照しない構成)に設定される。ランダムアクセスを求めるオーサリングを予定している場合は、全てのGOPをクローズドにするオプションも用意されている。

設定できるパラメータも、およそMPEG2の圧縮において出来ないことの無いほどの徹底した職人向けのデスクトップが用意されている。

画面の中のセル単位で圧縮具合を制御できる機能は、高度な圧縮にもかかわらず高画質を要求する作業で必要になるだろう。また、任意にIフレームを挿入できる機能はDVDのチャプターを意識して決めたい場合に大変有効な機能だ。

デフォルトの状態でも効果的な圧縮を行ないながら、高品質な映像を維持できるのがこのクラスの強みでもある。さらに、映像によった設定を吟味できるところが大きな違いだ。安価なシステムは、ノイズが発生した場合にビットレイトを上げる以外に成す術が無い。

ソフトエンコーダの実力

次に紹介するのはソフトウェアエンコーダでありながら高機能なリアルタイム処理を可能にしたカスタムテクノロジー社シネマクラフトエンコーダ「SP」•398,000と、簡易なエンコードを目的とした「Lite」•24,800がある。AVIファイルやQuickTimeなどの動画ファイルをMPEG2ストリームへ変換してくれる。ノンリニアビデオ編集システムにインストールすることで、すぐにエンコードを行なうことが出来、DVDへの最短距離をとれるのだ。

変換スピードはCPUの能力に比例するが、PentiumIII 500 Dual以上で、ほぼリアルタイムのエンコードスピードを実現している。アルゴリズムは上位 機種と同じなので、設定個所が少なくなった分、かえって簡単に扱うことが出来るので、むしろ実用的ですらある。

簡単なオーサリングキット

MPEG2を制作する方法を体験する手っ取り早い方法は、ノンリニア編集システムとセットになったDVDオーサリングソフトのキットを利用してみる事だろう。

Canopus DVRex+MVR2000+ReelDVD

純国産の組み合わせの強みは安心感として表現される。DVDオーサリングソフトはダイキン社の「シナリスト」の廉価版だ。

Matrox RT2000+DVDit

DVおよびMPEG2での編集作業を可能にしたパッケージ。DVDオーサリングソフトはソニックソリューションズ社のDVDitで、複雑に考えがちなオーサリングを簡単な操作性で解決している。

PINNACLE DV500+Impression

ネイティブDVの編集と、タイムラインベースでオーサリングできるミネルバ社のソフトがシームレスにつながる絶妙の組み合わせだ。

このクラスのオーサリングソフトで、凝った作業はできないが、映像のメニュー分岐程度の構成は簡単に行なうことが出来る。オーサリングソフトのメーカである3社は、それぞれに上位 の高級機種を備えているので、将来を考えて研究費として複数機種を同時に使い比べてみることをお勧めする。

こんな使い方も!

MPEG2を再生し視聴するための準備は、意外と簡単だ。

オーソドックスなデコーダカードを利用し、外部のテレビへビデオ出力するタイプと、ソフトだけでエンコードを行い、パソコン画面 へ表示してくれるものまで様々ある。

ソフトデコーダは7800円台に価格もそろってきている。

また、商品を買わなくてもパソコンに詳しい方ならレジストリを細工するだけで標準のWindows Media PlayerにMPEG2を、だまして再生させることすら可能なのだ。

ファイルサーバーに置いたMPEG2ファイル

エンコードされたMPEG2はコンピュータで視聴するのに向いている。

オフィスで必要な社員教育教材や、ノートパソコンで画面いっぱいの迫力ある動画はビジネスプレゼンテーションの大きなパワーになるだろう。

このためのMPEG2データーを保管するのに最適な場所はファイルサーバーだ。

専用のビデオサーバーでなくてもファイル共有されたMPEG2は面白いようにネットワークを超え、大画面 で再生してくれる。

多人数での同時アクセスには向かないが、通常の社内教育の教材を考えた場合などは、特にビデオサーバーまでの設備は必要無いことが多い。

お試しあれ。

CD-ROMに入れたDVDイメージ

サーバーに置くことが出来るMPEG2のファイルや、DVDのディスクイメージは、当然コンピュータで扱えるメディアなら何でも(転送スピードさえ満たせば)利用可能だ。

高価なDVD-Rを導入できない時点では、手軽なCD-RにDVDのディスクイメージを保存することで、コンピュータなら映像を再生することができる。

容量はかなり小さく(650MB)なるが、短時間の映像なら十分に利用可能だ。

この場合、通常のDVDプレーヤーでは作動しない。

便利なソフトデコーダ

既存のコンピュータ環境だけでは改造無しにMPEG2を再生する事は出来ない。

そこで登場するのがソフトデコーダーと呼ばれるDVDプレーヤーソフトである。

サイバーリンク社 PowerDVD

ラビセントテック社 Cinemaster

バロビジョン社 VaroDVD

MGI社 SoftDVD

他多数

多くのパッケージが市販されているが、NT上で作動する製品は少ないので吟味が必要だ。

価格はほとんどの製品が¥7800と安価で市販されている。

また、プレゼンテーションやCD-ROMなどの制作で活躍しているMM・DirectorでMPEG2をキックし、オーバーレイ表示や、外部出力するためのエクストラや、ソフト開発用キットも登場しているので、CD-ROM制作のノウハウも活かした活用方法も大きく広がっている。この場合はクライアント側にとくべつな準備は要らない。

映像は加工料理の時代へ

MPEG2を納品する形態は、ファイルサーバーや、ビデオサーバーなどのネットワーク送出の設備であったり、パッケージ形のCD-ROMやDVDなどのディスクであったりするが、

多くの場合は複数メディアにまたがって同一コンテンツを利用することが多くなるに違いない。

インターネットのWeb上からRealVideoやQuickTimeなどのストリームビデオをインデックス変わりに映像の分岐システムを利用する手法なども、同一コンテンツのバリエーションとして加工できるものだ。

品質が悪いと馬鹿にしている間に、既存の放送レベルは追い抜かれてしまう時代に入ったのだ。

なにせ、15Hz程度のインターレスNTSC映像に比べ、60~75Hzプログレッシブは当たり前のパソコンモニターを利用するのだから、圧縮、データ転送技術の進歩次第で逆転しないとは誰も言えないだろう。

そう言えばデジタルHDの最も安価なディスプレーは、NAB2000で発表される予定のデジタルHDチューナーボードを利用した、パソコンモニターになるそうだ。

納品形態の変化で飛躍する映像制作会社

従来の映像制作は番組納品のように、一度放送したら終わりの仕事といえよう。

作品のバージョンアップの概念は無い。

だが、時代は確実に映像の多用な利用方法を模索している。

プロモーション映像なら視聴者の反応をフィードバックできる仕組みが望まれている。

教材映像なら生徒の習得度や効果測定をフィードバックできる仕組みが望まれている。

販売促進映像なら直接購買に結びつく仕組みが望まれている。

映像の必要な部分だけのバージョンアップをすばやく行なえることも望まれている。

撮影技術では、複数のメディアに適した収録方法と、圧縮に対抗するカメラワークを研究する必要がある。

映像の演出にも双方向システム全体のデザインにかかわる覚悟が必要になってきている。

編集技術はデジタルデータのフォーマット変換の精通していくことが必要になってきている。

制作進行には、各種の業界を横断的に交流できるパフォーマンスが必要になっている。

さらに、プロデューサーにはネットワークでの映像利用をイメージでき、双方向メディアの世界観を語れるスケールが求められている。

飛び出してくる才能を既成概念で潰さないでほしい。必ずや登場するであろう映像の魔術師の活躍を期待してやまない。


取材協力:

カスタム・テクノロジー株式会社

ソニックソリューションズ株式会社

ダイキン工業株式会社

ピナクルシステムズ株式会社

日立計測器サービス株式会社

三菱電機株式会社

 ネットワークでHD映像、5.1サラウンド音響を利用する
近づいてきたホームシアターでのハイビジョン時代?
高画質のHD映像と、包み込むようなサラウンドオーディオを配信するのは放送だけだろうか?
免許事業として新規参入が困難な放送事業、そして、比較的安価なCSなどの通信衛星を利用する委託放送事業などでも、採算を合わせることは大変なことだ。
多くの機材変更を必要とする地上波デジタル放送への移行を目の前にして、コンテンツビジネスのあり方が問われている。
高画質、高品質音響の伝達手段として、侮れなくなってきたのがネットワークを利用した配信だろう。もともとデジタルデータを扱うことは、コンピュータの守備範囲だ。
インターネットを見ても、情報の発信が距離を意識しなくなり、規模よりも内容と、サービスが重要なことは明白だ。
2003年1月29日、コンピュータ業界の巨人、マイクロソフトが「WindosMedia9日本語版」を発表した。
映像のプロに向け、コンテンツビジネスのあり方を示唆したマイルストーンとして、記念すべき日になるだろう。
いったい、この「WindosMedia9」とは、何なのだろう。
「WindosMedia9シリーズ」と言われる内容は、大きく分けて3つの基本構成で提供される。
それは、エンコーダー、サーバー、プレーヤーである。そして、それぞれの開発キットと、著作権管理機能(DRM)を加えて、デジタルメディアの世界でブレイクスルーを迎えようとしている。
それらが、いかに機能しているのかを紹介しよう。


● WindowsMedia9が可能にする世界
家庭で高品質なHDやサラウンドオーディオなどを楽しめるホームシアター。
生活に必要な購買、支払いなどの情報を管理するネットワーク。
距離を越えたクリエーターのデジタルコラボレーション。
移動中で、どこにいても情報をやり取りできるユビキタス環境。
デジタルが実現する、さまざまな機能の中で、今回の「WindosMedia9」が果たす役割を見てみよう。
まずデジタルメディアに望まれる方向を整理してみた。
メディア産業からは「見る、聴く」を実現する品質の向上。
広告業界としては「露出、履歴」からの効果測定。
クリエーターからは「作る、権利を守る」能力。
物販業種やコンテンツデベロッパーからは「配る、課金する」機能が重要な要素として上げられる。

■ 2003-1-29 DIGITAL MEDIA Day (赤坂ACTシアター)

その兆しは、今回の「WindosMedia9」発表イベントでマイクロソフトが演出した。
会場である赤坂ACTシアターの大スクリーンと、5.1チャンネルのサラウンドオーディオを再生するPAシステムに接続されていたのは、どこでも手に入るWindowsXPのパソコン(P4 2.83Ghz)だった。
Near HD品質と表現する1280×720の画角を24フレームのプログレッシブで再生する映像は、映画の品質には及ばないまでも、家庭のテレビを確実に越えていた。
既存の映画予告編を中心に、スクリーンへ表示される映像は大きな可能性を秘めていた。
多少発生していたコマ落ちや、リップシンクのずれなどは、CPUの能力が上がれば処理できることが明確なだけに、大きな世代交代のカウントダウンを感じる。

それでは、それぞれの要素を実現する、具体的な機能を見てみよう。

■ WindosMedia9エンコーダーの機能
大幅に改善されたエンコーダーの注目点は、制御機能と柔軟性だ。
クリエーターの負担がかからない無償で提供されるソフトとは思えない高機能なエンコーダーソフトで、IEEE1394からのDV映像を取り込む際のデバイスコントロールが標準装備となった。
デバイス制御が可能になったことと合わせてマルチパスのエンコードも可能になった。
DVDなどのMPEG-2ではおなじみの、可変ビットレート(VBR)の対応でさらに高圧縮で高品質が可能になった。
権利保護のためにマイクロソフトDRM(デジタル著作権管理)を使用してリアルタイムに暗号化処理が行える。
サーバーの機能強化に合わせて、従来プルのみだった配信に、プッシュ処理が可能になった。
さらにリモート監視機能でサーバーサイドの配信統計情報を随時入手ができるようになった。
複数のオーディオファイルを利用してリアルタイムでマルチチャンネルのオーディオコンテンツが作成できる。
ロスレス(可逆圧縮)を採用したオーディオでは計算上損失のないCD品質オーディオが扱える。
ライブイベントなどで送出ソースを、ライブ入力と記録済みファイルと切り替えられるため、多彩な演出が可能になった。
さらに、プラグインで、機能拡大も可能で、エンコード時の特殊効果も行えるようになった。
また、機能豊富なユーティリティで細かなファイル操作を実現したり、SDKにより制御システムの開発、自動化なども行えるようになった。
コマンドラインからもコントロールできるエンコーダーは、さらなる機能拡張に柔軟な対応を見せてくれるだろう。

 

■ WindosMedia9サーバーの機能
Windows2003で実装される新しいWindowsMediaServerは、多くの改善が見られた。
特に目立つ点は、即座に再生を開始する「ファストストリーミング」機能だ。
これは、従来のストリーミング配信で付きものだった再生が開始されるまでのバッファ時間をなくして、瞬間的に再生を開始するものだ。
テレビチャンネルを切り替える感覚でコンテンツのザッピングすることも夢ではない。
また、回線帯域に余裕があれば、再生時間軸に関係なく早めにデータをプレーヤーにキャッシュさせることで、ネットワークトラブルによる再生中断を最小化できる。
実際にネットワークケーブルを途中で抜いても、再生を継続するし、また接続すれば再生にブランク無く継続することができた。
次に、サーバーサイドでのプレイリスト編成による広告の挿入も行うことが可能になった。従来複雑だったユーザーごとに広告を変えた配信を実行するなどのカスタマイズも可能になった。
動的にプレイリストを編集しながら配信を止める事なく運用できる。
従来のサーバーの配信能力を2倍に向上させただけでなく、コンテンツ配信ネットワーク(CDN)への対応も可能になった。
SDKの開放によってキャッシュサーバーやプロキシーサーバーとしても構築が可能。
充実した管理ツールと、プラグインによる拡張でプラットフォームで稼動するストレージ、課金、ロギングのシステムとシームレスに統合できる。

 

■ WindosMedia9プレーヤーの機能
単なるメディアファイル再生ソフトではなく、デジタルメディアマネージメントのベースになる成長を遂げた。開放されたスキンのカスタマイズによる多様な差別化が行える。
新しいサーバーとの組み合わせでバッファリングを過去のものにした配信を受けられる。
ローカルディスクに存在するメディアファイルのみならずネットワーク上にある好みのコンテンツへ快適につなぐことができる。メディア管理が大変に楽になった。
多彩なスキンデザインと、カスタマイズを提供するSDKによって、コンテンツプロバイダーによって独自の再生環境を構築できる。htmlのWeb画面やFlashのアニメーション表示もプレーヤーだけで対応するので、Webブラウザー抜きでもコンテンツを表示できる。
Infoセンター表示でDVD再生時にカバー情報、チャプタ情報、レビューなどの多彩な情報が表示される。
TVチャンネル感覚のすばやい切り替えに反応し、再生リスト間のクロスフェード機能で自動的に音量を調整してくれる。
オーディオCDの作成では、自動ボリューム調整機能によって、再生リスト内の全トラックが均一に調整される。CD-Rで作成されたディスクは、WindowsMediaに対応したDVDプレーヤー、カーステレオ、ポータブルCDプレーヤーで再生することができる。
このように家電機器との接続を大きく進めたことも注目に値する。

 

● 多様なビジネスモデル
プロが意識する品質向上により利用する方法が現実的になってきた


発表会にゲスト出演した「千と千尋の神隠し」など映画音楽で著名な久石 譲さんは、
「ここまでくるのは大変なことだな!」と賞する。
先日テレビ放送で高視聴率を収めた「千と千尋の神隠し」はステレオ放送だったが、自身の監督作品である「カルテット」を5.1chサラウンドで紹介しながら、映画監督2作品目になる「第4楽章」を2月6日からブロードバンド上映を試みるなど、意欲を示している。

マイクロソフト株式会社では、国内の音楽、映像コンテンツサービス提供会社4社と協力して会員制の課金コンテンツサービス「Windows Media 9 シリーズ プレミアムサービス」を開始する。
放送事業者が試みるビジネスモデルとして、「株式会社WOWOW」が提案する「WOWOW Genetics」では、エンターテイメントコンテンツをストリーミング配信する。
「株式会社スカイパーフェク・コミュニケーション」では「スカパー!BB」として放送コンテンツの有効利用を目指している。
音楽業界が試みるビジネスモデルとしては、「エイベックスグループ」が、アーティストのビデオクリップを2Mbpsの高品質映像で配信する「PRISMIX TV」をスタートする。
「ゆうせん」では、旬モノからン懐かしのテレビ番組、オリジナル秘蔵映像など「ShowTime」で提供する。
「プレミアムサービス」では、WindowsMediaプレーヤーを起動するだけで、「プレミアムサービス」タグから、各社が提供する音楽、映像のコンテンツの視聴から購入まで一連のサービスを受けることができる。コンテンツサービス提供会社は「プレミアムサービス」と連携することで、従来の会員に加えて、ブロードバンドを活用した新しい会員獲得を目指すことが可能だ。


● 家電との関わり方
高精細HDと5.1chサラウンドは、ブロードバンドだけでなく、メモリー媒体や、CD、DVDなどのディスクメディアの容量節約に大きな意味を持っている。
200以上のデバイスが賛同するWindowsMediaAudio対応の携帯オーディオプレーヤーがよい例だ。
DVDディスクにWMAのファイルで登録すれば3000時間にも及ぶアーカイブが可能だ。
さらに、映像を含めた新規格「HIGHMAT」対応の機器にも大きな可能性を示している。
Panasonic、FujiFilm、SONIC、Pinnacle、JVC、AHEAD、BHA、ECI、APEXなどが賛同している。
DVDの再生だけでなく、パソコンで作成したディスクから、オーディオ、静止画、ビデオを、一般のテレビジョンで再生可能にする規格として今後が楽しみだ。
ホームシアター、ポータブルDVDプレーヤーやカーコンポなどでの利用が提案されている。
映像商品の納品形態がますます増えてくることを意味するのだ。

 

「WindosMedia9」は、大きく進歩したコーデックによって、さらに高品質、高圧縮を可能にした。エンコーダー、サーバー、プレーヤー、そして、それぞれの開発キットと、著作権管理機能を加えて、デジタルメディアの世界でブレイクスルーを迎えようとしている。
この方向性が、従来の「小さな画面でぎこちない再生」が、いよいよ「大画面でスムーズな再生」へ近づいてきたのだ。
アナログ時代のテレビジョンは、テレビ誕生の50年前から現在まで「放送規格」である512本の走査線、毎分約30枚のフレームという共通のルールによってハードウェアが普及し、逆に変化を制限され互換性を保ってきた。これはデジタルハイビジョンにしても同様だ。
一方、コンピュータを中心にデジタル映像は画面の密度(走査線というより解像度)や、毎分のコマ数を自由に変更することが、システムとして許容されている。
時間の問題で、テレビ品質はパソコン映像の品質に抜かれることになるだろう。

マイクロソフト社からWindowsMedia Encoder V9(開発コードCORONA)が登場した。ハイビジョン、そして5-1サラウンドまで対応する高品質なエンコードを可能にしている。いよいよ映像制作のプロの方々が活躍する時代が来ているのだ。


ちなみに、マイクロソフト社では、すでに各地の映画祭でWMV Cinemaを上映。
特に「Wendigo」は、映画館3館でWMV上映された世界最初の映画となった。
また、BMW社との共同で全米25館の映画館で8本のショートフィルムをHD(WMV)で上映している。この映画館のWindows Media Video(WMV)再生設備はそのまま常設され、今後のWMV Digital Cinemaに利用されるとのことだ。
http://www.bmwfilm.com
よく、ビデオ制作のプロの方から、ネットワークによるビデオ配信は、品質の面で否定的なご意見を良く聞かれたが、ブロードバンド時代を迎えた日本の都市部は、世界でも類を見ない高品質なラストワンマイルを有するインフラが用意されている。従来の低画質エンコードでは必要なかったビデオ素材の扱いが、今後、おもちゃではなく本格的な映像機器を要求されるようになってきているのだ。
早速、WindowsMedia Encoder V9を起動してみよう。


分かりやすく親切なウィザードから、素材のトランスコードや、テープデバイスからのキャプチャー、ライブのブロードキャストなど作業を選択できる。


次に取り付けているキャプチャーデバイスを選択する。当然HDなら、それを可能にする周辺環境が必要だ。加えて強力なCPUと、HDなどのハイエンドキャプチャーボードを装備すれば、マルチパスのエンコードを行うことができる。
現在、サンプル映像などの製作工程では、AccomなどのHDディスクレコーダーに1080・24Pで取り込むことで、コマ落ちなどの品質劣化を防いでいる。収録されたデジタル素材をAvid DS/HDノンリニア環境で編集、WindowsMedia Encoder V9へデータで渡す。
また、オーディオはProToolsなどから24bit/96khz 6WAV PCM非圧縮ファイルで取り込み、同じくWindowsMedia Encoder V9へデータで渡す。
残念ながら今回筆者はSDで画面だけ試してみたい。
ウィザードを進めると、従来のWindowsMediaサービスでは、PULL型での対応しかサポートされていなかったが、次世代の.NetServerへの布石が明確なPush型のエンコード・ブロードキャスト(ライブ配信)が用意されている。

さらにウィザードを進めると、配信ポートの設定を行える。
注目したいのはエンコードオプションでVideoに「HD quality」が出現し、Audioには「multi-channel surround sound」が出現するところだ。


レートを確認すると、5393kbpsと確認できる。
この品質のリアルタイムエンコードは、残念ながら筆者のプアなマシン環境(PIII/1G-Dual)では実行できない。
WindowsMedia Encoder V9のメイン画面に到着すると、「Properties」設定のボタンと、「Start Encoding」ボタンがわかりやすく並んでいる。


「Properties」では、ソースの選択から出力、圧縮、サイズ、メタ表記などタブが並んでいる。
インターレス処理されているSD素材なら「Deinterlace」は欠かせない。コンピュータ画面はプログレッシブなのだ。また、映画のテレシネ素材なら24コマから30コマへ調整した余分なコマが圧縮の邪魔になるので「Inverse telecine」も重要な選択だ。


WindowsMedia Encoder V9で追加された重要な方式で、プラグインによる機能追加が上げられる。標準で利用できるフィルターもご覧のとおり、さまざまなケースに柔軟な対応が可能になっている。

また、サードパーティーが自社機材に合わせたさまざまな特徴をエンコード作業に持ち込めるので、余計なプログラムを開発する手間が省け、品質向上に追い風となる。
残念ながら筆者のプアなマシン環境(PIII/1G-Dual)ではこれも選択すると実行できない。(エラー表示)


推奨は(P4xeon/2.4G-Dual)から上の世界で可能な力技なのだ。
「Start Encoding」ボタンを押すと、エンコードが開始される。


シンプルなエンコードを確実にこなしてくれるWindowsMedia Encoder V9は、ポストプロダクションに携わる人、必見のソフトと思う。新しいビジネスチャンスが、この分野には待ち構えているかもしれない。
ハイエンド・エンコードへ興味のある方は、下記までご連絡をお待ちしています。

本格的MPEG-4コンテンツ制作環境の紹介ができるようになった。
MPEG-4では映像の配信だけでなく、ユーザーサイドの選択を考慮したコンテンツ作りが行えるシステムとなる。
コンテンツ内容の効果測定や、関連情報のリンクなど、従来では不可能だった動的映像コンテンツの作りこみが可能だ。
もちろん、今まで再生環境に合わせてさまざまにSMILなどで作りこんでいたインタラクティブなコンテンツも、MPEGF-4なら、プレイヤーやOSに関係なく、ストリームベースで再生可能になるのだ。

現時点で手に入り、稼動する最初のMPEG-4トータルオーサリング環境はEnvivio社だけである。
「エンビビオ」の会社概要は、母体が「フランステレコム」のR&D、特にMPEG-4に関わる開発をしてた部隊がフランステレコムの出資を受けてスピンアウトし、独立したエンビビオという会社になった。会社はサンフランシスコにある。
エンビビオの優位性は、実際にMPEG-4で商品がきちんと、パッケージというかたちでもう提供できているところだ。エンビビオは価格も決まって、商品も出荷できているのが、まず1つめのポイントだ。
2つめは当然エンビビオのコアコンピタンスとして、MPEG-4の部分でのインタラクティブ性を使ったコンテンツを作成できるオーサリングのツールだ。ちなみに、この部分では彼らのパテントの技術をふんだんに取り込んで商品化している。

ブロードバンドビジネスに向けて、エンビビオがプライオリティーを高く展開を図っているのが、視聴する側のクライアントソフトへの対策だ。
現状はすべてソフトウェアのプラグインで提供され、リアルネットワークスのリアルプレイヤーと、クイックタイムのプレイヤー、これに関しては、もうサポートできている。あわせて、近々、Windows Media Playerへのサポートも同様に完了する。
そこで、いわゆるインターネットストリーミングの3大プレイヤーに関しては全てサポートできるので、裾野はかなりカバーできる。
クオリティーは、大画面で鑑賞したり、もしくはブロードバンドで様々な公共機関などに設置したりというかたちで、MPEG-4が使われてくるので、この場合には当然、「専用の箱」、セットトップボックス(STB)で受けたいというニーズもある。ハードウェアのシグマデザイン社製MPEG-4デコーダーチップを搭載し、すでにSTB製品もできている。

さらに、リアルタイムのライブ・エンコーダー製品としてもリリースしている。
従来ではMPEG-2を使って、ネットワークに負荷をかけ、コストが非常にかかる映像配信したり、衛星を使ってMPEG-2で配信していたが、MPEG-4で帯域を劇的に落とすことができる。今まで衛星で6Mとか4Mの帯域を使用して1チャンネル映像をサービスしていたところに対して、MPEG-4の1Mbpsぐらいのレートでは、同じ帯域幅で、4チャンネル映像を流せる。そういう部分でのメリットは大きい。
また、MPEG-4では、著作権の保護への対応もエンビビオではすでに実績もあり、対応できるメリットもある。
MPEG-4の規格を策定する「ISMA」でもエンビビオは中心的なメンバーとして活動している。特にMPEG-4のチェックをするためのコンテンツで、エンビビオのエンコーダーで作ったコンテンツを使って、他のメーカーのデコーダーをチェックしている位だそうだ。
ISMAスタンダードイコールエンビビオのように言われている状況こそ、MPEG-4のマーケットにおけるエンビビオのポジションを端的にあらわしているだろう。

さて、MPEG-4コンテンツ制作で重要なのはインタラクティブ性の持ったコンテンツを作れる部分だ。
ラインナップを見てみよう。

■「ブロードキャスト・スタジオ」は、オーサリングのツールだ。
ビデオ以外にさまざまな静止画像、テキストとか、アクションをつけたフラッシュ・コンテンツを利用し、インターラクティブMPEG-4が作成できるソフトウェアだ。GUIのわかりやすい環境で、コマンドコードの入力もほとんどなく、だれにでも操作できるだろう。

■「ライブ・エンコーダー」では、カメラや、VTRといったビデオソースを、キャプチャーボード経由で取り込んで、リアルタイムにMPEG-4のファイルとして格納することもできるし、ネットワークに対してマルチキャスト、ユニキャストで配信することもできるソフトウェアだ。
実際、2Mbpsのクオリティーで、フルD1の解像度までサポートできるので、DVDのクオリティー程度であれば、もうリアルタイムでMPEG-4に変換して配信までできる。

■「エンコーディング・ステーション」は、オフラインのエンコーダーで、ライブと違って、AVIの形式とか、MPEG-1もしくはMPEG-2とかのファイル形式で、ソフト的に取り込み変換できるというオフラインのトランスコーダーになる。
トランスコーダーはCPUのパワーに依存する。もとの素材にもよるが、リアルタイム以上のスピードで、トランスコードできる。もしくはクオリティー重視の場合にはダブルパスというような設定もできて、エンコードを2回かけてMPEG-4のファイルを作成するというようなところもできるソフトウェアになる。

■「ストリーミング・サーバー」は、配信用のサーバーのソフトウェアだ。MPEG-4のファイルを格納して、クライアントからの要求に応じて、同時に500ストリームまで配信できるというサーバーソフトウェアだ。
現状、対応OSは、WindowsとリナックスのOSをサポートしている。
ユニークなところでは、リアルネットワークスのリアルサーバーへ、プラグインという製品を用意しているので、ストリーミングサーバーの既存の環境だと、リアル・サーバーを使ったインフラが半数以上のシェアを占めているので、その環境と混在させてそのまま使えるようになる。

結局、MPEG-1~2と、MPEG-4は全然違うものだ。
MPEG-1~2は、コーデックそのものが、いかに効率高く映像をデジタライズして圧縮するという演算式で、いわゆるDCTといわれている演算式にMPEG-1、MPEG-2の価値があり圧縮をかけている。圧縮したコンテンツは確かにDVDで利用できたりするが、結局映像そのものが主体であって、それ以外の何者でもない。
MPEG-4は違う。映像を高効率で圧縮をかけるという非常に優れた技術的な面が強調されているが、重要なのはインタラクティビティーだ。時間軸と空間軸をMPEG-4の規格の中で管理できるという部分、これが非常に重要で、何ができるか、どう使うかによってビジネスモデルが出来上がってくるはずだ。
例えば、それが映像のコンテンツがあって、まわりにオブジェクトが貼り付けられ、そのオブジェクトに興味を持つとURLのリンクに飛んで行って、そのCDを買うとか、DVDを買うとかECのビジネスモデルにもなるし、e-ラーニングでも、映像にパワーポイントなどのオブジェクトを貼り付けて、それが時間軸で切り替わっていけば、学校の授業のライブラリーになり、セミナーだったらセミナーのライブラリーをSMILより簡単に作っていけることになる。
SMILも同様のことができるが、やはり技術的な弱点がまだまだある。SMILは圧縮方式ではないから、オブジェクトをどうやってリンクさせるかというスクリプトだけの世界になる。つまりオブジェクトの関連付けはできても、圧縮はしてくれないので、複雑なオブジェクトを貼りつけたSMILをストリーミングするのは、極めて難しいことになる。

純粋なMPEG-4トータルソリューションでとして、エンビビオは、蓄積映像(アーカイブ)や放送メディアだけでなく、インターネットや移動体通信でのマルチメディアコンテンツの伝送、あるいはインタラクティブ通信への利用に最適な広い互換性のあるフォーマットの制作環境を提供してくれた。

 2002年6月5日、東京国際フォーラムでは、ストリーミングビデオの歴史に残る発表がされた。商用ネットワークであるNTT東日本の「Bフレッツ」の「フレッツスクエア」から地域IP網を介して、マイクロソフト社の次期WindowsMediaテクノロジー、開発コード名「Corona」に対応したHD品質の高精細動画と、5.1chサラウンドオーディオが配信されたのだ。


StreamingMedia2002の特設ブースで公開されたHDストリーミング映像とサラウンドオーディオは、SDのテレビ放送を超える品質で来場者を驚かせていた。
実際にIP回線を通して、HD品質のストリーミングビデオが、ホームシアターをイメージした大画面プラズマディスプレイに、上映されている様子は圧巻だ。「Corona」は圧縮技術がすぐれているだけでなく、ネットワークでの情報配信に対して即時配信と常時配信を可能にしている。即時配信とは、動画再生時にバッファーが溜まるまで10~20秒待たされる現在の状態を解消して、リクエストしたらすぐに再生が始まることだ。また、常時配信とは、通信の信号が遅延したり一瞬途切れたりしても、破綻せずに再生を続けることができる機能だ。
さらに、今回の「Corona」には、オーディオの機能強化が目立っている。Windows Media Audio (WMA) Professionalでは新しいコーデックによりシアターレベルの5.1chサラウンドを実現している。新しいコーデックでは24bit/96Khzの品質を軽々とストリーミングすることができる。
「Corona」の最大の特徴はプラットフォームをパソコンに限定しないところにある。これは、携帯オーディオ機器としてWMAを利用したり、テレビに接続するSTB(セット・トップ・ボックス)などで、OSの制限を越えた利用を可能にした点だ。


すでにLinuxやiTORONなどで作動する「Corona」の存在も明らかにされている。
2002年度内に正式版を提供予定の「Corona」に期待したい。

このアーカイブについて

このページには、過去に書かれたブログ記事のうち動画圧縮コーデックカテゴリに属しているものが含まれています。

前のカテゴリはユビキタスです。

次のカテゴリは国際放送機器展です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

動画圧縮コーデック: 月別アーカイブ

Copyright 1996-2007 & copy; DreamCraft