文字サイズ

北海道大学 情報科学研究科 メディアダイナミクス研究室 Laboratory of Media Dynamics

意味理解

映像のシーン解析技術

DVDなどの映像では、あらかじめチャプターを設定することで効率良く映像を視聴することが可能となります。そのため、映像から同一の内容や話題を持つ区間を自動で検出する技術(映像のシーン分割)は、映像の効率的な視聴において非常に重要です。我々は、映像中における画像や音の特徴に注目して、例えば、同じ出来事が起こっている区間や同じ物体が映っている区間等の解析の他、大量の映像の中から共通して特徴が大きく変化する箇所をコンピュータに学習させることで、映像をシーンに分割する技術について研究しています。

スポーツ映像解析技術

サッカーや野球などのスポーツ映像は世界中で視聴されています。近年のスポーツ映像解析に関する研究では、番組や解説者が提供するような試合のデータや評価、戦術等を、試合映像から推定及び取得をし、これを提示することで、視聴者がより試合を楽しめるような技術が提案されています。具体的に、我々はスポーツ競技の特性やルール、推定された選手やボールの位置に基づいてチームの重要選手、パスコース、戦術などの推定を行っています。

音楽信号における和音推定技術

高さが異なる2つ以上の単音が重なり合う和音は、音楽の意味理解において重要な要素の1つであり、音楽信号から高精度に推定することが必要とされています。和音は、単音の推定結果を用いることで推定することが可能です。しかし、多数の単音によって和音が構成される場合に精度が十分でないことがあります。このため、和音の構成規則に注目して音楽信号を分類することで、高精度な推定を実現しています。

画像からのオブジェクト抽出技術

人間の感覚に合致した画像検索を行うために、画像の持つ意味内容を解析する研究が行われています。例えば、撮像されている物体を抽出することで、対象物体に基づいた画像の提示が可能となります。そこで我々は、同じ物体を含む画像を事前に大量に集めておき、共通で存在する画像特徴の類似性をコンピュータに学習させることで、対象物体の抽出を可能としています。

画像検索における可視化法の評価技術

大量の画像の中から欲しい画像を効率的に検索できるように、類似した画像を互いに近くに配置し、ユーザへ提示する方法が様々提案されています。このような背景から、どのような画像を検索する際に、どのような提示方法が最も効率的であるかを見出すことは、非常に重要です。我々は、これらの画像提示方法を、人間が物を探す際の視覚特性に基づいて評価する指標の提案を行っています。

Web映像解析 (階層構造抽出)技術

YouTubeに代表される映像共有サービスの普及によって、Web上に膨大な量の映像が存在しています。大量の映像の中からユーザが目的とする映像を効率的に検索するために、新たな技術が求められています。このような技術の一つとして、我々は類似した映像のコミュニティおよびその構造を抽出して検索を行う技術を研究しています。
コンテンツ一覧 (クリエイティブ・コモンズ)

Web上から真実に近い映像を探索する技術

現在、我々の身の回りにはテレビやネットにおいて大量の映像が溢れています。これらの映像の中から最も正確な情報を含む映像を選び出すことは、簡単ではありません。そこで、我々は、Web上に存在する大量の映像データの中から、最もオリジナルに近い映像を探し出す技術の開発を進めています。これにより、従来よりもより高精度に映像検索を行うことが可能となります。

楽曲推薦技術

iTunes storeのように膨大な音楽データベースから好みに合う楽曲を見つけ出すことは、多大な時間と労力を必要とします。そこで我々は、楽曲の音響信号に基づいた楽曲推薦の実現に取り組んでいます。ユーザが好む楽曲集合を解析し、音色や音階成分などの音響特徴における共通点を見つけ出すことで、 ユーザが好むであろう楽曲を推薦することが可能となります。

Back to Top ↑