since Apr.2004

  ホーム  |   スタッフ  |   研究紹介  |   講義関連  |   アクセス  |   リンク  |  研究室紹介ページ

音源識別処理 / ニュース番組のトピック分割

 最近、ブルーレイディスクレコーダやハードディスクレコーダによって、多くの放送コンテンツに容易に アクセスできるようになってきました。ハードディスク内の大量の映像データをジャンルやトピックによって分類して、欲しい映像にいち早くアクセスできたら 助かりますね。このような要求は、放送局の番組アーカイブから、今日のニュースのために「小泉元首相の街頭での映像」を探し出したい、などの場面にもあり ます。このような、映像コンテンツの内容に即した区分をすることをインデクシングといい、映像情報や音声情報を用いた様々な手法が研究されています。
 
 私たちは、音声データを対象として、音声/音楽/雑音などの音源識別を行ったり、男性話者と女性話者が発話している区間を区別して検出したりする手法の 研究を行っています。

 また、ニュース番組をトピックごとに分割する方法の研究を行っています。ニュース番組で、ニューストピックが切り替わるとき、あなたの耳にはどのような 特徴が聴き取れますか?例えば、たっぷりとした間(無音時間)があったり、「次のニュースです」とか「次は」などのようなトピックの切り替わりを意味する キーワードが聞こえたりします。このような特徴的な音情報を利用して、ニューストピックの分割手法の検討も行っています。

                                  

関連論文 ※論文は学内からのみ閲覧可能です
    2004年度
      放送コンテンツを用いた音源識別の研究 (卒業論文)
    2005年度
    2006年度
      統計的手法を用いた音源識別の高精度化の検討 (修士論文)
      特徴的音情報によるニューストピック移行の検出 (卒業論文)
    2007年度
      音源識別のための音クラスタリングとガウス分布混合数の有効性の検討 (卒業論文)
    2008年度
      特徴的音情報と音声認識結果を利用したニューストピック境界検出法の研究 (修士論文)
    2009年度
      音声認識結果と単語出現頻度を用いたニューストピック分割の提案 (卒業論文)
    2010年度
      認識対象と文体が異なる学習データを用いたニュース音声認識用言語モデルの構築法の検討
      (卒業論文)
    2011年度
      言語モデルと音声認識結果の類似度尺度の高度化によるニューストピック分割法の検討 (修士論文)
   
研究紹介top |  自由発話 | ニュース音声 |  肺音 | 乳児 |  FPGA | 自動車音 |  サイン音