自由発話音声認識の高精度化
現在、カーナビや携帯電話などに音声認識が実装されているものがあります。
しかし、これらの多くは「コンビニへ行きたい」、「自宅へ戻る」などのように、決まった文や言葉だけを認識できるものです。
これまでの研究で、ニュース原稿の読み上げテキストの認識(NHKのアナウンサーのニュースを認識するようなことを想像してみてください)に関しては 95%以上の精度での認識が実現されています。
しかし、日常会話や原稿なしの講演(講義での先生の話)などで話される話し言葉(「自由発話」と呼びます)の認識精度はまだまだ低いのが現状です。
自由発話には、「えーと」、「あのー」などのような間投詞や単語の言い淀み、発音の怠けなど、様々な特徴があり、個人差も多く見られます。
私たちは、自由発話音声を精度よく認識するために、自由発話独特の文法や言葉、発声を考慮した認識システムの研究を行っています。

しかし、これらの多くは「コンビニへ行きたい」、「自宅へ戻る」などのように、決まった文や言葉だけを認識できるものです。
これまでの研究で、ニュース原稿の読み上げテキストの認識(NHKのアナウンサーのニュースを認識するようなことを想像してみてください)に関しては 95%以上の精度での認識が実現されています。
しかし、日常会話や原稿なしの講演(講義での先生の話)などで話される話し言葉(「自由発話」と呼びます)の認識精度はまだまだ低いのが現状です。
自由発話には、「えーと」、「あのー」などのような間投詞や単語の言い淀み、発音の怠けなど、様々な特徴があり、個人差も多く見られます。
私たちは、自由発話音声を精度よく認識するために、自由発話独特の文法や言葉、発声を考慮した認識システムの研究を行っています。
