タグ

音声認識に関するtwainyのブックマーク (3)

  • W3C、音声合成記述言語「SSML」を日本語対応に

    Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

  • NEC、音声認識技術を活用して映像データを話題ごとに分割する技術を開発

    NECは5月29日、映像および音声コンテンツに含まれる音声から話題の変化を検出し、映像および音声コンテンツを話題ごとに分割する「トピック分割技術」を開発したと発表した。 デジタル放送網やインターネット上で大量に流通する映像および音声コンテンツを話題ごとに検索、頭出し、視聴、閲覧でき、映像および音声コンテンツの効率的な提供と視聴が可能になるとしている。 トピック分割技術は、自然な話し言葉を高精度でテキストに変換する音声認識技術と、テキストを意味のあるまとまりに切り分けるテキスト分割技術により実現したものだ。 話題が違えば語やフレーズの出現傾向も違うという「話題間の差異」に着目してトピックを分類することにより、政治、芸能、スポーツなど、話題の具体的内容に影響されることなく分割できるという。 また、一連の話題の移り変わりを数理的なモデルで表現し、話題の変化点をコンテンツ全体から総合的に判断するこ

    NEC、音声認識技術を活用して映像データを話題ごとに分割する技術を開発
    twainy
    twainy 2006/05/30
    話題が違えば語やフレーズの出現傾向も違うという「話題間の差異」に着目してトピックを分類する
  • 参議院の速記をパソコンで | スラド

    議事録に対するインデックス構築をリアルタイムで研究している者です(汗)。音声認識による議事録の自動インデックス化を比較対象としてサーベイしたことがありますので参考までにどうぞ。 速記は複数の人が交代で行います。 国会では2人1組で、2組(つまり、4人)で行います。 5~10分くらいで交代します。 速記は単純に発話された口頭発言だけを記録するものではなく、その時の会場の状態も記録します。 速記には衆議院式・参議院式の速記法があります。 速記は特別な記号を使うため、普通の人は読めません。 この記号を読み解く作業を「反訳(はんやく)」と言います。 国会の場合、反訳は数十人がかりでおこないます。 それでも、反訳には速記の5倍の時間がかかると言われています。 国会には衆参あわせて300人の速記者が雇われています。 地方自治体で速記者を雇っているところはほとんどありません。 書き起しをやってくれる会社

    twainy
    twainy 2006/05/04
    高いのを買えば十分使えるレベルなのか。今度安いやつで試してみようかな
  • 1