タグ

2005年12月4日のブックマーク (3件)

  • ポッドキャスト内の言葉を拾う検索エンジン | WIRED VISION

    ポッドキャスト内の言葉を拾う検索エンジン 2005年12月 2日 コメント: トラックバック (0) Kim Zetter 2005年12月02日 ブログを検索できる『テクノラティ』と同じように、ポッドキャストを探せる検索エンジンが新たに2つ登場した。ポッドキャストをキーワードで検索し、欲しい音声ファイルを正確に探し出せるのだ。 『ポッドジンガー』(Podzinger)と『ブリンクス』(Blinx)の新バージョンは、音声をテキストに変換してインデックス化することにより、キーワードによる音声コンテンツの高速検索を行なう。従来の検索エンジンは、音声ファイルの概要を説明した見出しや紹介文など、ポッドキャストのメタデータに含まれるキーワードだけを検索対象にしていたので、これは大きな前進と言える。 ポッドジンガー(12月中旬までベータ版)では、ポッドキャストの中で検索ワードが出てくる部分に直接ジャン

  • はてブニュース

    クロールは15分おきです。日付はクローラーが初めて見つけた日時です。最新情報を追いかければ、新しくブックマークされた人気・注目エントリーを追いかけることができます。

  • Text Classification with CEEK.JP NEWS

    CEEK.JP NEWS の2009年1月から2011年12月の記事データを基に、テキストの分類を行います。対応しているカテゴリーは「社会」「政治」「国際」「経済」「電脳」「スポーツ」「エンターテイメント」「サイエンス」の8つです。 ナイーブベイズ(Naive Bayes)分類法を用いており、概ね80%の精度で分類できます。 コンフュージョン・マトリックス(学習:2005年7月 / 判定:2005年8月) http://labs.ceek.jp/classify/cm.pdf 表の縦(グラフ)は、推定分野。表の横は、正解分野。 参考資料: 情報意味論(第8回) ベイズ学習 (櫻井研究室 情報意味論の講義資料) Tackling the Poor Assumptions of Naive Bayes Text Classifiers