タグ

検索と技術に関するdaikichi_blueのブックマーク (3)

  • 日立、2000時間の録音データから3秒で検索する音声検索技術 | WIRED VISION

    日立、2000時間の録音データから3秒で検索する音声検索技術 2008年10月 7日 サイエンス・テクノロジーITメディア コメント: トラックバック (0) 三好 豊/Infostand 日立製作所は10月6日、大量の録音データの中から、任意のキーワードを含む音声を高精度・高速に検索する技術を開発したと発表した。2000時間の録音の中から3秒で検索できるという。音声付き映像コンテンツの検索や、コールセンターの分析などへの応用が期待できるとしている。 音素(音声の基単位)の記号列と音声特徴量による検索方式を組み合わせた。録音データを音素記号化して検索し、対象を絞り込んだ上で、より精密な検索が可能な音声特徴量検索を2段階で実施。精度を高めながら高速に検索を行うという。 従来の音声検索技術は、録音データを音素の記号列に変換してキーワードを照合する方式と、録音データの音声特徴量を解析して照合す

  • グーグル、検索アルゴリズムを少しずつ明らかに

    Googleは、同社の検索エンジンの内部動作について、少し秘密にしすぎていたという結論に達した。 同社はこれまで、何を検索結果一覧の先頭に表示するかを決定するアルゴリズムについて、あえて公表を避けてきた。同社の検索品質に関するエンジニアリング担当バイスプレジデントを務めるUdi Manber氏は米国時間5月21日付けのブログ投稿で、その理由の1つは、競合他社による模倣を防止するためであり、また別の理由としてはそれを悪用するウェブサイトの出現を防ぐためであったと述べた。しかし今後は、もう少し公開していく予定である。 「完全な秘密主義を貫くのは理想的ではない。このブログ投稿は、今後はこれまでよりももう少し公開していこうという新たな決意を示すものである」とManber氏は述べている。「これからは定期的に新しい部分について語り、古い部分を説明し、アドバイスをし、情報を公開し、対話していくよう努力す

    グーグル、検索アルゴリズムを少しずつ明らかに
  • 「意図的削除はしていない」が…… 謎深まる“消えた初音ミク”問題

    Yahoo!JAPANとGoogleの画像検索で、「初音ミク」を検索した際に適切な結果を表示できない問題で、両社は10月22日、「『初音ミク』というキーワードについて、検索からの削除依頼はなく、意図的に落としたわけではない」と説明した。両社とも原因は調査中。検索サーバは米国にあり、両社とも米国のスタッフと協力して対策を進めているため、解決までにはまだしばらく時間がかかりそうだ。 国内の検索エンジンは現在、Yahoo!JAPANとGoogleが8割以上のシェアを握っているが(コムスコア・ジャパンの検索シェア調査結果)、この騒動を受けてネット上では、適切な検索結果が出るMSN「Live Search」やライブドア、gooなどの画像検索への評価が高まっている。 「意図的に落としたということは、100%ない」 Yahoo!JAPANやGoogleで、「初音ミク」で画像検索しても適切な結果が出ないこ

    「意図的削除はしていない」が…… 謎深まる“消えた初音ミク”問題
  • 1