タグ

2007年7月2日のブックマーク (3件)

  • mixiが自社開発の検索エンジンに移行、ウェブ検索はYSTに

    ミクシィは7月2日、ソーシャルネットワーキングサービス(SNS)「mixi」内の検索機能をgooから自社開発の検索エンジンに切り替えた。 今回の検索エンジン移行により、mixi内における日記やコミュニティの検索機能はすべて自社開発の検索エンジンによって提供される。 この検索エンジンは「文字 N-gram」をいう手法を用いたもので、従来の検索エンジンに比べて検索漏れが少ないという。mixiの日記には、辞書に掲載されていない文字が見られたり、文字がきちんと並んでいなかったりする。こういった場合に効率よく検索できる技術として文字 N-gramによる検索エンジンを導入したという。 同時に、ウェブ検索のエンジンも「Yahoo! Search Technology」(YST)に移行した。この検索エンジンはヤフーでも採用されている。 オーバーチュアは今回のYST導入を機に、mixi のコミュニティ検索、

    mixiが自社開発の検索エンジンに移行、ウェブ検索はYSTに
    tasukuchan
    tasukuchan 2007/07/02
    mikioタンはぁはぁ
  • Cultureua.com

  • ctypes で CaboCha を使う - 傀儡師の館.Python:楽天ブログ

    2007.07.01 ctypes で CaboCha を使う テーマ:プログラミング言語 Python を使う(336) カテゴリ:ことばの処理 以前に 日語係り受け解析器 CaboCha/南瓜: Yet Another Japanese Dependency Structure Analyzer を Python から使うのに、ctypes で CaboCha を使って玉砕 (2003/11/29) したが、2005-12-24の cabocha 0.53 を使ってあらためてやり直したらうまく動くようになっていた。パスを通していないと libyamcha.dll が見つからないとエラーが出るが、インストールしたディレクトリをパスに追加したら問題なく使えた。 from ctypes import * lib=cdll.LoadLibrary("c:/Program Files/cabo

    ctypes で CaboCha を使う - 傀儡師の館.Python:楽天ブログ
    tasukuchan
    tasukuchan 2007/07/02
    バインディングはctypes版とコンパイル版2つあったほうがいいな