タグ

ブックマーク / private.ceek.jp (9)

  • Tritonn による検索はスコア値でソートされない - Ceekz Logs (Move to y.ceek.jp)

    最近は、徹夜しながら MySQL + Senna の Tritonn を試している。先日まで、Tritonn を利用した全文検索では、取り出した結果がスコア値でソート(適合度順)されるものだと思っていた。 すなわち、 SELECT * FROM table WHERE MATCH(col) AGAINST('*D+ 検索' IN BOOLEAN MODE); というクエリを発行した場合、結果は TF-IDF に基づく順序だと思っていた。 これは、単なる思い込みで、正しくない。 SELECT *, MATCH(col) AGAINST('*D+ 検索' IN BOOLEAN MODE) FROM table WHERE MATCH(col) AGAINST('*D+ 検索' IN BOOLEAN MODE); こうすればスコア値を表示できるので、スコア順でソートされていないことを確認できた。

  • Plagger::Plugin::CustomFeed::NewsCeekJp - Ceekz Logs (Move to y.ceek.jp)

    Perl 村では Plagger なるものが流行っているようです(海外でも?)。 Plagger は Bloglines to Gmail な Hack の進化したもので、すべてをプラグインで実装できるようにしたソフトウェアです。Blog ソフトウェアの Blosxom とか SMTP サーバの qpsmtpd とかを知ってる方は、それの RSS アグリゲータ版と思っていただけると話が早い。 データの入力と出力をプラグインで好きに変更できるソフトウェアという感じでしょうか。 Plagger::Plugin::CustomFeed::NewsCeekJp という CEEK.JP NEWS の入力を扱うプラグインがアップされていました。自分のサイトの関係物を他の人が作っていただけるのは、嬉しい限りです。 Plagger については、全然調べていないのですがこれを機会に、少し調べてみる。

    kazeburo
    kazeburo 2006/05/02
  • MySQL 4.1 の日本語設定 - Ceekz Logs (Move to y.ceek.jp)

    現在 MySQL 3.x を使っていますが、今後は CentOS 4.1 に乗り換えるので、それに伴い MySQL 4.1.x を使うことになりそうです。 ソースコードから入れると柔軟に変更できるようですが、普通は RPM のをそのまま使うので、その設定でうまく使う方法を考えないといけない。 どの辺が変わったかは、他のページを見ていただくとして、とりあえず、設定が柔軟になったのです。あまりにも柔軟に設定できるようになってしまったので、初期設定では、日語を扱いにくくなってます。 俺 UTF-8 をずっと使ってるもーん。という方は、そのままでもいけると思う。 僕は、昔(?)から EUC を使ってるんですよね。なので、なかなか UTF-8 に乗り換える機会が無い。ここで乗り換えようかと思ったのだけど、結局 EUC で行きそうです。 /etc/my.cnf の変更 [mysqld] old_pa

  • UserAgent に RSS の購読者数を入れる? - Ceekz Logs (Move to y.ceek.jp)

    ブラウザで使う RSS Reader が、急速に増えています。僕も、片手間で作ったりしましたが… そこで、ひそかに進められている(というか、もう公然のルール)になっているのが「クローラーの User-Agent に 購読者数を送信する」というものです。 という記述を見つけたのですが、少々、首を捻ります。書き手の首を捻るわけではないですよ。僕がかしげると言うこと。 Web 型 RSS リーダーからのアクセスについては、この「User-Agent」に含まれている情報を見ることで、その先何人の人に購読されているかというのが簡単に把握できるようになっています。 ある意味、これは「RSS 配信者に知る権利がある」情報だと思いますので、これからも対応が進められるといいなぁ、と思います。 これには、大いに賛成。今までは、UserAgent と IP アドレスをチェックしていれば、ある程度のユニークユーザ

    kazeburo
    kazeburo 2006/02/14
  • FastCGI のインストール - Ceekz Logs (Move to y.ceek.jp)

    Hyper Estraier を FastCGI を使って動かすと、ソートがキャッシュ出来るようになったようです。ということで、必要な FastCGI をインストールしてみたので、そのメモ。 よくわかんないけど、体っぽいのをインストール。いつも通りで。 fcgi-2.4.0.tar.gz Apache で動かすので、必要となる mod_fastcgi をインストール。 mod_fastcgi-2.4.2.tar.gz Apache2 を使っているので、以下のような手順を踏みます。 $ cd mod_fastcgi-2.4.2 $ cp Makefile.AP2 Makefile $ make $ make install しかし RedHat9 を使っているので、これでは無理でした。 Makefile 内の top_dir を以下のように修正。 top_dir = /etc/httpd

  • MySQL でランダム表示 - Ceekz Logs (Move to y.ceek.jp)

    MySQL のレコード取り出しの際に、ソートをランダムにできないものかと調べていたら、あった。 SELECT * FROM table ORDER BY RAND() こんな感じで。ソートを RAND にすれば良いという… 使い道としては、広告を表示したり、クイズを表示したりに使えるんじゃないかと思う。というか、そういう使い方をしたくて調べてた。 MySQL って深いなぁ。他にも面白い関数がありそうだ。 トラックバック このリストは、次のエントリーを参照しています: MySQL でランダム表示: » [開発]データベース側でランダムにしてもらう方法 from The dream is invincibility. これAccessにもないかなぁ.MySQL でランダム表示 MySQL のレコード取り出しの際に、ソートをランダムにできないものかと調べていたら、あった。あと,... [続きを読

    kazeburo
    kazeburo 2005/11/17
    Class::DBI::mysqlで使われていたりします
  • 黒と白を決めるサブルーチン - Ceekz Logs (Move to y.ceek.jp)

    Google AdSense の代替広告用の CGI を作っています。データは Amazon Web Services を使うことになると思うのですが、デザインを Google AdSense に似せてみようと思います。 Google AdSense は、枠線のカラーを決めると、自動的に Ads by Goooooogle のカラーを #000000 か #FFFFFF に決めてくれます。これは、どういう仕組みで判定しているのだろうかと、調べてみた。 結構、簡単な仕組みでした。 明るさ=R×0.30+G×0.59+B×0.11 この式で明るさが決まるらしい。明るさは、与えられる RGB の範囲で決まりますが、大概は 0〜255 だと思います。 Perl にて、サブルーチンも作成。 sub get_powered_link_color { my ($border_color) = @_; m

    kazeburo
    kazeburo 2005/11/13
  • はてなブックマーカーランキング - Ceekz Logs (Move to y.ceek.jp)

    国内のソーシャルブックマークは、はてながシェアトップだと思うのですが、そのユーザーのがんばり度をランキングにしてみました。 このプロジェクトは、ソーシャルネットワーキングサイト mixi が発端だった。 yoshida 人気エントリーの最初のクリッパーは誰なのか調べると面白いかも。 やってみるかな。 要は、言いだしっぺだ。 ブックマークしているユーザーが20を超えているエントリーを「人気エントリー」と仮定し、そのエントリーをはじめにブックマークしたユーザーにポイントを振って、ランキングしています。 1番目 〜 10番目 に対し、10pt 〜 1pt のポイントを振っています。このポイントを振られたユーザーを「貢献ユーザー」としておきましょう。人気エントリーのブックマーク数に応じて比重をかけるのも良いかと思いましたが、ややこしくなるので、とりあえずは、単純な算出方法で。 このポイントを合計し

    kazeburo
    kazeburo 2005/08/05
    アルファ・クリッパー
  • CentOS 設定中(1) - Ceekz Logs (Move to y.ceek.jp)

    やっとこさ、ニュース検索を分離することになりました。データベースサーバ構想は、まだ先。とりあえず、ニュース検索と、それ以外を分けます。 CentOS を採用したのだけど、メモ。 初期インストールは開発ツールのみにして、必要に応じて yum で入れる。 文字コードが UTF-8 になったので putty を使う。しかし、フォントを変更しないとダメ。Terminal というフォントだと UTF-8 の文字が空白になる。なんてこったい。 yum を 理研 に変更。 $ less /etc/yum.repos.d/CentOS-Base.repo [base] name=CentOS-$releasever - Base baseurl=http://ftp.riken.jp/Linux/centos/$releasever/os/$basearch/ gpgcheck=1 ... hosts.d

  • 1