タグ

ブックマーク / labs.cybozu.co.jp (9)

  • Kazuho@Cybozu Labs: キーワード抽出モジュールを作ってみた

    « IIS のログを tail -f | メイン | Lingua::JA::Summarize 0.02 » 2006年04月26日 キーワード抽出モジュールを作ってみた 一昨日、同僚の竹迫さんに、文書内からのキーワード抽出技術について教えてもらっていた時、わざわざ TF-IDF注1 用に別のコーパスを用意しなくても、MeCab だったら生起コストを辞書内に持っているんだから、それを使えばいいのではないか、という話になりました。 竹迫さんがその日のうちに作ってくれたプロトタイプで、アルゴリズムの改善とパラメータのチューニングを行ったところ、十分な品質が出そうなので、書き直して公開することにしました。 普通の Perl モジュールなので、 perl Makefile.PL && make && make install すれば使うことができます (15:50追記: すみません。 MeCab

    kokogiko
    kokogiko 2010/08/15
  • Kazuho@Cybozu Labs: MySQL Conference & Expo 2009 に参加してきました

    « FreeBSD の ptrace ではサンドボックスを作れないという話 | メイン | ブログ移転のおしらせ » 2009年04月30日 MySQL Conference & Expo 2009 に参加してきました 先週一週間、MySQL Conference & Expo 2009 に参加してきました。ほとんどのキーノートのビデオや一部のセッションの資料は公開されているようなので、それ以外、全体からうけたイメージなどについて、つらつらと。 サービスをスケールアウトする話は、意外と聞かなかったように思います。今回が初参加だったので間違っているのかもしれませんが、単純な「スケールアウトできるよね」という話ではなく、むしろ、アプリケーションデベロッパに負担をかけずにスケールアウト (もしくはスケールアップ) するデータベースを、どのように作るか、というところが盛り上がっていたように思います

    kokogiko
    kokogiko 2009/05/01
  • TAKESAKO @ Yet another Cybozu Labs: Pure Perl で Acme::x86::CPUID を作りました

    Perlでアセンブリプログラミングしているとき、実行マシンのCPUを判別してプログラムの処理を分岐したいときがでてくると思います。 そういうときに困ってしまわないように Acme::x86::CPUID を作ってみました。 package Acme::x86::CPUID; use DynaLoader; sub ProcessorBrandString { my $cpu = "\0" x 48; my $x86 = "" . "S\xbf" . pack("P", $cpu) . "\xb8\x02\x00\x00\x80" . ("P\x0f\xa2\x89\x07\x89_\x04\x89O\x08\x89W\x0c\x8d\x7f\x10X\x8d\@\x01" x 3) . "[\xc3" ; DynaLoader::dl_install_xsub("X",unpack"L",

    kokogiko
    kokogiko 2009/03/25
  • Google App Engine SDKを使ってみた | 秋元@サイボウズラボ・プログラマー・ブログ

    [追記] これを書いたあとアカウントが入手できたので、実際にGoogle App Engineのサーバ上で簡単なスクリプトを動かしてみた。 Googleが今晩(米国時間)のパーティーCampFireOneでTech CrunchメンバーやRobert Scobleさんら参加者に対して発表したGoogle App Engine, AmazonがS3+EC2+SQS+SimpleDB等で先行している「スケールする従量制ホスティングサービス」の競合サービスのようだ。 Googleが自社で使っているような大規模展開が可能なサーバ+ミドルウェア群を、外部に提供するということ。まずはPythonGoogle自身も使っている各種ライブラリ、WebフレームワークDjango、を積んでの公開だが、他の言語にも対応していくらしい。 やはりGoogleというか、ディスク500MB、月500万PVまでは無料で使

    Google App Engine SDKを使ってみた | 秋元@サイボウズラボ・プログラマー・ブログ
    kokogiko
    kokogiko 2009/01/13
  • 畑@サイボウズ・ラボ - 図書管理システム

    サイボウズ・ラボの社内でしばらく使っていた図書管理システムを、一般にも使えるように整備しましたので公開します。よろしければ使って頂ければと思います。 図書管理システム AmazonWebサービスを利用していますが、今のところ実装的に amazon.co.jp の方なので、 日向けに限定されます。 では、利用方法を説明したいと思います。簡単には以下のフローで使い始めることができます。 31toolsのアカウントを作成します。 ログインします。 図書リスト名を入力して図書リストを作成します。 「ブックマークレットについて」のページから、 「このを図書リスト(...)に登録する」というブックマークレットを、 お気に入りやブックマークに追加します。 amazon.co.jp にアクセスし、登録したい書籍情報のページに移動します。 amazon.co.jp の書籍情報のページで「このを..

  • WEIS Protocol, Version 1.0

    WEIS Protocol, Version 1.0 (Draft) Feb. 24, 2006 Kazuho Oku Summary WEIS (Web Identity Syndication) is a web-browser-based identity syndication protocol that allows web applications to syndicate authentication credentials with limited permissions to other web applications. The protocol is based on existing, widely-deployed standards: HTTP Authentication [HTTPAUTH] and HTML forms [HTML40]. This doc

  • Kazuho@Cybozu Labs: Comet の正しい使い方

    « 「スーパー技術者争奪戦」 | メイン | JavaScript から Flash の便利な機能を使う方法 » 2007年02月23日 Comet の正しい使い方 今日会社の勉強会で Comet について話す機会がありました。 Comet については、普及するかどうかという以前に、どう使えばいいのか、正しく使った場合に何をどこまでできるのか、という理解が共有されていないように思います。なので、(あくまで私見ですが) 使用したスライドの一部を公開したいと思います。よろしければごらんください。また、問題や改善すべき点があれば、教えていただければ幸いです。

  • log4ZIGOROu : Module-Starterのカスタマイズ

    date 2007-04-02 14:05:29 category CPAN permlink here comment 0 trackback 0 いずれ奇麗にまとめてやろうと思ってたんですが、いい機会なのでこの辺りでmodule-starterの詳細とカスタマイズについて書いてみます。 ところで以前Module::Starterのplugin機構が面白い件についてと言うエントリを書いた事があるのですが、こちらに関して頭に入っているとより理解しやすいかもしれません。 名前とメールアドレスの設定 毎回author, emailを指定するのも面倒なので下記のように設定してしまいましょう。 ~/.module-starter/configに記載します。 author: Toru Yamaguchi email: foo@example.com これで次回からこのパラメータを指定する必要は無くな

  • Kazuho@Cybozu Labs: MySQL (InnoDB) に直接アクセスしてタイムライン処理を高速化する話

    « フレンド・タイムライン処理の原理と実践 | メイン | MySQL の ORDER BY を高速化 » 2008年06月12日 MySQL (InnoDB) に直接アクセスしてタイムライン処理を高速化する話 フレンド・タイムライン処理の原理と実践 の続きです。 先のエントリでは、プルモデルの速度が当初予測していたよりも遅かった (というより SQL レイヤでのオーバーヘッドが大きそうだった) ので、MySQL Internals メーリングリストで質問したりしながら、C++ で直接 InnoDB にアクセスするようなコードを書いてみました。 タイムライン構築速度 タイムライン/秒 SQL そしたら、10倍以上高速に! ベンチマークを perl ベースのものから mysqlslap に変えたのですが、プッシュモデルの 2/3 の速度が出ています。これなら、データサイズが約 1/10 にな

  • 1