タグ

hatenaに関するtoocheapjpのブックマーク (8)

  • はてなブックマーク×Firefox記念 ノベルティセット欲しい!とは - はてなキーワード

    はてなブックマークをFirefoxブラウザでもっと便利に使える拡張機能、「はてなブックマークFirefox拡張」が正式リリースされました。これを記念して、Mozilla Japan 様よりご提供いただいたFirefoxノベルティセットが当たる「はてなブックマーク×Firefox記念 ノベルティセット欲しい!」キャンペーンを開催いたします。 応募方法はかんたん。このキャンペーンページを自分のはてなブックマークに追加するだけで応募完了です。(はてなブックマークFirefox拡張を使ってブックマークするともっとかんたんです!) ブックマークに追加してキャンペーンに応募する! まだはてなブックマークでページを追加したことがないという方も、下記リンクからはてなブックマークを利用開始いただけます。ぜひこの機会に利用開始して、Firefoxグッズを手に入れてください。

    はてなブックマーク×Firefox記念 ノベルティセット欲しい!とは - はてなキーワード
  • Aho Corasick 法 - naoyaのはてなダイアリー

    適当な単語群を含む辞書があったとします。「京都の高倉二条に美味しいつけ麺のお店がある」*1という文章が入力として与えられたとき、この文章中に含まれる辞書中のキーワードを抽出したい、ということがあります。例えば辞書に「京都」「高倉二条」「つけ麺」「店」という単語が含まれていた場合には、これらの単語(と出現位置)が入力に対しての出力になります。 この類の処理は、任意の開始位置から部分一致する辞書中のキーワードをすべて取り出す処理、ということで「共通接頭辞検索 (Common Prefix Search)」などと呼ばれるそうです。形態素解析Wikipediaはてなキーワードのキーワードリンク処理などが代表的な応用例です。 Aho Corasick 法 任意のテキストから辞書に含まれるキーワードをすべて抽出するという処理の実現方法は色々とあります。Aho Corasick 法はその方法のひと

    Aho Corasick 法 - naoyaのはてなダイアリー
  • CPANモジュールをスクリプト一発で依存解決しつつrpm化する - とあるはてな社員の日記

    少し前にmizzyさんに そういえば、まっさらなサーバを30分で番投入できるようにする で stanaka さんが「CPANの依存関係を解析してrpm化する手製スクリプトで、CPANモジュールのrpm化が、ほぼ自動化されています」と書いてるんだけど、これって公開してくれないのかなー。 HowToRpmizeCpanModules - mizzy.org - Trac と突かれたので、githubで公開してみます。 http://github.com/stanaka/cpan-dependency/tree/master 突かれたついでにmizzyさんに軽く動作確認してもらったところ、それなりに動いているようです。また、はてなでは、このスクリプトを利用して、日々それなりの数のCPANモジュールのrpm化を行っていますので、だいたいうまく動くのではないかと思います。 CentOSやFedor

    CPANモジュールをスクリプト一発で依存解決しつつrpm化する - とあるはてな社員の日記
  • 1日で作る全文検索エンジン - Building a full-text search engine in "ONE" day - - とあるはてな社員の日記

    最近、「Introduction to Information Retrieval」というStanfordの大学院向け教科書のドラフトを読んでいます。id:naoyaあたりが勉強会で読んでいる教科書です。この教科書には、効率のいい全文検索システムを作るにはどうすればいいか、という(まさに)教科書的手法が網羅的に書いてあり、そのあたりに興味がある人には、非常に興味深く読めるお勧めのです。 ただ、面白い面白いと言っているだけでは、エンジニアとしては価値半減ですので、GW中にrubyで一日かけて実装してみました。 さすがに実装は、一日で作ったものですから、非常に素朴です。マルチバイト文字はbi-gramで、シングルバイトはスペースなどの区切り記号で認識しています。インデックスは、rubyの処理系のHashやArrayで保持しており、外部にMarshallで書き出す、というものです。検索エンジン

  • about Thrift

    http://slideshare.net/KeiNakazawa/web-pnaclasmjs-web の続きです。

    about Thrift
  • はてな流大規模データ処理

    広告システムを全く知らなかった私が約2ヶ月弱の開発期間で初期バージョンをローンチ、アーキテクチャも日々変更していき、あれから1年が経過しました。 SmartNews Adsは一般的な広告配信サーバとは異なる特徴をいくつか持っています。今回は運用型広告と純広告型の配信サーバのアーキテクチャを中心に、個人の裁量でどのように設計し、何を採択し、どのように変更していったのかを可能な限り公開し、発生した障害(課題)も晒しながらポストモーテムをします。

    はてな流大規模データ処理
  • 「はてな流大規模データ処理」を見てきた - もぎゃろぐ

    KOF2008:関西オープンソース2008というイベントに来ています。 はてなの伊藤さんの講演があったので、講演メモを公開。 #ボクがメモした内容であって、100%言ったとおりに書いてあるわけじゃないので、参考としてご覧ください。 (続き) アジェンダ 大規模なデータ OSのキャッシュ MySQLの運用 大規模データアプリケーションの開発 データの例 はてなブックマークのデータ量:五千万件くらいのデータ量 このデータに対して何百万人がアクセスしてくる状況でどういう作りにするか レコード数 1073万エントリー 3134万エントリー 4143万タグ データサイズ エントリー2.5GB 何の工夫もなく普通にアクセスすると...200秒待っても結果が帰ってこない 大規模データの難しいところ 開発サーバで開発者が作っている時は快適に動いていても、多数の人間がアク

  • はてなダイアリー - つれずれなるままに… - 2007-08-14

    はてなダイアリーのヘッダ、フッタ、文にて一部のscriptタグやobjectタグなどを使用可能にし、ブログパーツやブログアクセサリー等をご自分のダイアリーへ設置できるようになりました。これまではセキュリティ上の問題からscriptタグやobjectタグを貼ることができませんでしたが、はてなが許可したものについてはタグを直接貼ることができます。 今回対応したのは以下4つのブログパーツです。 Yahoo!ニュース - トピックスブログパーツ Yahoo!天気情報 - ブログパーツ Google AdSense Google Gadgets はてなダイアリー日記 - 自分のはてなダイアリーにブログパーツを設置できるようになりました これを見て、「正直少なくね?」と思った人も多いだろう。 しかし、この中にある「Google Gadgets」を使えば、はてなダイアリーであらゆるブログツールが使

    はてなダイアリー - つれずれなるままに… - 2007-08-14
  • 1