タグ

2008年6月4日のブックマーク (9件)

  • Amazon S3をマウントする·s3fs MOONGIFT

    Amazon EC2はごく手軽に使える仮想サーバだが、その性質上、サーバ(インスタンス)を終了すると全てのデータが消失するようになっている。これではデータを保存するようなことができない。そこで使われるのがAmazon S3というストレージサービスだ。 s3fsのプロジェクトページ 各種ライブラリは存在するが、最も使い勝手の良い方法はこれだろう。ファイルシステム並みに使うのだ。 今回紹介するオープンソース・ソフトウェアはs3fs、Amazon S3向けのFUSEだ。 FUSEを使うことで、通常のファイルシステムと同じ感覚でAmazon S3が利用できるようになる。インスタンスを落とすことで消失すると困るデータはs3fsを使ってマウントしたファイルシステムに入れるか、定期的なバッチでコピーしたりすれば良い。 利用はターミナルベース。オプションでアクセスIDを指定するか、/etc/passwd-

    Amazon S3をマウントする·s3fs MOONGIFT
    rawwell
    rawwell 2008/06/04
  • http://teahut.sakura.ne.jp/b/data/2008-01-31-1/dynamo-memo.txt

    rawwell
    rawwell 2008/06/04
  • たけまる / Perl - Text::MeCab を使ってみた

    _ Perl - Text::MeCab を使ってみた [perl][nlp] MoSQL をインストールしたついでに,MeCab を Perl から使えるようにし てみました.MeCab は日語の形態素解析を行うツールで,文章を単語に 区切り,品詞名を推定してくれます.たとえば,文章から固有名詞を抜き 出したり,読み仮名をふるときに使えます. MeCab と Text::MeCab というふたつのモジュールがありますが,インタ フェースと速度の面で Text::MeCab が優れているようです. Text::MeCab を使って,わかち書きと品詞推定をやってみました.品詞情 報をハッシュキーで指定できるように,ちょっと工夫してあります (ex. $word->{'品詞'} で品詞名,$word->{'読み'} で読み方を得られる). MeCab のインストールについては "MoSQL

  • mixi Engineers’ Blog » Tokyo Tyrantによる耐高負荷DBの構築

    連休中はWiiのマリオカートをやりまくってやっとVR7000越えたmikioです。愛車はマッハ・バイクとインターセプターです。さて今回は、分散ハッシュデータベースサーバTokyo Tyrantでmixiの最終ログイン時刻を管理するようにした時の苦労話を書きます。 ログイン処理は負荷地獄 mixiでは、全てのユーザについて、各々の最終ログイン時刻を管理しています。「マイミクシィ一覧」や「お気に入り」などの画面で、友人が近い時間にログインしていてコミュニケーションがとりやすい状態にあるかどうか確認できるようにするためです。 mixiのほぼ全てのページはログインしないと見られないページなので、ほぼ全てのページにアクセスされるたびにログイン確認が行われます。したがって、最終ログイン時刻はほぼ全てのページにアクセスされる度に更新されることになります。mixiの中で最も重いデータベースのひとつとして「

    mixi Engineers’ Blog » Tokyo Tyrantによる耐高負荷DBの構築
  • Home

    Nvidia is set to offer a peek at its new next-generation AI chip at the company's annual developer conference on Monday (March 18). Around 16,000 people are expected to attend the event, and chipmaker CEO Jensen Huang will unveil new flagship products. In late February, Nvidia's market value surpassed $2 trillion, positioning it just $400…

    rawwell
    rawwell 2008/06/04
    "However, it is difficult to create redundancy and parallelism with relational databases, so they become a single point of failure. In particular, replication is not trivial. To understand why, consider the problem of having two database servers that need to have identical data. Having both servers
  • Googleブログ検索の特許で明らかになったブログの評価を決定する12の要因 : F.Ko-Jiの「一秒後は未来」 mobile ver.

  • MOONGIFT: ? Amazon S3クローンを作る「Park Place」:オープンソースを毎日紹介

    Amazon S3は前々から少しずつ触っていたのだが、これはソフトウェアよりもプログラムから触った方が楽しいかも知れない。簡単にアップロードでき、メタデータやコンテンツタイプを自分で追加でき、さらにアクセス権限も動的に設定できる。 非常にユニークで面白いサービスではあるのだが、一つ欠点がある。それは開発中もAmazon S3を使わねばならず、そのために余計なコスト(恐らく低コストだが)が発生したり、インターネットに接続されている必要性が生じる。それではいつでもどこでも開発というわけにはいかない。そこでこれだ。 今回紹介するオープンソース・ソフトウェアはPark Place、Amazon S3クローンだ。 Park PlaceはRubyで作られたソフトウェアで、Mongrelを使ったHTTPサーバを利用してAmazon S3の真似をする。SOAPインタフェースが利用できるようになっている。

    MOONGIFT: ? Amazon S3クローンを作る「Park Place」:オープンソースを毎日紹介
  • Yahoo!デベロッパーネットワークにテキスト解析APIが登場!

    Yahoo!デベロッパーネットワークにテキスト解析APIが登場! 2007-06-18-1 [WebTool][NLP][MECAPI][Programming] Yahoo!デベロッパーネットワークに「テキスト解析」が登場しました。 第一弾は日形態素解析APIです。 ヤフーのいろんなところに使われている WebMA という 形態素解析エンジンのAPIです。 - Yahoo!デベロッパーネットワーク - テキスト解析 - 日形態素解析 http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html MECAPI の仕様に似ていますが、まあそういうものです。 (MECAPI https://maapi.net/) で、先日 MECAPI で作った「文で検索」[2007-04-03-1]の WebMA 版を作ってみました。「文で検索2」

    Yahoo!デベロッパーネットワークにテキスト解析APIが登場!
    rawwell
    rawwell 2008/06/04
  • Tanablog: Vim7 内蔵の grep を使う

    Vim7 から、内蔵の grep プログラムが使えるようになっている。との情報を「grep を使いやすくする」のコメントでいただいた。結論から言うと内蔵 grep は便利。 vimgrep を使う Vim7 内蔵の grep を使うには :vimgrep コマンドを使えばよい。 :vimgrep /hogehoge/ *.txt 最初にマッチしたファイルを開かないようにするには j フラグを使う。 :vimgrep /hogehoge/j *.txt 再帰的に検索するには **(starstar) を使う。 :vimgrep /hogehoge/j **/*.txt 検索結果は Quickfixリストに表示される。:copen で開き :ccl で閉じることができる。詳細は :he quickfix-window。 vimgrep をデフォルトの grep プログラムとして使用する :gr

    rawwell
    rawwell 2008/06/04