タグ

ブックマーク / teahut.sakura.ne.jp (2)

  • たけまる / Google App Engine のデータストアは Bigtable をどのように使っているのか

    _ Google App Engine のデータストアは Bigtable をどのように使っているのか [gae][bigtable] Google App Engine (GAE) が発表されてから2週間ほど経ちます.GFS や Bigtable という名前だけはよく耳にするようになりましたが,Bigtable と GAE のギャップについては話題になっていないように思います. Bigtable は multi dimensional sorted table と言われるように, primary key (row key) でソートされたテーブルでしかありません.つま り,GAE のデータストアが提供するような多様な検索機能は持たないわけ です.というわけで,GAE のデータストアを実現するために,Bigtable がどのように使われているのかを考えてみました. # この件について,もし

  • たけまる / Perl - Text::MeCab を使ってみた

    _ Perl - Text::MeCab を使ってみた [perl][nlp] MoSQL をインストールしたついでに,MeCab を Perl から使えるようにし てみました.MeCab は日語の形態素解析を行うツールで,文章を単語に 区切り,品詞名を推定してくれます.たとえば,文章から固有名詞を抜き 出したり,読み仮名をふるときに使えます. MeCab と Text::MeCab というふたつのモジュールがありますが,インタ フェースと速度の面で Text::MeCab が優れているようです. Text::MeCab を使って,わかち書きと品詞推定をやってみました.品詞情 報をハッシュキーで指定できるように,ちょっと工夫してあります (ex. $word->{'品詞'} で品詞名,$word->{'読み'} で読み方を得られる). MeCab のインストールについては "MoSQL

  • 1