2010年5月25日のブックマーク (3件)

  • 日本語版 Wikipedia の総単語数 - 武蔵野日記

    午前中は共同研究のミーティング。Polycom で電話会議。こんな簡単にやりとりできるとは、便利な時代になったものだ。 午後は NLP.app 勉強会(自然言語処理の応用勉強会)で Delip Rao and David Yarowsky. Ranking and Semi-supervised Classification on Large Scale Graphs Using Map-Reduce. In Proc. of TextGraphs-4. 2009. を読む。やっていることは MapReduce を用いたラベル伝播で、これまで自然言語処理で使われていなかったのだけど、初めてやりました、という話(同じ時期に開催された ACL-IJCNLP 2009 でほぼ同じ手法を自分も使ったので、自然言語処理にこの手法を適用したのは彼と自分が同時期ということになる)。 しかし勉強会の中でも

    日本語版 Wikipedia の総単語数 - 武蔵野日記
    toilet_lunch
    toilet_lunch 2010/05/25
    wikipediaの延べ単語数を数えたらだいたい4億2千万くらいでした。
  • IEにも対応!ブラウザ上でローカルにストレージを作るJavaScriptライブラリ「jStorage」:phpspot開発日誌

    IEにも対応!ブラウザ上でローカルにストレージを作るJavaScriptライブラリ「jStorage」 2010年05月25日- jStorage - simple JavaScript plugin to store data locally IEにも対応!ブラウザ上でローカルにストレージを作るJavaScriptライブラリ「jStorage」。 基HTML5のストレージを使いますが、対応していないブラウザは、例えばIEではuserDataを使ってデータを格納します。 ライブラリ内でクロスブラウザ対応はしてくれるので、利用者はただ jStorageのメソッドを呼び出すだけでストレージを利用できます。 ブラウザごとのサポートと、ストレージサイズは以下。IE6,7 が 128KBと、比較的小さいですが、それなりに大きなデータを保持できることが分かります。 基とするフレームワークライブラ

  • グーグルによるMapReduceサービス「BigQuery」が登場。SQLライクな命令で大規模データ操作

    「数兆件のデータも対話的に、高速に分析できる」。グーグルは5月19日にこのような表現で新しいサービス「BigQuery」の登場を紹介するエントリを、ブログにポストしています。 グーグルが公開したBigQueryは、Hadoopやデータウェアハウスなどを用いて多くの企業が行おうとしている大規模データ(いわゆる「Big Data」)の分析を、グーグルのクラウドで可能にします。利用者はGoogle Storage経由で大規模データを転送し、SQLライクな命令によって抽出や分析を行います。 まるでグーグルが大規模データ処理のMapReduceをホスティングし、その機能をサービスとして提供するようなものがBigQueryといえます(ただし公開された「BigQuery」の説明には、内部でMapReduceを利用しているのかどうかの記述はないのため、MapReduce「的」なサービスと表現すべきかもしれ

    グーグルによるMapReduceサービス「BigQuery」が登場。SQLライクな命令で大規模データ操作