ブックマーク / komachi.hatenablog.com (1)

  • 日本語版 Wikipedia の総単語数 - 武蔵野日記

    午前中は共同研究のミーティング。Polycom で電話会議。こんな簡単にやりとりできるとは、便利な時代になったものだ。 午後は NLP.app 勉強会(自然言語処理の応用勉強会)で Delip Rao and David Yarowsky. Ranking and Semi-supervised Classification on Large Scale Graphs Using Map-Reduce. In Proc. of TextGraphs-4. 2009. を読む。やっていることは MapReduce を用いたラベル伝播で、これまで自然言語処理で使われていなかったのだけど、初めてやりました、という話(同じ時期に開催された ACL-IJCNLP 2009 でほぼ同じ手法を自分も使ったので、自然言語処理にこの手法を適用したのは彼と自分が同時期ということになる)。 しかし勉強会の中でも

    日本語版 Wikipedia の総単語数 - 武蔵野日記
    toilet_lunch
    toilet_lunch 2010/05/25
    wikipediaの延べ単語数を数えたらだいたい4億2千万くらいでした。
  • 1