タグ

2011年10月21日のブックマーク (4件)

  • Scala Hadoop実験(Hishidama's Scala Hadoop Memo)

    Eclipseの環境設定 ここではWindowsのHadoop単独環境を想定している。 使用したのはHadoop0.21.0。 Eclipseでのコンパイルに必要なのは、Hadoop体のjarファイルと、HADOOP_HOME/lib直下のjarファイル全部。 JavaのWordCountそのまま まずはJavaで書いたWordCountをそのままScalaに変換してみる。 →ソース全体(WordCount0.scala) インポート インポート部分はScalaの機能を使ってちょっと短縮できる。 import java.util.StringTokenizer import org.apache.hadoop.conf.{ Configuration, Configured } import org.apache.hadoop.fs.Path import org.apache.hado

    mwsoft
    mwsoft 2011/10/21
  • 未登録語テンプレートを用いた日本語形態素解析 | CiNii Research

    JaLC IRDB Crossref DataCite NDL NDL-Digital RUDA JDCat NINJAL CiNii Articles CiNii Books CiNii Dissertations DBpedia Nikkei BP KAKEN Integbio MDR PubMed LSDB Archive 極地研ADS 極地研学術DB 公共データカタログ ムーンショット型研究開発事業

    mwsoft
    mwsoft 2011/10/21
  • まつもと直伝 プログラミングのオキテ 第12回 多重継承再び

    今回は継承,特に誤解されがちな多重継承について改めて解説します。「オブジェクトは現実世界のモノの反映であり,継承はそのモノの分類を反映したものである」,「多重継承は良くないものだ」という意見が正しいかどうか,判断する基準を紹介します。 今回は,オブジェクト指向にまつわる誤解を取り上げましょう。 これまで,オブジェクト指向プログラミングの古くからのファンとして解説を書き,Rubyというオブジェクト指向プログラミング言語を提供してきました。オブジェクト指向プログラミングをより多くの人が身近に感じられるように貢献してきたつもりです。Smalltalkよりも手軽に入手でき,JavaC++よりも簡単にオブジェクト指向プログラミングを実践できるRubyによってオブジェクト指向という概念がより理解しやすくなったのではないかと自負しています。 しかし,その過程で,私自身の未熟さもあり,オブジェクト指向プ

    まつもと直伝 プログラミングのオキテ 第12回 多重継承再び
    mwsoft
    mwsoft 2011/10/21
  • メールアドレスの正規表現がめちゃめちゃ遅くなることがある件について - 木曜不足

    Solr 3.5 から新たに加わる言語判定機能に、拙作の言語判定ライブラリ langdetect が正式に採用されたようで。 言語判別機能の追加 (Solr 3.5) http://lucene.jugem.jp/?eid=455 LanguageDetection - Solr Wiki http://wiki.apache.org/solr/LanguageDetection もともと Apache Nutch などの言語判定に不満で作り始めたこと、そして実際に社内(サイボウズ)で langdetect を Solr に組み込んで利用していることを考えれば、懐と言ってもいいくらい。 ありがたや。 でも、今日の話はそっちではなくて。 その langdetect の Issue Board にて教えていただいた「メールアドレスの正規表現がめちゃめちゃ遅くなることがある」件について。 論よ

    メールアドレスの正規表現がめちゃめちゃ遅くなることがある件について - 木曜不足
    mwsoft
    mwsoft 2011/10/21