タグ

rubyと研究に関するroba4944のブックマーク (2)

  • Webページの本文抽出 (nakatani @ cybozu labs)

    Webページの自動カテゴライズ の続き。 前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの文抽出がひとつの鍵になっています。今回はその文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。 モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。 【追記】大事なこと書き忘れ。モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont

  • The RWiki - Rubyで科学技術計算 まとめサイト

    Ruby for Scientific Computing Rubyで科学計算する例の紹介です。事例追加をお待ちしています。 カテゴリは後で調整するかもしれません。-masa *1 *2 *3 *4 *5 Ruby科学計算関連総合 SciRuby - Since June 2005, by Ara T. Howard. るびま0006 Ruby Library Report [第5回] 数値計算と可視化 - 著者: 堀之内 武 各分野での利用 Mathmatics - 数学 Algebra - 計算代数 Polynominal - by 児玉さん Algebra - by 原さん - 多変数多項式環のグレブナ−基底の実装。 Ruby Mathematica - MathematicaへのRubyインタフェース。 「プログラミングのための線形代数」 - 平岡和幸著 Earth Science

  • 1