タグ

2007年10月30日のブックマーク (7件)

  • Webページの本文抽出 (nakatani @ cybozu labs)

    Webページの自動カテゴライズ の続き。 前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの文抽出がひとつの鍵になっています。今回はその文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。 モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。 【追記】大事なこと書き忘れ。モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont

  • Ruby開発者まつもとゆきひろ氏 「Rubyからのメッセージ」

    最近トレンドとなりつつあるRubyであるが、その原点はいち技術者の願望の結晶であった。講演ではRubyの開発者人が、Rubyの設計に込めた思いを語る。また、RubyRubyたらしめる特徴や機能についても解説する。2007年10月16日にミラクル・リナックス株式会社主催で実施された「Asianux Road Show in Tokyo」の特別講演の内容。

    Ruby開発者まつもとゆきひろ氏 「Rubyからのメッセージ」
  • メモをペタッと貼れる MemoPeta

    はじめまして、開発担当の MY です。 IEDockEx のサンプルとして、現在閲覧中の Web ページにメモをペタっと貼れる、MemoPeta を開発しました。 ダウンロードは こちら から ※MemoPeta をご利用になるには UserAction Extension のインストールが必要です。 [使い方] 「表示/非表示ボタン」クリックでメモの表示/非表示を切り替えられます。 メモをクリックすると書き込めます。 書き込んだ内容を保存するには「保存する」ボタンをクリックしてください。 また、Javascript ON ならメモ下部のボタンをクリックすることで背景色を変えることが出来ます。 変更した背景色は書き込んだ内容とともに保存できます。 お気に入りのページにちょっとした覚え書きをするなど、様々用途にお使い下さい。 まだまだ機能的には不足な点もありますが、今後も改良を重ねていいもの

    メモをペタッと貼れる MemoPeta
  • Return 0

    return0.infoに移転。昔の日記はまんま残してるので読みたい人はどうぞ。 世界樹の迷宮関係のコンテンツは移行が面倒なのでこっちに残すことにした。 世界樹の迷宮プレイ記録 世界樹の迷宮IIプレイ記録 世界樹の迷宮IIIプレイ記録

    monjudoh
    monjudoh 2007/10/30
    『これは絶対に強力なエースの存在を前提にしていて、そのエースが不在だったり予想以上の負荷でエースから溢れが出ると一撃で破綻する。』あるある。でも、本当に酷いのは中堅レベルの奴がエース扱いされる案件かと
  • Function.applyを使って、クラスをMix-in - nothing but trouble

    Firebugのコードを読んでから、apply廚になりはじめている。 var Foo = function() { this.name = "Foo"; this.foo = "foo"; this.hage ="foo"; } var Bar = function() { this.name = "Bar"; this.bar = "bar"; this.hage = "bar"; } var Hoge = function() { this.name ="Hoge"; } new Hoge(); // Object name="Hoge" Foo.apply(Hoge.prototype); new Hoge(); // Object name="Hoge" foo="foo" hage="foo" Bar.apply(Hoge.prototype); new Hoge(); // O

    Function.applyを使って、クラスをMix-in - nothing but trouble
    monjudoh
    monjudoh 2007/10/30
    applyを使ってMix-in。
  • JS勉強会で話した内容 - nothing but trouble

    時間がなかったので、数分だけ喋った。ついでにFirebugの話だけじゃないよ。 以下の、htmlを題材に使った。 <html> <head> <title>send_のほーむぺーじ</title> <script type="text/javascript"> console.log("I hate %s !!!!","Safari"); </script> </head> <body> <div id="hoge"> <form> <input type="text" name="hoge" value=""/> </form> </div> <div id="hoge" style="color:red"><marquee id="foo">こんにちはこんにちは!</marquee></div> </body> </html> getElementById IEでidが複数あるhtml

    JS勉強会で話した内容 - nothing but trouble
    monjudoh
    monjudoh 2007/10/30
    『getElementById IEでidが複数あるhtmlの場合、getElementByIdはHTMLElementの配列を返す IEで同じ名前のidとnameが別の要素についている場合、nameの方のHTMLElementを返す。』メモメモ
  • FirebugのXPath関連関数でエレメントからXPathを作る « ku

    AutoPagerize用のXPathをかんたんに作るためのブックマークレット AutoPagerize IDE - bits and bytesみたいに、ブラウザ上でクリックした要素を表すXPathがほしいことがよくある。perlだったらこないだのXML::LibXML::ElementのnodePathでおしまい。 jsだとFirebugが中にそういうのを持ってる。コンソールに出力されたHTML要素の上にマウスを持っていくと、その要素を表すXPathが表示されるやつ。 extensionからだったらFirebugLib経由で呼び出すことができます。 /** * Gets an XPath for an element which describes its hierarchical location. */ this.getElementXPath = function(element

    monjudoh
    monjudoh 2007/10/30
    『extensionからだったらFirebugLib経由で呼び出すことができます。』