タグ

2008年4月22日のブックマーク (3件)

  • AutoPagerize Wiki: XPath Cookbook

    node()と*の違い //node() //* をそれぞれ実行してみればわかるが、node()はテキストノードなどを含めたすべてのノードを、*はNode.ELEMENT_NODEな要素だけを選択する。この違いはパフォーマンスに影響を与えるので、意識して使い分けるのが良い。 なお、 * はattributeとnamespaceを基準点とした場合はそれぞれattributeとnamespaceを選択する(例://@* は全てのAttrを選択する)。 詳細は仕様書でXML Path Language (XPath) - 2.3 ノードテスト 省略シンタックスと非省略、そして少しの応用 // は /descendant-or-self::node()/ の省略形である。/divは/child::divの省略形で、//div[1]は//div[position()=1]を(さらに)省略した形である

    june29
    june29 2008/04/22
    これはきちんと読もう! ( Jottit の有効活用
  • ユーザが入力した危険なタグを取り除く進んだ方法 : やむにやまれず

    2007年10月16日01:41 by 山崎泰宏 ユーザが入力した危険なタグを取り除く進んだ方法 カテゴリRuby小技 Tweet sparklegate Comment(0)Trackback(0) Hpricotという高速で超便利なhtml scraperがあるんです。 RSSで皆幸せになりつつあるこのご時世に、今更先祖がえりしてhtmlなんかをパースして何の役に立つのかと。 いや、それが役に立つんです。 良くあるのは、あるサイトのhtmlを取得してきてページのデータ解析をすると言ったもの。 いわゆるロボット的なアルゴリズムを組み立てる際に重宝するわけです。 でも、ここではそんな積極的にhtmlを取りに行く際に役立てるのではなく、htmlが送りつけられた際にそのhtmlがそのサイトにとって安全なものかを検証し、必要なら修正をしてしまうというアルゴリズムにしてみたいと思います。 ここで紹

    ユーザが入力した危険なタグを取り除く進んだ方法 : やむにやまれず
    june29
    june29 2008/04/22
    Hpricot を使って HTML 中の script タグや onclick 等のイベント属性を除去する
  • STBBS.NET blog: Carbon Emacsで ruby-modeと日本語

    2008年4月5日版の Carbon Emacsでは、ruby-modeで日語含みのスクリプトをsaveしようとすると ruby-mode-set-encoding: Symbol's function definition is void: coding-system-to-mime-charset といわれてしまって出来ない。 /Applications/Emacs.app/Contents/Resources/site-lisp/ruby-mode.el を開き、 add-hook 'before-save-hook と書いてある行をコメントアウトして保存し、 M-x byte-compile-file で変更した ruby-mode.elをコンパイルする(ruby-mode.elcが出来る)ことでとりあえずsaveは出来るようになる。

    june29
    june29 2008/04/22
    ruby-mode で日本語を含むファイルを保存できなくて困っていたところ