タグ

ブックマーク / rudi.hatenablog.com (4)

  • Beautiful SoupでHTMLやXMLをparseしよう - そこはかとなく書くよ。

    Beautiful SoupはHTMLやXMLをparseしてくれるパーサーライブラリです。でも、Beautiful Soupは単なるパーサーじゃなくてちょっと賢い奴なんです。 今回、このBeautiful Soupのドキュメントを翻訳しました。 http://www.tdoc.info/beautifulsoup/ 下に軽く紹介していますが、詳しくはこのドキュメントをご覧ください。 Beautiful Soupをざっくり紹介 Beautiful Soupがどういうやつかって?例えばこんなHTMLがあったとしましょう。 <HTML> <body> 改行<br> したいよね <br/> <! --あれ、空白が入ってるちょっと変なコメント--> <p> bodyが閉じてないよ? </html> 結構変なHTMLですよね。でも、巷にはこういうのも結構あるんです。で、これをtest1.htmlだと

    Beautiful SoupでHTMLやXMLをparseしよう - そこはかとなく書くよ。
    kk6
    kk6 2011/09/07
  • argparseを使ってみた - そこはかとなく書くよ。

    追記: t2yさんが翻訳してくださいました。 argparseコマンドラインオプションと引数の解析 python 2.7からコマンドラインの引数を解釈するargparseモジュールが標準で入りました。 従来使われてきたoptparseは廃止されます。ただし、広く使われているところから他の廃止されるモジュールとは異なり消されることはなく、警告も標準では出ません。 optparseからargparseに移行する理由や廃止の進め方はPEP 389に記載されています。 以下にPEP 389の和訳を(訳に自信がない場所がありますが)行ないましたので参考にしてください。 http://www.tdoc.info/PEP-ja/389.html というわけで、ざっとargparseの使い方を勉強したのでここに公開します。間違ってたらご指摘ください。 なお、ちゃんとしたドキュメントは http://doc

    argparseを使ってみた - そこはかとなく書くよ。
    kk6
    kk6 2011/08/19
  • reST/Markdownで書けるHTML slide generator、landslide - そこはかとなく書くよ。

    Twitterで@voluntas さんがつぶやいていた landslide を使ってみると、結構いいことが分かりました。 サンプルを作りましたので、ここに置いておきます。 説明 左右の矢印キーでスライドを切り替えます 元ファイル 画像の扱いに問題があったりしますが、現在も開発されているようですので、解決していくのではないでしょうか。 インストールも簡単ですし、しばらくはこれでスライド作ってみることにします。 .... blockdiag directiveを追加してみるとか、いいかも?

    reST/Markdownで書けるHTML slide generator、landslide - そこはかとなく書くよ。
  • pipの使い方 - そこはかとなく書くよ。

    注意 この内容はすでに古くなっています。 pipの使い方 (2014/1バージョン) を参照してください。 pipとは、Pythonにおけるパッケージ管理システムです。easy_installというツールもあるのですが、pipはこのeasy_installを置き換えるものとして開発されています。rubyのgemperlのcpan的な位置づけです。 同じパッケージ管理ツールとしてsetuptools置き換えのdistributeというものもあるのですが、こちらはsetuptools全体を置き換えるものとして開発されており、pipはsetuptoolsの一部であるeasy_installを置き換える形です。 なお、現在のpipのバージョンは0.8.2で、このエントリはこのバージョンを使っています。 なにかおかしい点があれば、ご指摘ください。 > 識者の方々 pipのinstall まずはea

    pipの使い方 - そこはかとなく書くよ。
    kk6
    kk6 2011/01/17
  • 1