タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Mechanizeとrubyに関するundertheskyのブックマーク (2)

  • Mechanize + Nokogiri の非JIS文字対応 - それはそれ、これはこれ

    id:otn:20090429 と id:otn:20090630 と id:otn:20090823 の続き。 一旦解決したかに思った、MechanizeのUTF8以外のページの処理ですが、昨日、「mixiの各コミュニティーの最新トピック一覧作成」処理がこけたので調べてみると、№ (1文字の"No.")の文字の所でページが終わったかのごとく処理されてました。 やっぱり、「JIS範囲外の文字が混じったEUC-JPのページ」がうまく処理されないようです。「そもそもそんなものは存在してはいけない」という突っ込みは、mixiの方にお願いします。 ですが、nkfだとちゃんと 1文字の"No." とか 丸付き数字 もEUC-JPからUTF-8に変換できます。ページの文字コード変換はMechanizeじゃなくてNokogiriがしていますが、iconv を使っている。iconvで 丸付き数字 を変換し

    Mechanize + Nokogiri の非JIS文字対応 - それはそれ、これはこれ
  • RubyのMechanizeを解説 for 1.0.0 - きたももんががきたん。

    私、餡子のためなら逆立ちだってしますよ。 こじらせている。 べたいと思ったらべたいのである。 ここが北カリフォルニアの片田舎であろうと、私があんみつがべたいと思えば、あんみつは今すぐ作ってべなくてはいけないものになる。いしん坊の思考は凄まじい。 子供が観ていたアニメで、赤ちゃんが空の…

    RubyのMechanizeを解説 for 1.0.0 - きたももんががきたん。
  • 1