タグ

2011年2月24日のブックマーク (9件)

  • WWW::Mechanizeはmetaタグを見てデコードするが、charset=Shift_JISのコンテンツって実際にはCP932なので化けるじゃねえか問題

    WWW::Mechanizeはmetaタグを見てデコードするが、charset=Shift_JISのコンテンツって実際にはCP932なので化けるじゃねえか問題 スポンサードリンク Tweet WWW::Mechanizeという、Perlで使う画面表示がないブラウザがあるんですけれども、こいつは取得するHTML文書がShift_JISでも、UTF-8でも、metaタグのcharset指定を読み込んで、デコードしてくれる機能が今は付いています。 (追記:自動でデコードしてくれる機能は、2006年9月の、バージョン1.21_01からのようです。HTTP::Messageモジュールの、decoded_contentメソッドを呼び出すことで実現しています。) この機能は、WWW::Mechanizeの主な機能、自動巡回をするときに生きてくるのです。たとえば、「次の20件」のリンクをたどりたい場合は、

    kits
    kits 2011/02/24
    髙や﨑などの字が化ける問題。
  • 高い?安い? W杯南アフリカ大会、日本代表ボーナス2220万 - footballnet【2ちゃんねるのサッカーニュースまとめ】

    1 少年法の壁φ ★ 投稿日:2011/02/23(水) 23:39:59.41 ID:???0 高い?安い?南アW杯日本代表ボーナス2220万     日サッカー協会は22日、W杯南アフリカ大会で日本代表選手に支払われたボーナスが、一人あたり最高で2220万円だったことを明らかにした。     日プロサッカー選手会が代表選手への報酬アップを求めているのに対し、「現状の金額は、不当に低いものではない」と反論するために公表した。 協会の財政状況なども踏まえた詳細な説明は、協会の公式ホームページに掲載。     http://news.www.infoseek.co.jp/sports/football/story/20110223_yol_oyt1t00937/     3 名無しさん@恐縮です 投稿日:2011/02/23(水) 23:40:32.95 ID:XTALM7rU0 妥当

  • ヴォイニッチ手稿 - Wikipedia

    ヴォイニッチ手稿のページ。 ヴォイニッチ手稿(ヴォイニッチしゅこう、ヴォイニッチ写、ヴォイニック写とも、英語: Voynich Manuscript)とは、1912年にイタリアで発見された古文書(写)。未解読の文字が記され、多数の奇妙な絵が描かれていることが特徴である。 ウィルフリッド・ヴォイニッチ。 大きさは23.5 cm × 16.2 cm × 5 cmで、左から右読み、現存する分で約240ページ(少なくとも28ページが欠落)の羊皮紙でできている。未解読の文字による文章が書かれており、ほぼ全てのページに女性、占星図、植物といった様々な絵が彩色されて大きく描かれている[1]。文章に使用されている言語は多くの歴史研究者および言語学者によって何度も解読の試みが行われているが、現在でも解明されていない[1]。 名称は発見者であるポーランド系アメリカ人の革命家で古書収集家のウィルフリッド・

    ヴォイニッチ手稿 - Wikipedia
    kits
    kits 2011/02/24
    「暗号文を言語学の統計的手法で解析した結果では、本文はでたらめな文字列ではなく、自然言語か人工言語のように確かに意味を持つ文章列であると判断されたが、なお解読されていない」
  • pm-uninstallで『localな環境』のコアモジュールを消せるアップデートをしていただきました - masartz->log(type=>'hatenablog')

    この前の文字コード問題で、local::libで作った手元の環境だけ Encode.pmをアップデートしてテストなどしていました。 この辺は今は「 cpanm -l ~/local Encode 」でサクっと出来てステキですね。 そして、実験終了後に消そうと思って、 pm-uninstall -l ~/local Encode とやったんですが、 Encode is Core Module!! Can't be uninstall と怒られてしまい、終了。 どうやら過去の経緯からコアモジュールは削除できないようです。 確かに通常のlibの下で考えるなら気軽に消せてはマズイという事で 正しいのですが、同じようにlocalにな環境に入れる場合はないのかな、 ということで #perl-casualで相談してみたところ、即効で対応していただけました! http://search.cpan.org/

    pm-uninstallで『localな環境』のコアモジュールを消せるアップデートをしていただきました - masartz->log(type=>'hatenablog')
    kits
    kits 2011/02/24
    「対象がコアモジュールでもコア以外のところ(local等)にインストールされているもので、コアなlibにはちゃんとそれがある、という確認が出来れば削除する」
  • utf8とEncodeの焼きまわし記事 - masartz->log(type=>'hatenablog')

    2011年にしてようやくutf8と向き合うことになりました。 と言っても、95%は「原則」を正しく読めば解決しました。 エントリとしては過去情報の焼き増しになるけど、一応メモとして残しておく。 原則 http://d.hatena.ne.jp/tokuhirom/20080408/1207619640 http://perl-users.jp/articles/advent-calendar/2009/casual/10.html 特にxaicronさんのエントリを改めて読み直したらカンペキにまとまっててすごい!Advent Calendar++ 最初に認識しておくこと 「sjisな世界、eucな世界、utf8な世界は他のレイヤーでもあるが、utf8フラグが立っている世界はperlの中にしかない」 今回困ったのは、 Cannot decode string with wide charac

    utf8とEncodeの焼きまわし記事 - masartz->log(type=>'hatenablog')
    kits
    kits 2011/02/24
    utf8フラグという言葉を使わない(意識しない)方がよいと思う。("Perl内部文字列"かどうか) / 追記の sub utf8_to_euc には、呼び出し側がutf-8にencodeされた文字列を渡すべきように思う。
  • Tips on IEC (implicit encoding conversion) - Islands in the byte stream

    Perlにおいて日語のテキスト文字列とバイナリ文字列*1を結合すると激しく文字化けするのは誰もがつまづくトラップですが、これはPerlのデフォルトのIECが Latin-1 に基づいて行われるからです。UTF-8ではなくLatin-1なのは後方互換のために必要な決定なのですが、我々日人にとってはこのせいで文字化けに苦しまれることになってしまいました。 そこで、IECが発生したときに致命的エラーを発生させるプラグマを書いてみました。 https://github.com/gfx/p5-encoding-implicit `no encoding::implicit` によって、そのスクリプト全体でIECを禁止します。これはencoding::warningsプラグマとほとんど同じですが、デフォルトで警告ではなく致命的エラーであること、スクリプト全体に効果があることが異なります。これにより

    Tips on IEC (implicit encoding conversion) - Islands in the byte stream
    kits
    kits 2011/02/24
    implicit encoding conversion → 暗黙のエンコーディング変換。 / no encoding::implicit;
  • シュヴァルの理想宮 - Wikipedia

    シュヴァルの理想宮 シュヴァルの理想宮(シュヴァルのりそうきゅう、フランス語: Palais idéal du facteur Cheval)は、フランスに存在する建築物。入り口に書かれた文字より「理想宮」と呼ばれ、ナイーヴ・アートの一つとみなされている。 アウトサイダー・アートの幻視の風景(Visionary environment)と呼ばれる造形されたアウトサイダー・アートに分類される[1]。 建造[編集] 理想宮の原点となった"La pierre d'achoppement"(つまずきの石) - 西のファサードのテラスに設置 1879年、フランス南部の片田舎であるドローム県オートリーブにおいて郵便配達夫であるフェルディナン・シュヴァルは、ソロバン玉が重なったような奇妙な形をした石につまずいた。 全景 その石から何らかのインスピレーションを得たシュヴァルは、以降、配達の途上石に目をつけ

    シュヴァルの理想宮 - Wikipedia
    kits
    kits 2011/02/24
    「1879年、石につまずく」がいいなあ。
  • 千夜一夜物語のあらすじ - Wikipedia

    せむし男および仕立屋とキリスト教徒の仲買人と御用係とユダヤ人の医者との物語(第24夜 - 第32夜)サブセクションを切り替えます

    kits
    kits 2011/02/24
    物語の中で更に物語が出てくるところがすごいんだよなあ。
  • サイエンスチャンネルの制作に関するブログ記事について|皆様からいただいたご意見と回答|科学技術振興機構

    サイエンスチャンネルの制作に関するブログ記事について、質問がいくつか寄せられておりますので、以下のように回答します。 ブログ記事アドレス http://shibalabo.air-nifty.com/tawake/2011/02/post-2fca.html JSTの職員が指示したとされている内容については、サイエンスチャンネル用に制作している「自然観察の達人」全10話について、JSTの担当者と制作会社の担当者の間で行われた種々の打ち合わせの内容がブログ著者に伝わり解釈され、一部が取り上げられたものです。結果としてJSTの担当者の意図が誤って受けとられることになり、たいへん不意な内容になっています。JST担当者と制作会社の担当者とのやりとりについては、担当者同士の業務上の打ち合わせですので、その内容をつまびらかにする記録はとられていませんが、以下に、ブログに取り上げられた3点について、J

    kits
    kits 2011/02/24
    ダンゴムシは昆虫じゃないよ! (一応言ってみた)