タグ

ブックマーク / dankogai.livedoor.blog (94)

  • 最近のはてブで流行している7つのタグ : 404 Blog Not Found

    2006年03月18日00:00 カテゴリLogosLightweight Languages 最近のはてブで流行している7つのタグ ↓にインスパイヤされますた。 ある編集者の気になるノート : 最近の出版界で流行している7つのキーワードで、「最強のタイトル」をつくってみた。 なかでも、多用されている7つのキーワードを抽出。 それらを組み合わせれば「最強のタイトル」ができるのではないか、と思ったのが、この記事を書いたキッカケです。 とはいっても、まず残念なことに、はてブにはブックマーカーごとのタグ数集計はあっても(厳密にはタグクラウドだけど)、全体のタグ数集計を直接知る方法がないということ。しゃあないので以下のscriptでホッテントリ分だけでも集計してみる。 #/usr/bin/env perl -Tw use strict; use HTML::LinkExtor; my %entry

    最近のはてブで流行している7つのタグ : 404 Blog Not Found
  • perl - When \p{} gets evaluated : 404 Blog Not Found

    2006年03月07日02:15 カテゴリ perl - When \p{} gets evaluated 理由が判明したのでentry。追記にしようと思いましたが注意喚起のため。 404 Blog Not Found:perl - how 2 cope w/ \p{IsBogus} これに関してはちょっとバグっぽげなのですがその理由とは、「\p{}は当に利用されるまで評価されない」というものです。 わかりやすくするために、以下に例を示します。 'ok' =~ /no\p{IsBogus}/; # すでに's'でmatchが失敗するので no error 'nok' =~ /no\p{IsBogus}/; # noまではmatchに成功。\p{}でexception その\p{}を展開しているのが、lib/utf8_heavy.plなのですが、 Heavyというだけあって結構大きなscr

    perl - When \p{} gets evaluated : 404 Blog Not Found
  • perl - how 2 cope w/ \p{IsBogus} : 404 Blog Not Found

    2006年03月07日00:38 カテゴリLightweight Languages perl - how 2 cope w/ \p{IsBogus} というわけで私めが。 Rauru Blog - Blog Archive - perl 正規表現での Unicode Property perl 5.8.* のパターンマッチで、\p での Unicode 属性を使う場合なんですが、不正な属性名を指定した場合にエラーになるかならないかがどこで分かれるか、ってご存知の方いらっしゃいませんか? うちの環境は 5.8.8 なんですが、 m/\p{IsDAMEDAME}/; だとエラーにならず普通にアンマッチ、一方 m/\p{IsDAMEDAME}/i;にすると Can't find Unicode property definition "DAMEDAME" とのエラーを吐き、さらに m/ \p{

    perl - how 2 cope w/ \p{IsBogus} : 404 Blog Not Found
  • use Encode # or use Jcode 2.00; # please! : 404 Blog Not Found

    2006年02月24日22:53 カテゴリLightweight Languages use Encode # or use Jcode 2.00; # please! ずいぶん昔のdrk7.jpさんのentryがホッテントられてたので便乗。 Spreadsheet::WriteExcel = PerlExcel 出力 :: Drk7jp ポイントは、Unicode::String モジュールと Jcode モジュールで日語を UTF-16BE に変換する必要があるという点です。Perl 5.8以降なら、Unicode::StringもJcodeも不要で、こう書けます。 #!/usr/bin/perl -w use strict; use Encode; use Spreadsheet::WriteExcel; use utf8; # スクリプトはUTF-8 # Create a

    use Encode # or use Jcode 2.00; # please! : 404 Blog Not Found
  • Perl6のClosure : 404 Blog Not Found

    2006年01月10日15:56 カテゴリLightweight Languages Perl6のClosure 用途に関しては書かれ尽くされていてあまりつっこみどころがないので、Perl6のClosureを(再)紹介する。 naoyaのはてなダイアリー - Perl のクロージャ まだ他にもいろいろあると思うので、ツッコミご意見その他、NDOメソッドでお待ちしております。例えば、以下のclosureを考える。 sub mk_prompt{ my $p = shift; return sub { print "$p:", @_, "\n" }; } 使い方はこうだ。 my $todo = mk_prompt( qq[ε(     v ゚ω゚) ] ); $todo->(42); これが、Perl6ではこうなる。 sub mk_prompt($p) { sub { print "$p:",

    Perl6のClosure : 404 Blog Not Found
  • 「解毒」に「消毒」はいかが? : 404 Blog Not Found

    2006年01月10日01:22 カテゴリLogos 「解毒」に「消毒」はいかが? すでにここまでこの話題が進んでいる段階で遅きに逸している感もあるのだけれども。 高木浩光@自宅の日記 最近では、万能な意味で「サニタイズ」を使う人が増えてきた。英単語として のsanitizeは「消毒する」という意味だが、これをわざわざ意味を変えて「無 害化する」と訳す人が目立つようになってきた。その背景には、「入力で対策 することが誤りである」という指摘に対して、「出力で対策することもサニタ イズと呼びたい」という思考が働いているのだろう。 まずは題の前に"sanitize"の意味から。もちろん「あいてぃ〜系日語ジャーゴン」の「サニタイズ」と"sanitize"がもはや違う物を指し示している点を留意した上で。 Definition of sanitize - Merriam-Webster Onlin

    「解毒」に「消毒」はいかが? : 404 Blog Not Found
  • 経済学はじめの一冊 - 書評 - 経済学的思考のセンス : 404 Blog Not Found

    2006年01月08日13:39 カテゴリ書評/画評/品評Money 経済学はじめの一冊 - 書評 - 経済学的思考のセンス ちょっと書評しにくいかも知れない。 経済学的思考のセンス 大竹文雄 しかし、「経済学はじめの一冊」と言われたら、Entry現在ではこのを勧める。 「この一冊」ではなく、「はじめの一冊」である。このを起点に、他のも漁るというのがこのに向いた読み方だと思う。 このは、経済学の視点からは物事はどう見えるのかというのを紹介したであり、特定の問題に対して経済学的に答えを出すというではない。それだけに、実に多くの一見経済学に見えない設問が用意されている。各章と各項のタイトルから、"?"で終わっているものを以下に抜き出してみた。 お金がない人を助けるには? 女性はなぜ、背の高い男性を好むのか? イイ男は結婚しているのか? 美男美女は当に得か? 自然災害に備える

    経済学はじめの一冊 - 書評 - 経済学的思考のセンス : 404 Blog Not Found
  • プログラム言語の意識の差がコードに出るか? : 404 Blog Not Found

    2006年01月06日01:33 カテゴリLightweight Languages プログラム言語の意識の差がコードに出るか? これ見て思い出したのがPerl6のJunction。 [を] プログラマーの意識の差がコードに出るか あと、単純に if (buf[i] == '\r' || buf[i] == '\n') で済みそうなのに、コピペプログラミングの影響か、 if (memcmp(&buf[i], "\r", 1) == 0 || memcmp(&buf[i], "\n", 1) == 0) となっていたそうな。 これ、 if (buf[i] == ("\r" || "\n")) とか書けたらどんなにいいか。Perl6のJunctionはまさにそれを可能にする仕組みで、Perl5までだったら if ( $buf =~ /[\r|\n]$/ ) と正規表現を使ったり、 if ( $

    プログラム言語の意識の差がコードに出るか? : 404 Blog Not Found
  • 追記: UTF-8 vs. ISO-10646 : 404 Blog Not Found

    2005年12月20日14:07 カテゴリiTechLogos 追記: UTF-8 vs. ISO-10646 文字集合(Character Set)と符号化(Encoding)について、より適切な表現と追補すべきネタがあったのでEntry quinta essentia - Character Set vs. Encoding となって、U+7FFFFFFF まで許すという話もあって、ややこしさが増す。符号化(Encoding) は 文字集合(Character Set) の乗りものである こう言えば一目瞭然ですね。 UTF-8という「乗り物」には2^31個の座席があるが、17^2^16個の座席しか今では使わないことになっています。別の「乗り物」であるUTF-16にはそれしか座席が用意できないのがその理由です。 UTF-8Perl 実は、Perlで扱う"utf8"というのは、ISO-1

    追記: UTF-8 vs. ISO-10646 : 404 Blog Not Found
  • 備忘録: Unicode, UCS, and UTF : 404 Blog Not Found

    2005年12月20日11:45 カテゴリiTechLogos 備忘録: Unicode, UCS, and UTF まだ混乱が収まっていらっしゃらないようなので、備忘録を兼ねてここでまとめておきましょう。 電脳社会の日語 加藤 弘一 quinta essentia - del.icio.us買収, Yonahあってるかな? Character Set (文字集合) vs. Encoding (符号化) まずこの二つが別物だということを抑えましょう。UCSというのは名前からわかる通り、Character Set (文字集合)です(とはいえ、Unicode.orgのGlossaryを見ると、符号化の一手段にも見えなくはない)。この段階では、各文字は「背番号」を持っているに過ぎません。狭義の「Unicode」はこの「背番号」を指します。 これをどう実際のデータにするのかがEncoding (

    備忘録: Unicode, UCS, and UTF : 404 Blog Not Found
  • 名称未設定.entry : 404 Blog Not Found

    2005年12月18日19:57 カテゴリLogos 名称未設定.entry そう言い切ってしまうのは、名前の一面しか見ていない証拠だ。 Zopeジャンキー日記 :なぜネットではディレクトリが敗れ、サーチとタグが勝利するのか ネットでディレクトリが敗れ、サーチとタグが勝利するのなら、 1台のPCの中でもそうなるのは時間の問題だという気がする。 言語ゲーム - 無名ファイルシステムファイルは無名であるべきである。名前は単なる識別子ではないことを失念しているのではないか。 言語ゲーム - 無名ファイルシステム そこで、ファイルは無名を基とする。ファイル名の代わりにそれぞれのファイルに重複しないIDを付加し、参照するときはIDを使う。ファイル名とIDの違いは、ファイル名はディレクトリが持つのに対し、IDはファイル自身が持つ。勿論、ファイル名があっても良い。プログラマにはファイル名は非常に便利な

    名称未設定.entry : 404 Blog Not Found
  • HEAD b.hatena.ne.jp : 404 Blog Not Found

    2005年12月09日17:52 カテゴリ一日一行野郎 HEAD b.hatena.ne.jp perl使いならやはりLWP付属のこちらでしょう。 naoyaのはてなダイアリー - w3m -dump_head b.hatena.ne.jp w3m -dump_head b.hatena.ne.jp% HEAD b.hatena.ne.jp 200 OK Connection: close Date: Fri, 09 Dec 2005 08:48:21 GMT Server: Apache/2.0.51 (Fedora) Vary: Accept-Encoding Content-Type: text/html; charset=utf-8 Client-Date: Fri, 09 Dec 2005 08:48:31 GMT Client-Peer: 61.196.246.68:80 Cl

    HEAD b.hatena.ne.jp : 404 Blog Not Found
  • 本棚に王道はないが : 404 Blog Not Found

    2005年11月23日02:57 カテゴリ書評/画評/品評 棚に王道はないが をを、むしろ懐かしい。 ガッキィファイター特注 ロング書棚 理想の書棚とは? 労せず収納した姿が美しいこと。 が取り出しやすいこと。 一般的な書棚より多くのが収まること。 なおかつ、部屋の場所を余分にとらないこと。 書物だけでなく、大型パンフやA4系の複写資料も綺麗に収まること。 安っぽくなく、むしろ高級感があること。 耐震にすぐれていること。 だからと言って値段が高すぎないこと。2万円以下が望ましい。 その書棚に近づくと嬉しい。初めて見たとき感動できればなお良い。 欲しいと思ったらすぐに配達されること。 これとほとんど同じ棚を、現在の住まいに引っ越すまでずっと使っていた。 ただし、幅は750mm。その他の諸元はほぼ一緒だと記憶している。特に特徴的な、裾野の広い「新宿安田ビル」型の形は一緒である。 最初に

    本棚に王道はないが : 404 Blog Not Found
  • ちゃんとUTF-8 flagを処理する : 404 Blog Not Found

    2005年09月30日14:33 カテゴリLightweight Languages ちゃんとUTF-8 flagを処理する ちょ、ちょっとまったぁ。 naoyaのはてなダイアリー - XML::Parser を Hack して utf8 フラグ問題から解放される ちゃんとやりたい方は、 Unicode::RecursiveDowngrade Object::Apply あたりを使いましょう。 これ、「ちゃんとした」方法って言われちゃうとなあ。 Perl 5 Portersのラフコンセンサスとしては、UTF-8 flagの処理のガイドラインは、 文字列としての処理はflagを付けて バイト列としての処理はflagを落として というもので、翻訳すると 内部で扱いはflag付き 外部に出す寸前でflag落とし ということになります。よって「いつflagを落とすか」は、「出力時」というのが望まし

    ちゃんとUTF-8 flagを処理する : 404 Blog Not Found