タグ

ブックマーク / dankogai.livedoor.blog (14)

  • Unicode - 似た文字同士にご用心 : 404 Blog Not Found

    2008年05月02日04:00 カテゴリLightweight Languages Unicode - 似た文字同士にご用心 後者はハイフンでなくてマイナス記号でんがな。 [を] UTF-8 の全角ハイフンが Perl の正規表現にマッチしなくて悩んだ で、元のテキストファイルの全角ハイフンを「od -t x1」 で見てみると「ef bc 8d」と「e2 88 92」の2種類が混じっていました。 前者は「\p{Hyphen}」にマッチするのですが後者はダメ。 まあ原因は分かったので、前処理でバイナリ置換して解決しました。 で、紛らわしそうなのを名前のHYPHENとMINUS SIGNでgrepするとこんな感じになる。 egrep '(HYPHEN|MINUS SIGN)' /usr/local/lib/perl5/5.10.0/unicore/Name.pl -002DHYPHEN-MI

    Unicode - 似た文字同士にご用心 : 404 Blog Not Found
    sigwyg
    sigwyg 2013/12/27
    全角ハイフンの変換
  • perl - 文字参照を(en|de)codeする : 404 Blog Not Found

    2008年05月11日21:00 カテゴリLightweight LanguagesTips perl - 文字参照を(en|de)codeする すでに正解が書かれていますが、 [を] Unicode の16進数の実体参照を正規表現などで元に戻す pack と Encode::decode を使うと良いみたい。 はてなブックマーク - miyagawaのブックマーク / 2008年05月11日 それ HTML::Entities::decode / regexp でも chr(hex($1)) のほうがわかりやすくないかな 繰り返しておくだけの価値はあるので。 HTML::Entitiesを使う まず、HTML::Entitiesのdecode_entities()を使うという方法があります。これがベストプラクティスかな。 #!/usr/local/bin/perl use strict;

    perl - 文字参照を(en|de)codeする : 404 Blog Not Found
    sigwyg
    sigwyg 2011/11/30
    TwitterのRSSをデコードするのに役だった。
  • 消費税は三重に逆進的である : 404 Blog Not Found

    2010年06月20日11:00 カテゴリTaxpayer 消費税は三重に逆進的である 世代間格差を憂ているはずの大竹先生がこの論文を出したのは皮肉としかいいようがないが… 消費税は逆進的ではない - 池田信夫 : アゴラ 実証的にも、この推定は確かめられています。大竹文雄氏と小原美紀氏によれば、次の図のように(所得が最高の)10分位の消費税の生涯所得に対する負担率は4.05%であるのに対して、第1分位の負担率は1.59%。消費税は、かなり強く累進的なのです。 それでもやはり消費税は逆進的である。 同論文の「消費税は逆進的である」という点に関して最も重要なのは、以下の仮定である。 例をあげて説明してみよう。世の中に、全く同じ所得水準の人しかいなかったとする。20歳から60歳まで、年収が500万円、60歳以降は年金所得が200万円で80歳まで生きるとしよう。人々は、生涯同じレ

    sigwyg
    sigwyg 2010/06/21
    「ストックを無視してフローの話をしていることだ。フローだけ見ているから、高資産で低所得な高齢者に低資産で「高所得」な現役世代が貢ぐ羽目になるのだ。」
  • regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found

    2009年03月09日00:30 カテゴリLightweight LanguagesTips regexp - ^$でなくて\A\zを使おう まずは回答から。 正規表現で「制御文字以外」のチェック - ockeghem(徳丸浩)の日記 文字エンコーディングの妥当姓 制御文字(\x00〜\x1f, \x7f)のチェック 文字列長のチェック このうち後ろ二つを正規表現として書くにはどうすればいいかを考えていました。 こういう時には、「全文字がOKならOK」と考えるのではなく、「一文字でもNGならNG」と考えると楽になります。それは「スペースと非制御文字以外」なのですから、/[^ \S]/が求めていた正規表現で、=~ではなく!~が使うべき演算子ということになります。全角スペースもOKにしたければ、/[^ \x{3000}\S]/。[追記参照] [Run via Codepad] #!perl -

    regexp - ^$でなくて\A\zを使おう : 404 Blog Not Found
    sigwyg
    sigwyg 2009/03/09
    常にmsを付ける
  • perl - open my $fh, "comand |"; # はモダンじゃない : 404 Blog Not Found

    2009年02月10日01:00 カテゴリLightweight Languages perl - open my $fh, "comand |"; # はモダンじゃない モダンPerl入門 牧大輔 「モダンPerl入門」発売記念ということで、同書を補足するentryを。 同書でちょっと残念だったのが、[5.2 外部コマンドの実行]。あまりモダンではないのだ。 P. 141 system("/sbin/wget", "http://example.com"); これはいいのだが、以下がちょっとまずい。 my $output = `/bin/ls tmp`; open(my $fh, '| cat -v'); これ、何がまずいか、というと、コマンド実行の際に/bin/shを使ってしまうのだ。そのおかげでcommand < from > to 2&>1のようなリダイレクトも使えるなどの利点もあ

    perl - open my $fh, "comand |"; # はモダンじゃない : 404 Blog Not Found
    sigwyg
    sigwyg 2009/02/10
    shellを経由しないのがモダン? → 「書き込むときには'-|',読み込むときには'|-'」
  • Google AnalyticsのAnalysis、そして滞在時間のウソ : 404 Blog Not Found

    2007年03月11日17:00 カテゴリiTech Google AnalyticsのAnalysis、そして滞在時間のウソ 簡単で奇麗で便利なGoogle Analyticsですが、閲覧時間に関しては信用しない方が賢明です。 あとで読む いつまでたっても あとで読む - FIFTH EDITION これ見ればわかりますが、9割以上のアクセスが、10秒以内で、うちのサイトを離脱しているわけです。(10秒しか閲覧してない) そのことを示す前に、Google Analyticsがどんな仕組みで動いているのかを見てみましょう。 Google Analyticsに加入すると、解析したいサイトに、以下のJavaScript Codeを埋め込むよう言われます。 <script src="http://www.google-analytics.com/urchin.js" type="text/jav

    Google AnalyticsのAnalysis、そして滞在時間のウソ : 404 Blog Not Found
    sigwyg
    sigwyg 2009/02/05
    断さんのGoogle Analytics解説。とっかかりに
  • 惰訳 - Barack Obama's acceptance speech in full : 404 Blog Not Found

    2008年11月05日21:00 カテゴリNews翻訳/紹介 惰訳 - Barack Obama's acceptance speech in full 私はCNNで観たのだけど、同時通訳を殺して観たので、から「日語マダー」要求が。 Barack Obama's acceptance speech in full | Comment is free | guardian.co.uk というわけで以下に。 なお、原文も少し直してあります。たとえば"Victory belongs to you"が繰り返されているところなど。 Dan the Translator If there is anyone out there who still doubts that America is a place where all things are possible; who still wond

    惰訳 - Barack Obama's acceptance speech in full : 404 Blog Not Found
    sigwyg
    sigwyg 2008/11/06
    オバマの当選演説。これは名演ではないだろうか
  • 日本はヤバくても、東京はヤバくないかも : 404 Blog Not Found

    2008年03月10日12:45 カテゴリTaxpayerMoney 日はヤバくても、東京はヤバくないかも 世界中どこでも生きていく自信がある私が、なぜよりにもよって日に住んでいるか。 我ながら謎というのかわかっていても言語化できないという感じだったのだが、これでクリアーになった。 日でしか生きていけないと将来破滅するリスクがあるので、世界中どこでも生きていける戦略のご紹介 - 分裂勘違い君劇場 いまや日よりも豊かな国や都市がどんどん生まれつつあります。 日などよりも、はるかに先行きの明るい国や都市がたくさんあります。 今住んでいるのが、東京だから、だ。 日はヤバいとニュースは言う。先進国の下位だと統計は言う。 しかし、東京に住んでいると、その実感は薄い。 薄いどころか、32階の窓から一望すると、「これのどこが衰退する経済だ」と裏切られた思いになる。 しかし、東京を「日という

    日本はヤバくても、東京はヤバくないかも : 404 Blog Not Found
    sigwyg
    sigwyg 2008/03/10
    日本の将来は楽観できないが、東京の将来は割りとマシ
  • 404 Blog Not Found:プログラマーでなくても名前ぐらい覚えておきたいアルゴリズムx10

    2007年11月26日18:15 カテゴリMathLightweight Languages プログラマーでなくても名前ぐらい覚えておきたいアルゴリズムx10 ぎくっ あなたが一番好きなアルゴリズムを教えてください。 また、その理由やどんな点が好きなのかも教えてください。 - 人力検索はてな なぜぎくってしているかというと、実はすでにアルゴリズムの発注を受けているからなのだ。いつまでも伏せておくのもなんなので、ここにえいやっとdiscloseしてしまうことにする。 アルゴリズム大募集! C&R研究所 - トップページ その下書きもかねて、そこでも紹介しないわけに行かないメジャーなアルゴリズムをとりあえず10個紹介しておくことにする。 ユークリッドの互除法(Euclidean algorithm) その昔(数百年ほど前)は「アルゴリズム」といえば、「手順一般」を指すのではなく、この「互除法

    404 Blog Not Found:プログラマーでなくても名前ぐらい覚えておきたいアルゴリズムx10
    sigwyg
    sigwyg 2007/11/26
    アルゴリズムその2。これまたとりびあ~ん
  • 404 Blog Not Found:怠翻 - JavaScriptでありがちな9つのシマッタ

    2007年08月17日01:15 カテゴリ翻訳/紹介Lightweight Languages 怠翻 - JavaScriptでありがちな9つのシマッタ 私自身結構シマッタしちゃうので。 Nine Javascript Gotchas 尻カンマ注意 以下のコードはFireFoxでは動きますが、Internet Explorer (以下IE)では問題になります。 var theObj = { city : "Boston", state : "MA", } 最後にカンマが入らないよう注意しましょう。 浮気なthisは何を見てるやら 以下のコードで、thisは何を指しているでしょうか。 <input type="button" value="Gotcha!" id="MyButton" > <script> var MyObject = function () { this.alertMess

    404 Blog Not Found:怠翻 - JavaScriptでありがちな9つのシマッタ
  • 404 Blog Not Found:IPアドレスはいつ枯渇してもおかしくない

    2007年06月10日04:30 カテゴリiTech IPアドレスはいつ枯渇してもおかしくない かつてクラスC(/24)を一人で持っていたオレがきましたよ。その頃は128kbpsの接続に月30万はらってたけど(爆)。 池田信夫 blog IPアドレスは枯渇していない コメントで教えてもらったが、総務省はIPアドレスの「枯渇対策会議」を今月中に立ち上げるそうだ。アドレスの配分を検討するのはいいが、それが枯渇するという事実認識は間違いである。IPv4のアドレスは約43億個、全世界のユーザー(約11億人)ひとり当たり4個もある。これに対して、現在のホスト数は約4億3000万なので、アドレスはまだ1割しか使われていないのだ。 池田先生、ちょっとこれはひどすぎ。 ホスト数 < 必要なIPアドレス数 まず、なぜ「たった一割」しかIPアドレスが使われていないのに、ネットワーク屋さんたちがそわそわしている

    404 Blog Not Found:IPアドレスはいつ枯渇してもおかしくない
    sigwyg
    sigwyg 2007/06/11
    池田さんのエントリ『IPアドレスは枯渇していない』に対する反論
  • 404 Blog Not Found:javascript - 勝手に添削 - JavaScript入門

    2007年04月12日23:30 カテゴリLightweight Languages javascript - 勝手に添削 - JavaScript入門 釈迦に説法を承知で。 IT戦記 - 社内勉強会資料 amachang - JavaScript 入門Object.prototype = { /* ... */ }は避けるべし みにくいのでオブジェクトを入れ替える方式に Box.prototype = { speed: 4, move: function() { this.left += this.speed; this.element.style.left = this.left + 'px'; if (this.left > 400) clearInterval(this.id); }, start: function() { var self = this; this.id = s

    404 Blog Not Found:javascript - 勝手に添削 - JavaScript入門
    sigwyg
    sigwyg 2007/04/13
    弾さんのJS添削。Object.prototype直書きは避けること。withは使うな。無名関数を利用しよう。
  • 404 Blog Not Found

    2017年07月20日09:00 カテゴリVALU If you can't beat them, join them. 君子は豹変す ⇔ 豹変しなけりゃ君子じゃない。続きを読む dankogai コメント( 1 ) 2017年03月19日16:30 カテゴリevalparkOpen Source evalpark - Swift入園しました というわけでおしらせです。続きを読む dankogai コメント( 0 )トラックバック( 0 ) 2017年03月17日10:30 カテゴリevalparkOpen Source ようこそevalparkへ え?もう番ですか…? Welcome to Evalpark! 続きを読む dankogai コメント( 0 )トラックバック( 0 ) 2015年12月03日19:30 カテゴリMath 「「0÷0=」を実行すると「エラー」になる理由」を見

    404 Blog Not Found
    sigwyg
    sigwyg 2006/12/19
    プログラマの小飼弾さん
  • プログラマーを目指す女の子はなぜ増えないか? : 404 Blog Not Found

    2006年11月24日17:00 カテゴリCulture プログラマーを目指す女の子はなぜ増えないか? これ、特にプログラマーの世界では顕著である。 Say::So? - 理系(特に物理系や工学部)を目指す女の子はなぜ増えないか 大学での区分として、医療生物化学系に偏りが見られるのは、親の反対と女性が少ないことにあると思いますが、物理系ではなぜか理学部に行く人が多い(物理系の八割がた)というのがあります。このあたりがなぜなのかはよくわかりません。日で理学部を持っている女子大はお茶の水女子大と奈良女子大だけですが、工学部をもっている女子大はありませんから、特に工学系を女性が避ける理由が何かあるのかもしれません。まぁ工具使えても機械がわかってもきっともてないからだろうけど。理由を考察する前に、プログラマーとしての能力に男女差があるかをまず押さえておきたい。 これは、自信を持って「ない」と答え

    プログラマーを目指す女の子はなぜ増えないか? : 404 Blog Not Found
    sigwyg
    sigwyg 2006/11/26
    PG永遠のテーマ
  • 1