タグ

ブックマーク / dankogai.livedoor.blog (18)

  • Unicode - 似た文字同士にご用心 : 404 Blog Not Found

    2008年05月02日04:00 カテゴリLightweight Languages Unicode - 似た文字同士にご用心 後者はハイフンでなくてマイナス記号でんがな。 [を] UTF-8 の全角ハイフンが Perl の正規表現にマッチしなくて悩んだ で、元のテキストファイルの全角ハイフンを「od -t x1」 で見てみると「ef bc 8d」と「e2 88 92」の2種類が混じっていました。 前者は「\p{Hyphen}」にマッチするのですが後者はダメ。 まあ原因は分かったので、前処理でバイナリ置換して解決しました。 で、紛らわしそうなのを名前のHYPHENとMINUS SIGNでgrepするとこんな感じになる。 egrep '(HYPHEN|MINUS SIGN)' /usr/local/lib/perl5/5.10.0/unicore/Name.pl -002DHYPHEN-MI

    Unicode - 似た文字同士にご用心 : 404 Blog Not Found
  • tmpfsってやっぱ凄げ? : 404 Blog Not Found

    2006年02月18日15:53 カテゴリiTech tmpfsってやっぱ凄げ? コメント&TBありがとうございます。Linuxについては私も知らないので、ついつい「BSD的ジョーシキ」でOSを推し量っちゃう傾向が私にはあるので。 革命の日々! tmpfs は当に容量が動的なのか あと、404 Blog Not Foundさんはわりと惜しい所をついているのだがtmpfsはmallocが使うのと同じしくみをつくうので、mallocと同じ挙動になる。が正しい。 しかし、残りの1%の違いは非常に重要に思えるので、entryを作成した次第。 その後の検索の結果、以下のページを発見。太字は弾による。 dW : Linux : 共通テーマ: アドバンスト・ファイルシステム・インプリメンター・ガイド: 第2回 動的なファイルシステム・サイズ 読者の皆さんは、/mnt/tmpfsにマウントされたtmp

    tmpfsってやっぱ凄げ? : 404 Blog Not Found
  • perl - から未だに目を離せない四つ、あるいはただ一つの理由 : 404 Blog Not Found

    2011年01月31日22:30 カテゴリCultureLightweight Languages perl - から未だに目を離せない四つ、あるいはただ一つの理由 やはりお鉢がまわってきたので。 回答希望。ラクダかわいい以外で。@dankogai さんとか? 「〜今あえてPerlを取る理由というのが個人的には思い浮かばない。生粋のPerl使いならきっと流暢な解答を用意してくれると思う。」 プログラミング言語人気TOP10の簡易解説 http://ht.ly/3NaTkless than a minute ago via HootSuite佐藤 治男 HalSato プログラミング言語人気TOP10の簡易解説用途的にPythonRubyと被るので、今あえてPerlを取る理由というのが個人的には思い浮かばない。生粋のPerl使いならきっと流暢な解答を用意してくれると思う。 ベタ プログラミ

    perl - から未だに目を離せない四つ、あるいはただ一つの理由 : 404 Blog Not Found
  • perl - 短縮URLを一行で展開する : 404 Blog Not Found

    2011年01月03日06:00 カテゴリLightweight Languages perl - 短縮URLを一行で展開する Perlですから。 Schwarze SQ: 短縮URLを展開するRubyスクリプトを作ってみた なにやら短縮URLを使い、不正なサイトにアクセスさせウィルスに感染させる行為が流行っているらしい(まぁ想定の範囲内だが)。そこで、短縮URLを展開できるrubyスクリプトをちょちょっと作ってみた。perl -MLWP::UserAgent -lE \ 'say LWP::UserAgent->new->head(shift)->request->uri' \ http://j.mp/dankogai id:amachangが昔こさえてくれたこの短縮URLもhttp://blog.livedoor.jp/dankogai/と展開されるはずです。 もう少しverboseに

    perl - 短縮URLを一行で展開する : 404 Blog Not Found
  • Mathとハサミは使いよう- 書評 - エレガントな問題解決 : 404 Blog Not Found

    2010年12月27日18:00 カテゴリ書評/画評/品評Math Mathとハサミは使いよう- 書評 - エレガントな問題解決 オライリー矢野様より献御礼。 エレガントな問題解決 Paul Zeitz / 山口文彦・松崎公紀・ 三橋泉・松永多苗子 伊知地宏訳 [原著:The Art and Craft of Problem Solving] これ、ローティーンだった頃の自分に贈りたい。 こんな面白い問題集があったら、今よりもっと数学が好きになっていただろうから。 書「エレガントな問題解決」の原題は"The Art and Craft of Problem Solving"。この Craft という言葉が決め手である。。 目次 O'Reilly Japan - エレガントな問題解決 第1章 このの内容と読み方 1.1 練習と問題 1.2 問題解決の3つの段階 1.3 問題例 1.4

    Mathとハサミは使いよう- 書評 - エレガントな問題解決 : 404 Blog Not Found
  • algorithm - 最近点検索をkd-treeで : 404 Blog Not Found

    2009年04月30日01:00 カテゴリMathLightweight Languages algorithm - 最近点検索をkd-treeで というわけで、kd-treeによる検索も実装してみました。 はてなブックマーク - ototoiのブックマーク データ数が少ない場合、この全検索が高速。ただデータが多くなってくるとkd-treeがいいと思う。点ならば配列をソートするだけで実現できる。 以下のデモでは、単にkd-treeによる検索だけではなく、kd-tree構築の速度と、総当たりの場合の速度の比較もできるようにしてあります。10,000点ぐらいだと、その差を顕著に感じることが出来るでしょう。100,000点ぐらいあると、感動的なほど差が出ます。それだけあってもkd-treeの方はほぼ1ms以内に検索が終わるのですから(ただしこの場合、デモの実行に合計10秒以上かかるので注意!)。

    algorithm - 最近点検索をkd-treeで : 404 Blog Not Found
  • algorithm - correction - 最近点検索 : 404 Blog Not Found

    2009年04月29日07:45 カテゴリMathアルゴリズム百選 algorithm - correction - 最近点検索 これ、「素直な解答」の方が間違っている。 404 Blog Not Found:algorithm - 最近点検索 ぬじゃらだーさんのコメント このアルゴリズムって点が原点から等距離に分布している場合はまったく働かないですよね。 その通り。その一方で、「近い順にソート」は合っている。しかしこれだとO(n log n)。 TSさんのコメント もとの最近点探索の問題を解くには、点集合Pのボロノイ図データを作っておいて問い合わせに答えるのが正攻法ではないでしょうか これだと確かに高速。点がすべて格子点上にある場合(たとえばビットマップ)、ボロノイ図があらかじめ用意してある場合はO(1)で判定できる。たとえば各格子点にあらかじめどの点が一番近いかを記録しておき、それを読

    algorithm - correction - 最近点検索 : 404 Blog Not Found
  • algorithm - 最近点検索 : 404 Blog Not Found

    2009年04月28日23:30 カテゴリMathLightweight Languages algorithm - 最近点検索 後のデザートにちょうどよいサイズの問題。 二次元の値(x, y)をもつ集合P から任意の点p の近似点を検索するアルゴリズムを考えています 高速、低負荷で検索するにはどうしたらいいでしょうか? 条件は次の通りです .. - 人力検索はてな 条件は次の通りです 集合Pはあらかじめ、任意の順番でソートしておける 点pの近似点にする条件は、margin範囲内で一番近いものとするが、margin値はそのときどきで変わる まずは素直に答えを。 点集合は、あらかじめ原点からの距離順にソートしておく。 その集合を、検索したい点の原点からの距離を使って二分探索(binary search)する。 二分探索は exact match でなくてもいいので、この方法でOKです。O(

    algorithm - 最近点検索 : 404 Blog Not Found
  • tips - zfs raidz修復の実際 : 404 Blog Not Found

    2009年04月17日03:00 カテゴリTips tips - zfs raidz修復の実際 というわけで、zfs導入以来初の「当」のディスク破損&修復のレポートです。 導入に関しては、以下を参照してください。 404 Blog Not Found:雨降って地固まり、geom mirrorが壊れてZFSを導入する 気がついたきっかけは、ディスク操作が遅くなったこと。 おや?と思ってdmesgを見てみると、こんな状態に。 ad8: TIMEOUT - READ_DMA48 retrying (1 retry left) LBA=802513599 ad8: TIMEOUT - READ_DMA48 retrying (0 retries left) LBA=802513599 ad8: FAILURE - READ_DMA48 timed out LBA=802513599 で、zpoo

    tips - zfs raidz修復の実際 : 404 Blog Not Found
  • バイナリとテキストの本当の違い : 404 Blog Not Found

    2009年04月09日00:15 カテゴリLightweight LanguagesCode バイナリとテキストの当の違い うーむ、Wikipediaですら「見た目」の違いしか説明していない。 バイナリ - Wikipedia コンピュータが扱うすべてのデータはバイナリデータ(バイトの並び)であり、プレーンテキスト(または単にテキスト)もバイナリデータの一種ではあるが、通常バイナリとテキストは対比して用いられる。テキストとはデータの内容すべてを人間が読んで理解できる (human-readable) 表現形式を指し、バイナリとはそうでない表現形式を指すことが多い。 Binary file - Wikipedia, the free encyclopediaA binary file (.bin) is a computer file which may contain any type

    バイナリとテキストの本当の違い : 404 Blog Not Found
  • tips - svnメイン、でもgithubでも公開したい場合の最小手順 : 404 Blog Not Found

    2009年04月02日03:30 カテゴリTips tips - svnメイン、でもgithubでも公開したい場合の最小手順 というわけで、遅ればせながらgithubはじめました。 dankogai's Profile - GitHub のですが、正直どうもgitにはとっつけない。RCS → CVS → subversion というのは、コマンド体系も互換性が高い正常進化でとっつきやすかったのですが、gitはそもそも考え方からして違うということも大きいかと思います。 というわけで、とりあえずひきつづき subversion をメインに使いつつ、githubでも公開したい場合どうしたらいいのかという備忘録を。 gitクライアントの入手 入手は以下から。 Git - Fast Version Control System 私はOS Xのバイナリを素直にインストールしました。インストールすると

    tips - svnメイン、でもgithubでも公開したい場合の最小手順 : 404 Blog Not Found
  • Ajax - perlを実行するAPI : 404 Blog Not Found

    2009年03月10日22:00 カテゴリLightweight Languages Ajax - perlを実行するAPI つくっちゃいました。 「404 Blog Not Found:Ajax - Lightweight Languages を実行するAPI」に置き換えられました。 まずはこれをご覧ください。 use strict; use warnings; use YAML::Syck; use Data::Dumper; my $n=1; print "DATA[",$n++,"]:$_" for <DATA>; print Dumper(\%INC); print YAML::Syck::Dump(\%INC); use Test::More 'no_plan'; is(1,1); is(1,0); __DATA__ use this instead of STDIN like

    Ajax - perlを実行するAPI : 404 Blog Not Found
  • javascript - でデータを圧縮/伸張する : 404 Blog Not Found

    2009年03月02日09:00 カテゴリLightweight Languages javascript - でデータを圧縮/伸張する これでもまだ税率が高かったので。 404 Blog Not Found:javascript - Yet Another Base64 transcoder Base64の利点は、なんといっても「固定税率」、それも比較的「税率が低い」ことにあります。Paddingなしなら、3バイトが4バイトにencodeされるので、33%ということになります。これに対してencodeURIComponentの税率は、UTF-8基準で最高で3倍、UTF-16基準で最高で4.5倍にも達します。 ついに負の税率、すなわち税還付を実現しました! まずはデモを。 Inflated + Base64-Decoded (Original): chars / bytes Deflate

    javascript - でデータを圧縮/伸張する : 404 Blog Not Found
  • かたをつけたいよね。この5つ : 404 Blog Not Found

    2009年01月02日16:00 カテゴリArt かたをつけたいよね。この5つ その0 気をつければ気をつけるほど、かたをつけるのが遅れます。 気をつけたいよね。この5つ 〜年のはじめに〜 - Chikirinの日記 というわけで、具体的な対策を。 年をとればとるほど、若い人をたたきたくなります。 勉強会に顔を出してみましょう。 「勉強」会って呼び名がイケてませんが、名前はどうでもいい。 ITに限ってもこんなにあります。 IT 勉強会カレンダー 若い人をたたいている暇なんかありませんよ。 何かに詳しくなればなるほど、その分野での新しい動きやアイデアに否定的になります。 実際に自分でもやってみましょう。 それでよりよい対案を思いつけばなおよし。実際にうまく行けばまた一つ賢くなります。 しかも、これ、新しいアイディアだけじゃないんですよ。 結婚だの子育てだの、大昔からあることですら、やってみな

    かたをつけたいよね。この5つ : 404 Blog Not Found
  • 404 Blog Not Found:2008年のお年玉で買うべき本10冊

    2008年01月01日04:30 カテゴリ書評/画評/品評 2008年のお年玉で買うべき10冊 あけまして、おめでとうございます。 お正月といえば、お年玉。 貰う立場の人も、あげる立場の人も、そのお年玉で何を買ったらいいのかというのをずうずうしくも提案するという企画のEntryです。 ここでは、一度買ったら一生ものとして読めるを慎重に選んでいます。ですから、「404 Blog Not Found:2008年の仕事始めまでに読んでおきたいビジネス書x10」のように、読む順番にこだわる必要はありません。何なら積読だって構いません。ただし、一度手に入れたら、引っ越しても手放さないでくださいね。何度も何度も読み返すことに、意味があるなのですから。 あと、「お年玉」ということで、値段にもある程度気を遣いました。一口に「一冊」といっても「書評 - オックスフォード・サイエンス・ガイド」だったら一

    404 Blog Not Found:2008年のお年玉で買うべき本10冊
  • [これはひどい]の無駄使い - タグに関する一考察 : 404 Blog Not Found

    2007年10月17日11:15 カテゴリArt [これはひどい]の無駄使い - タグに関する一考察 以下に関しては同意だが、 はてブのタグとニコニコ動画のタグの違い - ナレッジ!?情報共有・・・永遠の課題への挑戦 [ITmedia オルタナティブ・ブログ] おなじタギングという仕組みなのに、違うのだ。 以下に関する私の印象は90度異なる。180度でなくて。 はてブをはじめとするソーシャルブックマークを使うときのタグは自分自身の為につけるのに対し、ニコニコ動画をはじめとする画像共有系のシステムの場合はタグも他人の為につけているような節が見えるのだ。 まず、はてブことはてなブックマークの場合。 確かに、個々のタグは自分自身のために付けられる。私のセルクマ(セルフブックマーク)に必ず付けている[dankogai][小飼弾]もその例外ではない。ちなみに私が自分以外の記事をブックマークするときに

    [これはひどい]の無駄使い - タグに関する一考察 : 404 Blog Not Found
  • 404 Blog Not Found:まずは議論[に]しよう - 書評 - 議論のルールブック

    2007年10月20日14:30 カテゴリ書評/画評/品評 まずは議論[に]しよう - 書評 - 議論のルールブック というわけで、早速入手。 初出2007.10.19 追記2007.10.20:新潮社後藤さんより日献到着。ありがとうございます。久しぶりにだぶってしまった 議論のルールブック 岩田宗之 たけくまメモ : 『議論のルールブック』が出た!昨年「たけくまメモ」で紹介した、岩田宗之(iwatam)さんの傑作コンテンツ「議論のしかた」が、徹底改稿を経て『議論のルールブック』として新潮社からになりました!書「議論のルールブック」は、「Webのロングセラー」、 議論のしかた を大幅加筆訂正して一冊に仕上げたもの。 目次 - 岩田宗之『議論のルールブック』|新潮社より まえがき 議論の破壊者たち 感情論に振り回されない 感情論とは何か / 言葉は伝わらなくて当たり前 / 感情論を避

    404 Blog Not Found:まずは議論[に]しよう - 書評 - 議論のルールブック
  • 四万はてブ記念 - はてブロングテイル論 : 404 Blog Not Found

    2007年03月12日21:45 カテゴリBlogosphere 四万はてブ記念 - はてブロングテイル論 blogは昨日四万はてブを突破しました。ご愛読ありがとうございます。 はてなの被ブックマーク数が10,000突破しました | *LOVE IS DESIGN* まだ上には上がいる!日19時現在、blogは合計2022回ぶくマされ、ぶくマ数の合計は40,291でした。1記事当たりの平均ブクマ数は19.9ということになります。 y = 888.72x-1.3077 R2 = 0.8756 しかし、この場合平均というのはあまり当てになりません。x軸に記事あたりのぶくマ数、y軸ブクマ数ごとのentry数をプロットすると、右のとおりとなります。見事なロングテールです。相関係数0.87というのはむちゃ高い。 他のblogに関しても、だいたいこのロングテールの相関が成り立ちました。R2の値は

  • 1