タグ

ブックマーク / blog.bulknews.net (7)

  • Amazon MP3 のすごさをもっと知るべき: blog.bulknews.net

    Amazon MP3 のすごさをもっと知るべき Amazon MP3 がすごい。iTunes Store もいいが、Amazon MP3 が出てからはめっきり iTS で買うことが少なくなった。DRM がないから PC, Mac, iPod とコピーしたり SlimServer ごしに会社から家のライブラリに聞いたり、会社の IM/IRC で」このアルバムいいよ」って同僚におしえて iTunes share で共有したりが簡単にできる。月に 5-6枚のペースでアルバム買ってる。 私的録音補償金を縮小しつつ DRM でコピー管理、とか言ってる国の人は5年は遅れてる(の上、間違った方向に進んでいる)ことをはやく自覚してもらいたい。 Amazon MP3 はすべてのアルバムを 1曲$.99、アルバム単位では $8.99-9.99 から、256kbps の MP3 DRM なしで販売している。Wi

  • ブログの画像からカメラ携帯の機種を調べてみる: blog.bulknews.net コメント欄

    ブログの画像からカメラ携帯の機種を調べてみる 某チャンネルで「ブログにのってる写真のEXIFをみれば使ってる携帯機種わかるね」という感じで盛り上がったので、さくっとスクリプトかいてみました。 What cameraphone do they use? (bookmarklet) 仕組みは単純で、ブログに埋め込まれている JPEG ファイルを探して、EXIF データがあればその Model, Make をみてメーカー・機種名を出しています。アメブロなどの芸能人サイトでやると結構面白い結果が。 若槻千夏: DoCoMo SH903i インリンオブジョイトイ: DoCoMo SH903i 徳澤直子: KDDI-SN W42S 押切もえ: DoCoMo SH904i しょこたん: DoCoMo SH902i という感じで、やっぱりドコモのSHシリーズが人気ありますね。押切もえはソニーエリクソンのキ

  • 日本の総理大臣の演説をタグクラウド化: blog.bulknews.net

    の総理大臣の演説をタグクラウド化 US Presidential Speeches Tag Cloud が面白かったので日の総理大臣版を3分ハッキング。コード自体は15分くらいでかけたんだけどデバッグやらデータの解析やらに時間がかかってトータルでは2時間くらいか。 Japanese Prime Minister Speeches Tag Cloud 首相官邸ホームページ からリンクをたどって HTMLをダウンロード、HTML::TreeBuilder で as_text して Text::MeCab にわせ、名詞(代名詞などをのぞく)の頻度を YAML データとしてつっこみ、HTML::TagCloud でタグクラウド化しました。スライダーの JS などは元の US Presidential のほとんどパクリです。 IE だと行間がかなりつまってるのは HTML::TagCloud

    sirouto2
    sirouto2 2006/11/06
  • HTML::Selector::XPath をリリース: blog.bulknews.net

    HTML::Selector::XPath をリリース CSS Selector in Perl とか subtech - Bulknews::Subtech - CSS selector to XPath あたりで議論していた CSS 2 Selectors to XPath コンパイラなモジュールをつくって、CPAN に HTML::Selector::XPath としてリリースしました。 使い方は naoya さんが先に書いてますが、HTML から正規表現を使うことなくスクレイプするのに便利。たとえば Mixi にログインしてマイミク最新日記と、1件目のタイトル、文を抜き出すコードが、以下のようにかけます。 #!/usr/bin/perl use strict; use warnings; use utf8; use Encode; use HTML::Selector::XPat

  • Plagger をリリース: blog.bulknews.net

    Plagger をリリース Plagger - Pluggable RSS/Atom aggregator の 0.5.0 を CPAN にリリースしました。 Plagger は Bloglines to Gmail な Hack の進化したもので、すべてをプラグインで実装できるようにしたソフトウェアです。Blog ソフトウェアの Blosxom とか SMTP サーバの qpsmtpd とかを知ってる方は、それの RSS アグリゲータ版と思っていただけると話が早い。 Bloglines からとってきて Gmail に HTML メールを送る、というのに限らず、RSS をとってきてそれを加工して何かのフォーマットで書き出す、というのはよくやるハックだなあと思っていました。自分の例でも、 * Bloglines -> Gmail * Bloglines -> iPod * RSS -> Au

  • 学校では教えてくれないエンジニアリング英語 #1: blog.bulknews.net

    学校では教えてくれないエンジニアリング英語 #1 ソフトウェアエンジニアリングの現場で使うような英語って、たまにクセがあったりしてわかりにくかったりすることってありますよね。年に半分程度US出張も含めて外資系で1年半やってきた経験から、エンジニアの日常会話で使う英語を解説していくシリーズを不定期連載してみようかとおもいました。 よく海外在住の日人ブロガーの方が同じような企画やってますが、エンジニアリングに直結したのは少ないかなとおもったので。あと当然ですが、僕はネイティブじゃなく、業務やら日常会話やらで覚えてきた内容をもとに書いているので間違いがあれば指摘は歓迎です。 第1回の今日は、記号の読み方。最初、結構とまどったんですよね。 "-" "-" をなんと読むか。日人だとハイフンが多いでしょうか。アメリカ英語では、"dash (ダッシュ)" と読みます。"minus (マイナス)" で

  • Rabin Karp アルゴリズムでコード重複の検出 blog.bulknews.net

    Rabin Karp アルゴリズムでコード重複の検出 YAPC::NA で会った Fotango の Norman Nunley がつくってる Algorithm::RabinKarp モジュールが面白げです。 Rabin Karp 文字列探索アルゴリズム (wikipedia) を使って文字列のハッシュ(ダイジェスト)をチェックし、同一の値を示す部分を重複しているとみなしてレポートしてくれます。つまり、プロジェクト内のコードのコピーペーストを検出するツールとして使えるというわけ。 ためしに Plagger で試してみた結果は rabin.txt のようになりました。プラグインの register_hook や CustomFeed での Feed オブジェクトの生成など、イディオム的に使う部分が大半になってしまっていますが、いくつか実際コピペで再利用しているコードが検出できています。 c

  • 1