タグ

ブックマーク / blog.bulknews.net (12)

  • Web::Scraper プレゼン@YAPC::EU: blog.bulknews.net

    Web::Scraper プレゼン@YAPC::EU YAPC::Europe でウィーンにきています。1日目の夕方に Web::Scraper のプレゼンをしました。 時間が20分なのに前半に時間をかけすぎて尻きれトンボになってしまいましたが、いろいろフィードバックをもらえたのでよかったです。 ウィーンを観光する時間はとれなそうですが、ドナウ川の周りを散歩してみて、古い建物が見事に街中にとけこんでいて、道路も広いしいろんなものが美しい街です。まわりがテラドイツ語で1人で店とかに入ると大変ですが、また機会があったらきてみたいですねえ。

  • CPAN::Mini で CPAN のミラーをローカルに: blog.bulknews.net

    CPAN::Mini で CPAN のミラーをローカルに DECON で話してきたネタですがちょっと詳しく。 飛行機やら電車の中やらでオフラインハックするときに(たまに)問題になるのが CPAN モジュールの不足です。「あぁ、このマシンにはあのモジュール入ってねぇ~」とかでハックが滞るのは萎えます。というわけで minicpan。CPAN::Mini というモジュールで、CPAN モジュールの最新版だけを持ってきてミラーをつくることができます。 導入は簡単で、CPAN から install CPAN::Mini すると minicpan というコマンドが付属してきます。コマンドラインから使うには、 > minicpan -r http://ftp.funet.fi/pub/languages/perl/CPAN/ -l ~/minicpan とかすれば finet から HTTP で同期で

  • Rabin Karp アルゴリズムでコード重複の検出 blog.bulknews.net

    Rabin Karp アルゴリズムでコード重複の検出 YAPC::NA で会った Fotango の Norman Nunley がつくってる Algorithm::RabinKarp モジュールが面白げです。 Rabin Karp 文字列探索アルゴリズム (wikipedia) を使って文字列のハッシュ(ダイジェスト)をチェックし、同一の値を示す部分を重複しているとみなしてレポートしてくれます。つまり、プロジェクト内のコードのコピーペーストを検出するツールとして使えるというわけ。 ためしに Plagger で試してみた結果は rabin.txt のようになりました。プラグインの register_hook や CustomFeed での Feed オブジェクトの生成など、イディオム的に使う部分が大半になってしまっていますが、いくつか実際コピペで再利用しているコードが検出できています。 c

  • ソースコード検索の ack がよさげな件: blog.bulknews.net

    ソースコード検索の ack がよさげな件 #catalyst でちょっと話題になっていた ack をいれてみた。CPAN シェルから install App::Ack とするだけ。 基的には grep -r | grep -v .svn | grep -v \~ に飽きてしまった人むけのソースコード検索ツールです。gonzui などとは違いインデックスはつくらないでそのままディレクトリをトラバースして検索するので、あまり大規模だと時間がかかるかもしれませんが、中規模なプロジェクトなら問題なくいけるのでは。 デフォルトで CVS, RCS, .svn, blib といったバージョン管理ディレクトリを無視、-i, -v といった grep 由来のコマンドラインや、 --perlperl ソースコードだけ検索、となかなか気が利いています。デフォルトのカラーリングもイケテル。 grep -

  • Plagger をリリース: blog.bulknews.net

    Plagger をリリース Plagger - Pluggable RSS/Atom aggregator の 0.5.0 を CPAN にリリースしました。 Plagger は Bloglines to Gmail な Hack の進化したもので、すべてをプラグインで実装できるようにしたソフトウェアです。Blog ソフトウェアの Blosxom とか SMTP サーバの qpsmtpd とかを知ってる方は、それの RSS アグリゲータ版と思っていただけると話が早い。 Bloglines からとってきて Gmail に HTML メールを送る、というのに限らず、RSS をとってきてそれを加工して何かのフォーマットで書き出す、というのはよくやるハックだなあと思っていました。自分の例でも、 * Bloglines -> Gmail * Bloglines -> iPod * RSS -> Au

    kaz_goto
    kaz_goto 2006/02/19
    Pluggable RSS/Atom aggregator
  • XMLRPC::Lite (SOAP::Lite) で base64 エンコーディングさせない: blog.bulknews.net

    XMLRPC::Lite (SOAP::Lite) で base64 エンコーディングさせない 404 Blog Not Found:はてなキーワード連想語API vs. XMLRPC::Lite そうなのです。XMLRPC::Liteは、Non-ASCIIな文字列はbase64でおくっておったのですね。 以下のようにすれば base64 しないでそのまま string として送るようになります。ローカルハックは必要なし。 my $res = XMLRPC::Lite->new->proxy('http://d.hatena.ne.jp/xmlrpc') ->call('hatena.getSimilarWord', { wordlist => [ XMLRPC::Data->type(string => "はてな") ] } ); "はてな" の部分は utf-8 bytes でも Un

    kaz_goto
    kaz_goto 2006/02/16
    はてなキーワード連想語APIの利用
  • iTunes & PSP Hack: PSP から iTunes ライブラリを RSS チャネルで聴く: blog.bulknews.net

    iTunes & PSP Hack: PSP から iTunes ライブラリを RSS チャネルで聴く PSP のファームウェア 2.60 では RSS チャネル(いわゆる Podcast) をサポートしていますが、Podcast はストリーム経由で聴くことしかできません(メモリースティックにダウンロードできない)。最初はイケてない仕様だなあと思ったのですが、1つこれをうまく使いこなす方法を思いついたのが、せきむらさんの PSP から iTunes ライブラリを聴くというアイデア でした。 せきむらさんのハックは Windows に Apache2 をいれて手で RSS 2.0 をつくっていますが、これを自動でやりたい、しかもスマートプレイリストとかもサポートしたい、ということでこの正月ハックしていたのが Trickster 2.0 プロジェクト の svn につっこんである itunes

  • Google Desktop Search SDK: blog.bulknews.net

    Google Desktop Search SDK SDK Overview The Google Desktop Search SDK empowers software developers to integrate GDS into their own applications. Google Desktop Search が正式版としてリリース。プラグイン開発のための SDK もついてます。C# やら VB なんかで、COM を利用してプラグインを登録していけるしくみになっているようですね。すでにプラグインレジストリのページにはいくつか登録されています。 Google Desktop Search: Download Plug-ins Welcome to the Google Desktop Search Plug-in Download page. Google has not

  • colinux with SVK: blog.bulknews.net

    colinux with SVK 最近開発をノートPC (ThinkPad X40) 上でやるようになってきてます。 といっても、Win32 で Apache と ActivePerl、なんてのではなくて、coLinux という "Windows 内で動く Linux" を使っています。昔からある VMWare のようなものと考えてもらえれば OK。 coLinuxのメモ - coLinuxのインストール あたりを参考に、Debian の入ったファイルシステムをダウンロードして、apt-get dist-upgrade してごにょごにょやれば、あっという間に Linux 環境が手に入ります。Windows からは Putty などの SSH を利用して接続すれば、普通の Linux サーバと同じ感覚で使えて便利。最初はブリッジ接続でつかっていたのですが、ホテルなどにいくたび IP を変更す

    kaz_goto
    kaz_goto 2005/12/30
    Subversion のリポジトリをローカルにミラーしたりできるとか
  • use encoding 'utf-8' & encoding::warnings: blog.bulknews.net

    use encoding 'utf-8' & encoding::warnings Perl ネタ。 XML まわりなんかを扱うときについて回る UTF-8 フラグ (Unicode フラグ)をどう落とすか的ネタがもりあがっていますねぇ。このネタは拙書の Blog Hacks でも 1 Hack さいて解説してあります。 Blog Hacks ―プロが教えるテクニック&ツール100選posted with amazlet on 05.09.30宮川 達彦 伊藤 直也 オライリー・ジャパン (2004/08/07) 売り上げランキング: 20,714 Amazon.co.jp で詳細を見る たしかに内部的に UTF-8 フラグを落としてバリバリつなげちゃえば、場当たり的に楽は楽なんだけど、内部的に Unicode フラグをもったまま処理して、最後に出力するときに落とす(encode する)と

    kaz_goto
    kaz_goto 2005/12/30
    UTF-8 フラグ (Unicode フラグ)をどう落とすか
  • Web 2.0 時代の TOEIC 900点超え英語勉強法 9ヶ条: blog.bulknews.net

    Web 2.0 時代の TOEIC 900点超え英語勉強法 9ヶ条 と、はてブで人気エントリになりそうなタイトル をつけてみましたが。 こないだ 10/23 に TOEIC ってやつを受けてみたんです。ちょうど外資系でマジメに仕事として英語を使うようになって10ヶ月、ある程度できるようになったなという印象はあったんですが、客観的に評価できる数字がほしいなぁと。 結果は、970点 (Listening: 495 / Reading: 475) というなかなか想像を超える数字でした。 受けた感じである程度の手ごたえはあったんですが、Listening 満点というのは結構驚きでした。思えば1年前までアメリカ行ったことない(そもそもパスポート持ってない)状態で、1年弱でここまで来たとも言えるわけです。せっかくなので、ここに至るまでの僕の英語勉強法を Tips 的にまとめてみます。 (R = Rea

  • RightFields - Turn your MT into Google Base!: blog.bulknews.net

    RightFields - Turn your MT into Google Base! ご存知の方もいるかとは思いますが、このエントリは San Francisco からポストしています。が、この Blog はずっと日で書いていて、もちろんこれからも帰国したときは JST で書くことになるため、Blog のタイムゾーンは JST にしてあります。 というわけで、同じ Blog でも海外からポストすると時刻がおかしなことになります。すべて UTC 表記にしちゃえばまぁいいといえばいいですが、それもなんだかな気がします。エントリごとに timezone を設定できるようなプラグインないかなぁと思って Brad Choate に聞いて教えてもらったのが、 「直接そういうのはないんだけど、RightFields 使えば似たようなことはできるかもね」 ということでした。 前置きが長くなりましたが

  • 1