タグ

ブックマーク / naoya-2.hatenadiary.org (6)

  • Web::Scraper - naoyaのはてなダイアリー

    Today I've been thinking about what to talk in YAPC::EU (and OSCON if they're short of Perl talks, I'm not sure), and came up with a few hours of hacking with web-content scraping module using Domain Specific Languages. 使ってみたよ! #!/usr/local/bin/perl use strict; use warnings; use FindBin::libs; use URI; use Web::Scraper; use Encode; use List::MoreUtils qw/uniq/; my $links = scraper { process 'a.key

    Web::Scraper - naoyaのはてなダイアリー
  • Emacs ブーム来たり - naoyaのはてなダイアリー

    新人プログラマが3人入社したのが引き金になって、なぜかいまになってはてな社内で Emacs ブームが訪れています。id:higepon も質問したりなんかしているようです。社内グループの掲示板にはemacs について語ろう!スレなんかが立って、それぞれ秘蔵のマクロや設定を書き込んで盛り上がってます。 もともと僕が入社した当時は、社内には Emacs を使っている社員はいませんでした。PerlEmacs (あるいは vim あたり) で開発するのが当然だと思っていたので最初はちょっと驚いたのですが、id:jkondo を含めそのほかの社員はそれぞれおき入りのエディタのマクロをごりごりにカスタマイズして、自分たちなりの方法でやっているようでした。 特に id:jkondo は、プログラムに関してはほとんど知識がない状態で「これからはインターネットだ!」と叫んで人力検索を作るために一直線だ

    Emacs ブーム来たり - naoyaのはてなダイアリー
    takuya5455
    takuya5455 2009/08/19
    もともと僕が入社した当時は、社内には Emacs を使っている社員はいませんでした。Perl は Emacs (あるいは vim あたり) で開発するのが当然だと思っていたので最初はちょっと驚いたのですが、id:jkondo を含めそのほかの社員は
  • Google を支える技術 - naoyaのはてなダイアリー

    Google を支える技術 を読みました。 Google のバックエンドで動いている各種分散処理システムに関しては Google 自身から論文がいくつも発表されています。それらの論文をはじめとする比較的最近の情報ソースをベースに、ある程度かみ砕いて要所要所を紹介するという内容でした。加えて著者の西田圭介さんは OpenCobol (COBOL を C 言語に変換しコンパイルする gcc のフロントエンド) を開発された、技術的なバックグラウンドがしっかりしている方であるようで、内容は信頼できると思います。 自分はこれまで Google のバックエンドの各種ソフトウェアについては方々で耳にしていましたが、漠然と何をするものか程度のことしか知りませんでした。 Web 検索の基的な仕組みと それにまつわる Google が直面した問題、特に大規模処理 それを支えるために開発された各種ソフトウェ

    Google を支える技術 - naoyaのはてなダイアリー
    takuya5455
    takuya5455 2009/08/10
    GFS、MapReduce や BigTable がどのような意図を持って開発され、どのような用途に使われているかというのがよく分かりました。 Google の各インフラの要素技術それぞれは、確かに凄いのですが、難しすぎて何をやっているかよ
  • MapReduce - naoyaのはてなダイアリー

    "MapReduce" は Google のバックエンドで利用されている並列計算システムです。検索エンジンのインデックス作成をはじめとする、大規模な入力データに対するバッチ処理を想定して作られたシステムです。 MapReduce の面白いところは、map() と reduce() という二つの関数の組み合わせを定義するだけで、大規模データに対する様々な計算問題を解決することができる点です。 MapReduce の計算モデル map() にはその計算問題のデータとしての key-value ペアが次々に渡ってきます。map() では key-value 値のペアを異なる複数の key-value ペアに変換します。reduce() には、map() で作った key-value ペアを同一の key で束ねたものが順番に渡ってきます。その key-values ペアを任意の形式に変換すること

    MapReduce - naoyaのはてなダイアリー
    takuya5455
    takuya5455 2009/08/10
    MapReduce の全体像を見たとき一つ分かるのは、MapReduce は大規模データを、多数のデータに分割してストリームのようにみせかけ分散処理するためのシステムであるという点です。巨大なデータでも MapReduce のアーキテクチャ
  • はてなブックマーク棚卸し - naoyaのはてなダイアリー

    大晦日です。みなさんいかがおすごしでしょうか。 僕ははなブックマークの棚卸し(?)をしてます。今年一年かけてブックマークしたものを順番に見て行ってます。見るといっても、全部の記事を開いて見るわけではなく、流し読みで、「ああ、これはもう一回読んでおきたい」と思ったものを開いてはインプットしているという感じです。ようやく 6 月 20 日まで来ました。先は長い。 僕はブックマークするときに必ずコメントをつけて、サマリとか感想とかを書くようにしてるのですが、一から順番に見て行くにあたって、コメントをつけるようにしてて良かったなあと改めて思いました。感想やサマリを手がかりに読み進めていくと、飛ばし読みしやすい。 もう一回読もうと思って開いてるのは、技術ネタが多いです。ブックマークした CPAN モジュールでなんかもうすっかり忘れてたやつとか、面白そうと思ってブックマークして結局試さないでたツールと

    はてなブックマーク棚卸し - naoyaのはてなダイアリー
    takuya5455
    takuya5455 2009/05/12
    僕はブックマークするときに必ずコメントをつけて、サマリとか感想とかを書くようにしてるのですが、一から順番に見て行くにあたって、コメントをつけるようにしてて良かったなあと改めて思いました。感想やサマリを
  • シリコンバレーから将棋を観る - naoyaのはてなダイアリー

    「シリコンバレーから将棋を観る」を読んだ。 はてなのオフィスが京都に移ってから一年以上が経った。はてなの米国オフィスが閉じてからシリコンバレーに行く機会は一度もなかったし、京都は東京よりも更にシリコンバレーには遠いこともあって、梅田さんと対面で話す機会は一頃に比べると少なくなった。そのためか、これまでの梅田さんのを読むときとは少し違って、著者とのある程度の距離感と緊張を感じながら読み進めることになった。 書名どおりテーマは「将棋」だ。私は将棋は小中学生の頃に少し遊んだぐらいで、ほとんど素人だ。だから、梅田さんが将棋を執筆されたと最初に聞いたとき、これまでとは違って、自分は読者対象から外れるのだろうか? などと思ったりもした。とは言え「梅田望夫が"シリコンバレーから"を書名に冠した」というだけでも、自分にとって購入するのに十分な動機はあった。 まえがきと第一章とを読んで「なるほど」と思

    シリコンバレーから将棋を観る - naoyaのはてなダイアリー
    takuya5455
    takuya5455 2009/04/30
    ここからは、『ウェブ時代5つの定理』で梅田さんが繰り返し説いていた「不確実な未来に対応するには学び続ける意思が必要」という金言が想い出される。
  • 1