タグ

2009年5月14日のブックマーク (4件)

  • RubyでHadoopをラップ、分散処理ツールキットが登場 - @IT

    2009/05/12 米新聞社大手のニューヨーク・タイムズは5月11日、Rubyによる大規模分散処理のツールキット「Map/Reduce Toolkit」(MRToolkit)をGPLv3の下にオープンソースで公開したと発表した。MRToolkitは、すでに稼働しているクラスタ上のHadoopと合わせて使うことでRubyで容易にMap/Reduce処理を記述することができる一種のラッパー。処理自体はHadoopが行う。すでにHadoopを使っているユーザーであれば、中小規模のプロジェクトに対して、すぐにMRToolkitを適用可能としている。 デフォルトで有用なMap、Reduceの処理モジュールが含まれていて、数行のRubyスクリプトを書くだけで、例えば膨大なApacheのログからIPアドレス別の閲覧履歴をまとめるといった処理が可能という。独自にMapやReduceの処理を定義することも

    nazoking
    nazoking 2009/05/14
  • きまぐれ日記: 「読めてしまう」コピペがなぜ読めてしまうのか

    http://www.asks.jp/users/hiro/59059.html http://www.itmedia.co.jp/news/articles/0905/08/news021.html 最初読んだとき、違和感なく読めてしまったのですが、よくよく見てみると、そんなトリックがあったのですね。 さて、この「読めてしまう」がなぜよめてしまうのでしょうか? 人間の言語モデルの単語パープレキシティは、約100ぐらいであると言われています。どういうことかというと、 人間が文章を読んでいるときに、次の単語を過去の文章から推測するのは 1/100 程度の 確率で正解するということです。 件のコピペですが、最初の文字は変わらないので、その正解率は平仮名の数(52)倍になります。 すなわち、52/100 =~ 0.5 実際には、最後の文字も変わらないし、 単語の長さが変わらないというもの、大きな

    nazoking
    nazoking 2009/05/14
    人間の言語モデルの単語パープレキシティは、約100ぐらいであると言われています。
  • 「住宅都市整理公団」別棟 : 「自分探し禁止!」大森〜大井町ワークショップ

    2009年05月13日01:32 カテゴリワークショップ 「自分探し禁止!」大森〜大井町ワークショップTweet 【第2回、第3回の開催が決定しました】 ---- カルカル名義で行ったワークショップ、すごかったです。なにがすごいって、参加者のみなさんの開眼っぷりが。開眼というか、もともとそういう気のある人が参加しただけという可能性もぬぐいきれないけれど。 今回のワークショップ、「ワークショップ」とは銘打ちましたが写真の技法には一切何も触れていません。というか、写真技法なんてぼくが教えてもらいたいわ。 そうじゃなくて、「しつこく同じものを見続けると自分の中で不思議なことが起こる」境地にカメラというツールを使うことでてっとりばやく到達して、その感覚を共有したい、という趣旨。つまり、ぼくがデイリーポータルZでやっているようなことをみんなにもやってもらいたかった、ということ。 みんなに撮る「モノ」

    nazoking
    nazoking 2009/05/14
    「バケツ」っていうものがどういうものかなんて自明だと思っているものだけど、たかだか2時間撮り続けただけで「そもそもバケツとは?」っていう思わぬ形而上の悩みに落ち込むわけですよ。
  • SSDだとOracleは速い? サンの技術者がベンチ公表 - @IT

    2009/05/12 既存データベースサーバのハードディスクをSSDに置き換えた場合、どの程度パフォーマンスが向上するのか? この問いへの回答の1つとなり得るベンチマークテストを、“MrBenchmark”を名乗るサン・マイクロシステムズのチーフ・エンジニアのBenoit Chaffanjon氏が5月11日付けのブログで公開している。 ベンチマークは2種類。1つはオンメモリで処理が完了するもの、もう1つはキャッシュメモリに乗り切らずにドライブ(HDD/SSD)へのアクセスが発生するもの。テストに用いたサーバのコンフィギュレーションは以下の通り。 Solaris 10 Update 6 Oracle 10.2.0.2 Java 1.7 build 38 SLAMD 1.8.2、iGenOLTP Sun Blade X6270(Xeon X5560@2.8GHz×2、DDR3 32GB) In

    nazoking
    nazoking 2009/05/14