![http://twitter.com/amamako/status/16118798290](https://cdn-ak-scissors.b.st-hatena.com/image/square/d10cdf314c4bfa54491cfb702a92622f4f26b252/height=288;version=1;width=512/https%3A%2F%2Fpbs.twimg.com%2Fprofile_images%2F985492230541471745%2FDAygaTX6.jpg)
id:ny23 さんが動的ダブル配列を使って Wikipedia のテキスト処理を高速化なんてのを書いている。たぶんこれのエントリを見る前にMapReduce と四身の拳を見た方がコンテクストが分かると思う。Hadoop 使ってなんでもできそう! Hadoop の勉強したい!なんて思っている人は読んでみるとよい。 自分の考えについて書いておくと、自分は誰も彼も Hadoop 使いたがる状況には辟易している。ほとんどの人には不要なはずだし、そもそも Hadoop は(ny23 さんも書かれているが)メモリに乗り切らない大規模データを扱いたいときに効力を発揮するのであって、メモリに乗り切るくらいのサイズであれば、データ構造を工夫したり適切なアルゴリズムを選択した方が遥かによい(id:tsubosaka さんも実験されていたが)。たとえデータが大規模であったとしても、たとえば形態素解析なんかのタ
写真や映像の中から人の顔を自動判別してくれる顔認識アプリ。現在、アイコンなどを使って写真合成が楽しめるが、そんな中、みんなの顔がパンダ”になるというインクリメントの「ぱんだら。」(http://detectface.com/sample/pandara/)が面白いと評判だ。 このサービスは、ユーザーがアップロードした写真を使って、その人の輪郭に合わせた“パンダ顔”に変換できる無料のWebサービス。個人の写真だけでなく、集合写真もOKで、変換した後に写真をダウンロードすることもできる。 「ブログにアップする写真に目線を入れる作業って面倒じゃないでしょうか? 頑張って入れても犯罪者みたいになってしまうし…。どうせなら“パンダ”にしてみませんか? 和み効果もあるかもしれませんよ(笑)」と話してくれたのは、開発担当の鷲巣さん。 そもそも、“顔認識”という固い印象を持ちそうなWebサービスをもっと気
ヤフーが日本独自の検索関連サービスの開発で、オープンソースの分散処理ソフトである「Hadoop」の活用を進めている。Hadoopを使うことで、従来は6時間以上かかった処理がわずか5分半で済むようになった例もある。2009年秋には組織を整備し、適用範囲を全社に広げている。 Hadoopは、米グーグルが開発した分散処理ソフト「Google File System(GFS)」と「MapReduce」を模したオープンソースソフトである(図)。GFSとMapReduceは、グーグルのクラウドを支える基盤技術。Hadoopを使うと、複数台の安価なPCサーバーを連携させ、数十テラ~数ペタバイトに及ぶデ ータを高速に処理できる。 Hadoopを日本国内で最も積極的に利用している企業はヤフーだ。2008年ごろから部署単位でHadoopの導入を進め、Hadoopを使う事例が10件を超えるようになった(表)。
TomatoCart- New Generation Ecommerce PHPで書かれた次世代のショッピングカートシステム「TomatoCart」。 ショッピングカートといえばosCommerceが有名ですが、TomatoCartはosCommerceからブランチしてweb2.0的な仕組みを取り入れたり、ExtJSを導入したりしていて、なかなか便利そうです。 ショッピングカートを実装する必要にかられたときに1つの選択肢として覚えておいてよさそうです。 管理画面がすごくて、Windowsのデスクトップ風UIで超リッチで直感的に使えるものになっています。 アイコンごとに機能が分かれていて、クリックするとアプリケーションが立ち上がるイメージで機能を利用できます。 管理画面のアイコンで立ち上がるアプリケーションっぽいものはExtJSを使って作られていて、使いやすさもなかなかよさそう。 SEOフレ
■ mb_convert_encoding 関数の ISO-2022-JP と JIS の違い mb_convert_encoding() 関数でエンコーディングを指定する際、 ISO-2022-JP と JIS では意味が違うというのはご存知でしょうか? PHP のソースコード (mbfilter_jis.c) を見てみると、 それぞれのエンコーディングが対応する文字種は、次のようになっています。 ISO-2022-JP ASCII JIS X 0201 ラテン文字 JIS X 0208 JIS ASCII JIS X 0201 ラテン文字 JIS X 0201 半角カナ JIS X 0208 JIS X 0212 要するに、JIS は半角カナに対応していますが、ISO-2022-JP は対応していません。 そのため、半角カナのメールを扱うという無茶なことをやりたい時には、 ISO-20
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く