タグ

2012年1月5日のブックマーク (2件)

  • いまさら聞けないHadoopとテキストマイニング入門

    ビッグデータ時代の救世主「Hadoop」とは 「Apache Hadoop」は今、最も注目を集めている技術の1つです。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 Hadoopを活用している企業は年々増え続けていて、不可欠な技術になりつつあるといえるでしょう。 連載では、Hadoopとは何か、Hadoopがどう活用できるのかということを、「テキストマイニング」に焦点を当てて解説していきたいと思います。 重い処理を複数のマシンに分散させる 複数のマシンに処理を分散させるには、プロセス同士の通信、監視、障害時の対応などを考えなければならず、プログラマにとってハードルが高いものです。しかし、Hadoopはそういった面倒くさい処理を一手に引き受けてくれ、プログラマは、やりたい処理だけに集中できます。 例えば、Hadoopを使うと、1

    いまさら聞けないHadoopとテキストマイニング入門
  • Product Empresario: (フィクション)ハーバード大学図書館、朝4時の風景

    <追記です 2012/01/08 19:15> まず初めに。この記事は中国で流行った情報を和訳したものです。 ですので、以下を読んでいただく方はそのことを念頭において読んでいただければ幸いでございます。 タイトル(キャッチコピー)や写真、20の教訓はネットで拾ってきたものを和訳してそのまま使用しております。 今回この記事をアップした際に、自分はそのことを知らずに事実であるかのように公開してしまいました。 現在はアップした文章の原型をとどめるために、極力削除などせずに残しております。 この記事を通してご被害を被った皆様、ご迷惑をおかけした皆様に心よりお詫び申し上げます。 また貴重なお時間を使ってわざわざコメントを下さった皆様に感謝しております。 <ここまで追記> ハーバード大学図書館、朝4時の風景 これをみてみんなどう思うだろうか? ハーバードの図書館には20の教訓があり、学生達は日々これを

    Product Empresario: (フィクション)ハーバード大学図書館、朝4時の風景