タグ

2011年10月5日のブックマーク (5件)

  • @IT:基礎解説(管理者必須スキル)

    最新Intelプロセッサ「第2世代Core iシリーズ」は何が変わった? デジタルアドバンテージ 小林 章彦

  • いまさら聞けないHadoopとテキストマイニング入門

    ビッグデータ時代の救世主「Hadoop」とは 「Apache Hadoop」は今、最も注目を集めている技術の1つです。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 Hadoopを活用している企業は年々増え続けていて、不可欠な技術になりつつあるといえるでしょう。 連載では、Hadoopとは何か、Hadoopがどう活用できるのかということを、「テキストマイニング」に焦点を当てて解説していきたいと思います。 重い処理を複数のマシンに分散させる 複数のマシンに処理を分散させるには、プロセス同士の通信、監視、障害時の対応などを考えなければならず、プログラマにとってハードルが高いものです。しかし、Hadoopはそういった面倒くさい処理を一手に引き受けてくれ、プログラマは、やりたい処理だけに集中できます。 例えば、Hadoopを使うと、1

    いまさら聞けないHadoopとテキストマイニング入門
  • Microsoftのビッグデータ投資の成果がいよいよ形に

    CIOたちは膨大な量のデータセット、いわゆるビッグデータから、有益な情報を引き出だしたいと考えている。しかし、多くの企業にとってビッグデータはビッグマネーを意味する。パブリッククラウドプロバイダーは、そうしたビッグデータの夢を現実に一歩近づけてくれるかもしれない。 TバイトあるいはP(ペタ)バイト単位のビッグデータは、一般的にWebサーバログ、販売記録データ、ソーシャルネットワーク、そしてメッセージングデータなどで構成される(参考:読めば分かる! ビッグデータのためのデータウェアハウス(DWH)とは?)。IBMが実施したEssential CIO調査では、インタビューに応じた3000人のCIOのうち、83%のCIOがビジネス分析関連の投資を最優先事項に挙げている。またGartnerによると、2015年までにビッグデータと大容量情報管理技術を導入した企業は未対応の競合企業に対し、あらゆる財務

    Microsoftのビッグデータ投資の成果がいよいよ形に
  • 「ビッグデータ」が注目される理由

    IT業界に新しい流行語がやってきた。「ビッグデータ」である。巨大なデータを、高度なデータマイニング手法によって深く分析し、その結果を活用する。そうすることで、専門家でさえ気づかない事象の変化への対応や、人を介さない意思決定が実現可能になる。ネット企業でなければ難しかったビッグデータの活用は、最近になって一般企業にも可能になってきた。そのためビッグデータの注目度が、一気に上がっている。 ビッグデータの活用は、米グーグルや米フェイスブックといったネット企業にとっては、企業競争力の源泉である。例えばグーグルは2010年6月の学会「ACM Symposium on Cloud Computing(SOCC)2010」で、同社が自社開発した分散バッチ処理基盤「MapReduce」を使って、月間94万6460テラバイト(2010年5月時点)というデータを処理していることを明らかにした。グーグルは毎月、

    「ビッグデータ」が注目される理由
  • ビッグデータ革命

    ペタバイト級の「ビッグデータ」を、機械学習のような高度なデータマイニング手法で分析することによって、従来は不可能だと思われていたことを実現する事例が相次いでいる。それが「ビッグデータ革命」である ビッグデータを収集・分析して、あるパターンやルールを見つけ出す。発見したパターンやルールを使って、現実世界で起きる出来事(イベント)に対する判断を自動で下す。三つの現象は、こうしたビッグデータ技術によって実現したものだ。 ビッグデータ技術は、時には人間を上回る判断力や知性を生み出す。コンピュータ将棋「あから」で使っているBonanzaというプログラムは、過去のプロ棋士による対局の棋譜から自動的にパターンを見つけ出す。膨大な棋譜データを学習することで、盤面でどの手を指すのが最も効果的かを判断する「大局観」を自ら生み出した。結果的に、プロ棋士を負かすほどの実力を身に付けたのだ。 奇跡がコモディティー化

    ビッグデータ革命