Bigdataに関するbislionのブックマーク (3)

  • ビッグデータへの取り組み(2)---戦略的なプロジェクトと位置づけ、小さな失敗であきらめない

    今のビッグデータは、ちょうど2009年、2010年のクラウドに相当する。当時、クラウドについては、非常にポジティブな見方が支配していた。経営者から「なぜクラウドに行かない?」と言われるほどだった。 しかしその後、「データを喪失するかもしれない」「結局安くならない」「検討に時間がかかる」「セキュリティに問題がある」といったネガティブな意見が出てきた。 ビッグデータは、ハイプ・サイクル(技術やサービスに関する期待度と成熟度を表す曲線)では、現在「『過度な期待』のピーク期」に位置する(図)。実は、2009年、2010年ころは、クラウドがここに位置していた。

    ビッグデータへの取り組み(2)---戦略的なプロジェクトと位置づけ、小さな失敗であきらめない
  • オープンソースBI「Pentaho」とは

    Pentahoとは Pentahoは、プロフェッショナル向けに作られたオープンソースのBI(Business Intelligence)ツールです。オープンソースでありながらベンダーによるサポートを受けられるのが大きな特徴です(サポート費用は安価です)。 PentahoはBIスイートであり、レポーティング、インタラクティブ(対話型)分析、ダッシュボード、データ統合/ETL(Extract/Transform/Load)、データ・マイニング、その他、BIプラットフォームとBIに必要なすべての機能が用意されています。 Pentahoはまた、オープンソース・コミュニティによる度重なる開発・再配布によって、先進技術と柔軟性を備えています。大規模なエンタープライズでの利用はもちろん、現場レベルでの簡易分析といった中小規模の導入にも向いています。BIスイートに含まれるすべての機能を利用する使い方のほか

  • いまさら聞けないHadoopとテキストマイニング入門

    ビッグデータ時代の救世主「Hadoop」とは 「Apache Hadoop」は今、最も注目を集めている技術の1つです。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 Hadoopを活用している企業は年々増え続けていて、不可欠な技術になりつつあるといえるでしょう。 連載では、Hadoopとは何か、Hadoopがどう活用できるのかということを、「テキストマイニング」に焦点を当てて解説していきたいと思います。 重い処理を複数のマシンに分散させる 複数のマシンに処理を分散させるには、プロセス同士の通信、監視、障害時の対応などを考えなければならず、プログラマにとってハードルが高いものです。しかし、Hadoopはそういった面倒くさい処理を一手に引き受けてくれ、プログラマは、やりたい処理だけに集中できます。 例えば、Hadoopを使うと、1

    いまさら聞けないHadoopとテキストマイニング入門
  • 1