タグ

Hadoopに関するcreaismのブックマーク (3)

  • ビッグデータブームを支えたHadoop、そしてNoSQL

    セキュリティアラート - phpMyAdminの脆弱性を狙った攻撃に要注意! MySQL管理者にはおなじみの管理ツール「phpMyAdmin」の脆弱性を狙った攻撃が12月に入ってから急増しています。ラックが注意喚起のアラートを出しています。phpMyAdminのふるいバージョンを使っている場合、外部からの任意のアクセスコードが実行可能になりやすいとのこと。 対策としては、まずphpMyAdminバージョン3.3.10.2または3.4.3.1以上へのアップグレード(最新バージョンは3.4.8)を実行を推奨します。phpMyAdminは外部からアクセス可能な状態にする必要がないので、できれば外部に対して公開しないか、アクセス可能にするならApacheのアクセス制限機能を使ってアクセス制限を行うようにしてください。 あの"象"第2版が電子書籍でも購入可能に 先週の週報で谷川チーフが「今年のIT

    ビッグデータブームを支えたHadoop、そしてNoSQL
  • 分散リアルタイムデータベース「SenseiDB」がオープンソースで公開。LinkedInのインフラとして開発

    テキストなど非構造化データのデータベース機能とサーチエンジン機能を兼ね備えた分散リアルタイムデータベース「SenseiDB」が、オープンソースとして公開されています。 SenseiDBとは先生DBの意味らしく、「Sensei (先生) means teacher or professor in Japanese」と説明があり、ロゴにも「師」の文字が使われています。なぜ先生なのか、その意味について以下のように説明があるのですが…… This name indicates that the system can be used in place of Oracle database in many applications. この名前が示しているのは、このシステムが多くのアプリケーションにおいてOracleデータベースで使われているところで利用可能だということです。 TeacherやProfe

    分散リアルタイムデータベース「SenseiDB」がオープンソースで公開。LinkedInのインフラとして開発
  • いまさら聞けないHadoopとテキストマイニング入門

    ビッグデータ時代の救世主「Hadoop」とは 「Apache Hadoop」は今、最も注目を集めている技術の1つです。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 Hadoopを活用している企業は年々増え続けていて、不可欠な技術になりつつあるといえるでしょう。 連載では、Hadoopとは何か、Hadoopがどう活用できるのかということを、「テキストマイニング」に焦点を当てて解説していきたいと思います。 重い処理を複数のマシンに分散させる 複数のマシンに処理を分散させるには、プロセス同士の通信、監視、障害時の対応などを考えなければならず、プログラマにとってハードルが高いものです。しかし、Hadoopはそういった面倒くさい処理を一手に引き受けてくれ、プログラマは、やりたい処理だけに集中できます。 例えば、Hadoopを使うと、1

    いまさら聞けないHadoopとテキストマイニング入門
  • 1