2016年9月4日のブックマーク (5件)

  • Project Voldemort

    Voldemort is a distributed key-value storage system Data is automatically replicated over multiple servers. Data is automatically partitioned so each server contains only a subset of the total data Provides tunable consistency (strict quorum or eventual consistency) Server failure is handled transparently Pluggable Storage Engines -- BDB-JE, MySQL, Read-Only Pluggable serialization -- Protocol Buf

    RabbitBit
    RabbitBit 2016/09/04
    名前を呼んではいけない例のあの人。ではなく、オープンソースのKey-Value Store。知らなかったな。
  • データ分析用ライブラリ MADlib を使って PostgreSQL で機械学習する

    MADlibは、現代的なデータ分析には欠かせない回帰分析やデータマイニングのアルゴリズムが実装されているオープンソースのライブラリです。 MADlibを導入することによって、これらのアルゴリズムをPostgreSQLのユーザ定義関数の形で使うことのでき、データベースサーバの内部でデータ分析の処理できるようになります。 今回は、このMADlibの導入方法から動作確認、ロジスティック回帰分析における簡単な使い方までをご紹介します。 ■MADlibとは何か MADlibは、もともとはGreenplumというPostgreSQLをベースにしたMPP製品(DWH用RDBMS)を開発していた企業が開発していたライブラリで、Greenplumで利用できるように開発されていたものでした。 2015年9月に、Greenplum(を買収したEMC)がMADlib(や他のソフトウェア類)をApache Foun

    データ分析用ライブラリ MADlib を使って PostgreSQL で機械学習する
    RabbitBit
    RabbitBit 2016/09/04
    Apache MADlibとは? DB内で定番の機械学習が完結するのはスバラだなぁ。そして、データ分析界隈の定番DBと言えばPostgreSQLなのだねぇ。
  • なぜ国内でPerlが急速に萎んだのか

    2005年 Railsの襲来2005年に突如現れたRailsによって国内でRuby利用者が急増したのがPerl滅亡への第一歩となった。書きやすさに作者がとことんこだわって作られたRubyの魅力を一度知ってしまうとPerlの古くさく読み辛く書き辛い文法に誰もがうんざりし始める。 2007年 JavaScriptブームAjaxで再発見されたJavaScriptのブームもPerl終焉に若干ながら貢献している。ブラウザというPerlが全く手を出せないジャンルの王者JavaScriptの持つ華やかさに誰もが憧れ、そして手元のPerlの古くささに反吐が出始める。不器用で不細工なところも含めて愛していた女房とつつましく送っていた人生に、突然ぴちぴちのボイン女子大生が転がり込んで来たようなものである。 スマホ/ソーシャルゲームバブルiPhone市場が格的に立ち上がり、Perlとは全くの無関係であるスマホ

    なぜ国内でPerlが急速に萎んだのか
    RabbitBit
    RabbitBit 2016/09/04
    2013年時点でPerlはオワコン宣言されているのに、2016年現在でdata scientistの必須スキルセットとされているの、震えが止まらない。
  • データウェアハウス vs データマート - International Blog

    Teradata Magazine Japan Special Edition online データウェアハウスやアナリティクスの最新情報はこちら データウェアハウスがなくても明細データは持てるのでは? その通りです。データウェアハウスの価値の源泉の「ひとつ」は明細データを持つことにある、と考えられますが、明細データを持つこと自体は、直接データウェアハウスを持つ理由にはなりません。 しかし、なぜデータウェアハウスを語る文脈で、わざわざ明細データのことを強調するのかといいますと、データを保有するコストを考えると、明細データはデータウェアハウスに統合して保有するのがいいからです。 データを保有するコストというのは主に、(1)データを格納する器(ハードウェア)のコスト、(2)データをロードしてデータベースを維持・運用するためのコスト、の 2つがあります。 ストレージ装置の価格が安くなったといって

    RabbitBit
    RabbitBit 2016/09/04
  • China’s Baidu to open-source its deep learning AI platform - SiliconANGLE

    The Chinese Internet giant Baidu Inc. has been making big progress in applying deep learning neural networks to improve image recognition, language translation, search ranking and click prediction in advertising. Now, it’s going to give a lot of it away. The company, often called “China’s Google,” will announce Thursday at the annual Baidu World conference in Beijing that it’s offering the artific

    China’s Baidu to open-source its deep learning AI platform - SiliconANGLE
    RabbitBit
    RabbitBit 2016/09/04
    企業はコアコンピタンスな自社製品をOpenSource化しない。インフラで競争的優位に立つのは難しくて、その上に乗っているものこそなんだな。