タグ

2015年4月10日のブックマーク (2件)

  • mots quotidiens.

    前に日記で書いた, 自己組織化二分探索木であるSplay Treeは struct splay { splay *left; splay *right; void *item; }; というデータ構造を持っているため, データ構造へのポインタのきっかり3倍の 記憶容量を必要とする。 順番は多くの場合関係ないので, こうした動的なデータ構造には来ハッシュを 使えばいいはず だが, 普通のハッシュでは不要なメモリが沢山確保される可能性があるため, スプレー木を使っていた。 ハッシュテーブルが1つなら大した問題ではないですが, テーブル自体が何万個も あったりすると, そのロスは膨大なものになります。 最近, 開発環境をCからC++に変えたため(理由はそのうち), Googleの提供している Memory-efficientな Google Sparse Hash が使えるようになったので,

    sassano
    sassano 2015/04/10
  • 「Amazon Machine Learning」発表。クラウドで機械学習サービスを提供

    Amazonクラウドはクラウド上で機械学習を提供するサービス「Amazon Machine Learning」を発表しました。 これはAmazon社内でデータサイエンティスト達が使っているのと同じものと説明されており、既存のデータ群から適切な機械学習モデルを作りだし(データからパターンを学習し)、そのモデルを新しいデータに適用して予測などを行っていくというもの。 高いスケーラビリティで日々何十億もの予測を行う能力を備え、リアルタイムに予測を生成できるとされています。 簡単に学習させられ、大規模処理も可能 Amazon Machine Learningのページでは、特長として5つの要素が示されています。 1つ目は、既存データをAmazon S3やRedshift、Amazon RDSなどから簡単に読み込んで学習させることができること。2つ目は、数秒でモデルを作成し、予測までできること。 3つ

    「Amazon Machine Learning」発表。クラウドで機械学習サービスを提供