[B! machinelearning] s1251のブックマーク

s1251 id:s1251

machinelearningに関するs1251のブックマーク (25)

Private Presentation
Private content!This content has been marked as private by the uploader.
s1251 2014/11/02
bayes

API

広島

ML

機械学習

edit

comment

すごい合同勉強会

machinelearning

blog
リンク
杜氏のいない蔵元が示した「データ分析さえすれば職人の技を職人抜きでも再現できる」という事実の凄み（追記あり） - 渋谷駅前で働くデータサイエンティストのブログ
先日、とあるコンサルの社長さんとお酒を飲みながらお話していて出てきた話題が「畢竟データ分析って何の役に立つんだろう？」というものだったんですが、そこで僕が思い出して紹介したのが「獺祭」で世界進出を成功させている旭酒造のエピソードだったのでした。ということで、その事例を振り返りながら久しぶりにちょっと与太話でもしようと思います。 http://www.tv-tokyo.co.jp/cambria/backnumber/20140116.html ちなみに上ははてブでも大きな話題を呼んだ東洋経済の特集記事ですが、僕にとってはテレ東カンブリア宮殿で紹介された時の映像の方が遥かに衝撃的でした。「獺祭」は杜氏でも何でもない普通の社員が、データに基づいて一挙手一投足を決めながら仕込んでいる東洋経済の記事では割とざっくりとしか書かれてないんですが、カンブリア宮殿で放映された映像では獺祭の製造工程の
s1251 2014/10/31
CM

drink

ビジネス

machinelearning

technology

データ分析

データ

science

data

2014年
リンク
実装が簡単で高性能な線形識別器、AdaGrad+RDAの解説 - EchizenBlog-Zwei
機械学習では、データがどのクラスに属するかを識別するという問題が基本的です。この識別問題は線形識別器というモデルを使うことで解くことができます。この記事では、実装が簡単で高性能な線形識別器、AdaGrad+RDAの解説を行います。 AdaGrad+RDAの詳細な解説は以下の論文を参考にしてください。 http://www.magicbroom.info/Papers/DuchiHaSi10.pdf こちらはAdaGrad+RDAの実装例です。 http://d.hatena.ne.jp/echizen_tm/20140726/1406376207 識別問題は、通常データを2つのクラスに分類します。どうやって分類するかというと、線形識別器が正の値を返したか、負の値を返したかでクラスを分けます。具体的には、線形識別器は以下の形式をしています。 y = Σ(x_i * w_i) データを表
s1251 2014/09/15
MachineLearning

adagrad

機械学習
リンク
Deep learning実装の基礎と実践
2. ⾃自⼰己紹介 l 得居誠也 (Seiya Tokui) l Preferred Networks リサーチャー l Jubatus のアルゴリズム開発 – Jubatus: NTTとPFIで共同開発しているオープンソースの分散リアルタイム機械学習基盤 http://jubat.us/ l 現在は映像解析とディープラーニングの研究開発に従事 2 3. ニューラルネットの基礎、実装、実験について話します l ニューラルネットの道具 – 全体の構成、⾏行行列列による表現、損失関数、誤差逆伝播、SGD l 主要な実装 – Pylearn2, Torch7, Caffe, Cuda-‐‑‒convnet2 l フレームワークの基本的な設計 – テンソルデータ、レイヤー、ネット、最適化ルーチン – アーキテクチャの記述⽅方法（宣⾔言的、スクリプティング） l 実験の進め⽅方
s1251 2014/08/27
deep learning

machinelearning

research

学び

機械学習

実践的

GPU

jubatus
リンク
機械学習を初めて勉強する人におすすめの入門書 - old school magic
概要私が機械学習の勉強を始めた頃、何から手を付ければ良いのかよく分からず、とても悩んだ覚えがあります。同じような悩みを抱えている方の参考になればと思い、自分が勉強していった方法を記事にしたいと思います。目標としては、機械学習全般について、コンパクトなイメージを持てるようになることです。そのためにも、簡単な本から始めて、少しずつ難しい本に挑戦して行きましょう。入門書何はともあれ、まずは機械学習のイメージを掴むことが大切です。最初の一冊には、フリーソフトでつくる音声認識システムがおすすめします。フリーソフトでつくる音声認識システム - パターン認識・機械学習の初歩から対話システムまで作者: 荒木雅弘出版社/メーカー: 森北出版発売日: 2007/10/17メディア: 単行本（ソフトカバー）購入: 45人クリック: 519回この商品を含むブログ (38件) を見るレビュー :
s1251 2014/08/17
book

勉強

数学

MLPR

アルゴリズム

機械学習

統計

machinelearning

本

書籍
リンク
機械学習とは何か？ – 機械学習の定義と使える言い回し | POSTD
この記事で、取り上げたいのは「機械学習って何？」ということです。機械学習に興味がある人なら、少しはその内容について、かじったことがあるでしょう。ですが友人や同僚に機械学習の話をふると、誰かに「機械学習って何？」と質問されるリスクがあることを覚えておいてください。この記事の目指すところは、機械学習について考えるための定義、それも覚えやすい気の利いた言い回しをいくつか提案することです。まずは、この分野で信頼のおける教本から機械学習のスタンダードな定義について触れるところから始めましょう。それから機械学習についてのプログラマ的な定義をはっきりさせ、最終的には、「機械学習って何？」と聞かれても、いつでも答えられるようになるのが目標です。信頼できる定義それでは最初に、一般的に大学の講義レベルで、よく使われている機械学習の教本4冊から見ていきましょう。信頼できる定義であり、この問題を熟考
s1251 2014/07/17
hackernews

開発

機械学習

machinelearning

プログラミング
リンク
http://blog.yoslab.com/entry/2014/07/04/072734
s1251 2014/07/07
hadoop

machinelearning

recommendation

ebook

機械学習

情報推薦
リンク
大規模データのマイニング - 共立出版
ウェブやインターネットコマースの隆盛によって、とてつもなく巨大なデータセットが出現し、そして、データマイニングによってそれらから情報が抽出されている。巨大なデータに対するマイニングにおいては、従来から知られているアルゴリズムがそのままでは機能しないことが多い。巨大なデータを扱う上でこれまでとは違った処理戦略や技法が必要となる。本書はデータマイニングにおいて重要な問題の解決に使われてきており、さらに巨大なデータセットに対しても使用できる実用的なアルゴリズムを、データベースやウェブ技術の分野で著名な原著者が解説する。まず、データマイニングの本質や、データマイニングがどのように扱われているかを概観する。次に、今後非常に大量のデータの解析を行う際に、クラウドコンピューティングとともに重要視されると考えられ、この後の章の議論に必須のものとなるマップレデュースを解説する。その後、類似するアイテム
s1251 2014/07/01
book

minhash

stream

machinelearning

PageRank

ir

MapReduce

data_mining

analytics

ml
リンク
異常検出の最新動向 | Hadoop Times
ポニーの群れからシマウマを探す By エレン·フリードマン（MapR Techno logies ビッグデータ・コンサルタント Apache Mahoutコミッター）オライリー社の実践機械学習シリーズの第2弾、テッド・ダニング氏との共著「異常検出の最新」が今週発行されました。以前の著作ではレコメンデーションに対する実践的なアプローチを取り上げ、皆さんが「ポニーが必要である」と考えるというところから始めました。第2弾では、ポニーの群れにいるシマウマ、群れの動きに逆らって泳ぐ魚のような稀に起こりうる異常値の発見について考えます。今回の目的は、どのように実践的な機械学習システムを構築すれば異常を発見できるか探ることです。このシリーズの目標は、実際の現場で必要とされる作業を考慮して問題解決を探っていくことです。なぜ異常検出を使うのでしょうか? この手法への需要は広がり成長し続けています。異常検出
s1251 2014/06/19
hadoop

MapR

machinelearning

apache

book

機械学習

電子書籍
リンク
機械学習アルゴリズムへの招待 | POSTD
機械学習の問題については以前に紹介したので、次はどんなデータを収集し、どんな機械学習アルゴリズムを使うことができるのかを見ていきましょう。本投稿では、現在よく使用されている代表的なアルゴリズムを紹介します。代表的なアルゴリズムを知ることで、どんな技法が使えるかという全体的なイメージもきっとつかめてくるはずですよ。アルゴリズムには多くの種類があります。難しいのは、技法にも分類があり拡張性があるため、規範的なアルゴリズムを構成するものが何なのか判別するのが難しいということですね。ここでは、実際の現場でも目にする機会の多いアルゴリズムを例にとって、それらを検討して分類する2つの方法をご紹介したいと思います。まず1つ目は、学習のスタイルによってアルゴリズムを分ける方法。そして2つ目は、形態や機能の類似性によって（例えば似た動物をまとめるように）分ける方法です。どちらのアプローチも非常に実用的
s1251 2014/06/18
hackernews

アルゴリズム

PRML

machinelearning

統計

algorithm

機械学習

学習

人工知能

programming
リンク
機械学習サービス「Microsoft Azure Machine Learning」公開プレビューへ。低コストで手軽に機械学習の実装が可能に
マイクロソフトは、機械学習サービスをクラウドで提供する「Microsoft Azure Machine Learning」の公開プレビューを来月から開始すると発表しました。 Microsoft Azure Machine Learning combines power of comprehensive machine learning with benefits of cloud - The Official Microsoft Blog - Site Home - Tech Net Blogs 機械学習とは、例えばECサイトでの購買履歴を基にしたおすすめ商品の提示、金融取引での取引分析による不正行為の発見、あるいは工作機械の稼働履歴分析による故障時期予想、などの分野で利用されています。しかし機械学習を実現するには、まず大規模なデータ分析基盤を構築し、そこに機械学習のアルゴリズムを実装した
s1251 2014/06/17
azure

machinelearning

machine learning

開発

service

cloud

機械学習

Microsoft

publickey
リンク
Deep Learning技術の今
第2回全脳アーキテクチャ勉強会での講演スライドです。Deep Learning の基礎から最近提案されている面白トピックを詰め込んだサーベイになっています。
s1251 2014/06/03
deep learning

deeplearning

machinelearning

slideshare

機械学習

error

algorithm

machine learning

アルゴリズム
リンク
統計学・機械学習でよく使われる数学記号リスト（主に自分用） - About connecting the dots.
統計学とか機械学習周りの本を読んでいると，何の説明もなくややこしい数学記号が出てきて，そういえばこれはなんだっただろう？　と途方に暮れてしまうことが少なくないので，自分用にまとめなおしてみました，というのが今回のエントリ．あくまで自分用なので，全部の数学記号を扱ってるわけではありません*1．代数学記号意味用例用例の意味備考総和要するに足し算総乗要するにかけ算クロネッカーのデルタ i=jなら1，それ以外なら0 要するにブーリアン条件ナブラ *2 3次元ベクトルの微分要するに各要素の微分ラプラシアン 3次元ベクトルの2階微分要するに各要素の2階微分下限のとき与式は0になるとの違いは，は当該値を含む必要があるが，はないこと上限との違いは，は当該値を含む必要があるが，はないこと関数値が最大となるような定義域の元の集合を最大にするようながの下にくる場合も
s1251 2014/05/04
統計

用語

学習

tips

machinelearning

数学

機械学習

統計学

資料

記号
リンク
機械学習分野におけるテストの自動化 #ques4
第4回 Ques (2014.4.22 開催) でお話する「機械学習分野におけるテストの自動化」の発表資料です。
s1251 2014/04/22
machinelearning

test

機械学習

junit

machine learning

ques4

slide

automation

ml

テスト
リンク
Statistical Semantic入門 ~分布仮説からword2vecまで~
1. The document discusses various statistical and neural network-based models for representing words and modeling semantics, including LSI, PLSI, LDA, word2vec, and neural network language models. 2. These models represent words based on their distributional properties and contexts using techniques like matrix factorization, probabilistic modeling, and neural networks to learn vector representatio
s1251 2014/02/06
knife

etc

NLP

statistics

machine learning

mean

access

自然言語処理

machinelearning

infrastructure
リンク
伝説のベイジアン先生にベイズの基礎を教えてもらえる「図解・ベイズ統計「超」入門」を読んだ - EchizenBlog-Zwei
「図解・ベイズ統計「超」入門あいまいなデータから未来を予測する技術」という本を読んだ。社会人のアヤとケンが社内研修で伝説のベイジアン先生からベイズの基礎を教わる、という設定の会話形式でベイズについて書かれた入門書。社内研修でベイズのプロから指導を受けるとかどんだけ恵まれてるんだ。アヤさんは大学で統計をやったが数学は詳しくないという設定。ただ時々鋭い質問をする。また統計に詳しいイケメン兄がいる。ケンくんは知識は全くなく最後まで「わかりません」を連発する。彼女持ちのリア充。伝説のベイジアン先生は社内研修の講師。ベイズの基礎を豊富な具体例で教えてくれるまじぱない先生。あまりにもいけてるので数カ月後に転職しそうな感じ。内容は1章が導入、2章が同時確率・条件付き確率、3章がベイズの定理、4章がベイズの定理を用いた事後確率計算の具体例、5章が事例の追加による事前確率の更新(具体例としてナイ
s1251 2013/12/27
machinelearning

neta

math
リンク
2013年今最も旬な機械学習の研究者たち9人 - Qiita
今年一年の機械学習を素人的に振り返ってみるとでぃーぷらーにんぐがすごかったなー、みたいなミーハーな感想がまず思い浮かぶわけなんだけども、実際のところ今ホットな研究は何なんだろうということで、泣く子も黙る機械学習の代表的な国際会議、NIPSとICMLの過去3年分の採択論文を著者にフォーカスしてみることにした。 1st authorの重要度をそれ以外の著者よりも重くしてスコアづけした。 (複数人の著者がいる場合は1st authorを0.8として、残りの0.2を他の著者に分配、1人の場合は1とする) 参考: IR研究者をスコアリングしてみた - 睡眠不足？！ NLP(自然言語処理)研究者をスコアリングしてみた以下各々の自己紹介ページを参照しつつ、該当会議での1st author論文タイトルを引用して、スコアの上から順番にみていきます。名寄せミスなどによる集計ミスがあったらごめんなさい。 An
s1251 2013/12/25
learning

algorithm

プログラミング

ml

web

機械学習

machinelearning

bayesian
リンク
Matrix Factorizationとは - Qiita
Machine Learning Advent Calendarです。普段はGunosyという会社で推薦システムを作ってますはじめに推薦システムに関する最近の文献を読むと結構な割合で出てくるMatrix Factorizartion(MF)と呼ばれる手法があります。ざっくり言うとこの手法は協調フィルタリングにおける次元削減を行うことでよりよい推薦を行おうという手法であり、 Netflix Prize(100万ドルの賞金が賭けられた推薦システムのコンテスト)で最も成果を上げたモデルの一つでもあります。本記事ではこの手法を紹介していきます。協調フィルタリングまず協調フィルタリングについておさらいしましょう。あるサービスで3人のユーザが５つのアイテムに対して5段階評価をしたとき、その評価値を以下のようにベクトルで表すことができます。 \vec{user_{1}} = (4, 5,
s1251 2013/12/17
advent

advent calendar

machinelearning

機械学習

qiita

learning

machine learning

Gunosy
リンク
Apache Mahoutの使い方：テキスト分類のアルゴリズムを活用する
ビッグデータ活用：その分析実装として注目されるMahout 長年蓄積した企業内データや、ソーシャルネットワークサービス、センサ端末から集められる膨大なデータを活用し、企業における利益向上やコスト削減などに活用する動きが活発になってきました。データの分析手段として最近とみに注目されている技術として「機械学習」があります。大規模データの処理を得意とする大規模分散処理基盤「Apache Hadoop」の強みを生かし、簡単に機械学習を行うためのライブラリが、「Apache Mahout」（以下、Mahout）です。本稿ではMahoutを用いたデータ分析の例として「文書分類」を取り上げます。マシンを用いて分析実行する際の手順や陥りがちなポイント、チューニング方法の一例を紹介します。 Mahoutとは？ MahoutとはApache Software Foundationが公開しているOSSの機械
s1251 2013/12/05
mahout

machinelearning

機械学習

apache

programming
リンク
Large Scale Machine Learning
Libs and Papers on Large Scale Machine Learning. Acknowledgement Nash thanks Yin Zhu for providing many useful related libs and papers, thanks Erheng Zhong and Prof. Qiang Yang suggestions and discussions on this list. 2 computing models recently. assumes each data instance can be independently computed. A typical example is hadoop, the map function assumes each data unit can be processed independ
s1251 2013/11/30
data

機械学習

machinelearning

learning

machine learning
リンク
1 2 次のページ