db analytics showcase Sapporo 2017 発表資料 http://www.db-tech-showcase.com/dbts/analytics
前置き# 記事がはてぶ炎上して恥ずかしい思いをしたので、結構書き直しました。 この記事よりも良質な記事を参考記事に列挙したので、このページをブックマーク集だとして、他のページを参照していただければと思います。 はじめに# 機械学習を勉強するにあたって、 ベースとなる数学を勉強したいというモチベーションが高まってきた。なぜか?それは、今まで数学的な知識なしに勉強を進めていたのたけれども、論文が読めなかったり、少し数式で込み入ってくると、とたんにわけがわからなくなったからだ。 しかし、一番のモチベーションは、やっぱり機械学習を勉強するものとしての登竜門、PRML(パターン認識と機械学習)を読みたいというものがある。 参考記事# そこで、機械学習のために必要な数学を調べてみたのだが・・・どのサイトをみてもこれはというものがみつからないのだ。 2017年現在で、有益な記事をできるかぎり集めてみた。
はじめに この記事は、Life is Tech ! アドベントカレンダー2016 18日目の記事です。 はじめまして!iPhoneメンターのにっしーです。 「時間があるときに勉強しよう」と人工知能/機械学習/Deep Learning/認識技術といったトピックの記事の見つけてはストックしてきたものの、結局2016年は何一つやらずに終わろうとしているので、とにかく一歩でも足を踏み出すべく、 本質的な理解等はさておき、とにかく試してみる ということで画像認識技術に触れてみることにしました。 画像認識とは? 画像認識とは、画像データの画像内容を分析して、その形状を認識する技術のことである。 -- Weblio辞書 画像認識では、画像データから対象物となる輪郭を抽出して、背景から分離し、その対象物が何であるかを分析するのが基本になります。 しかし、人間なら無意識化に行われていることですが、コンピュ
この教科書は、はてなサマーインターンの講義資料として作成されたものです: https://github.com/hatena/Hatena-Textbook この章では機械学習について、Webサービスの開発で必要とされる知識を中心に、とくに自然言語処理にフォーカスしながら解説します。 Webサービス開発と機械学習 実現困難な機能の例 闇雲な実装 もう少しましな実装 機械学習によるパラメータ決定 分類問題のための機械学習手法 パーセプトロン 判別アルゴリズム 学習アルゴリズム 特徴量のとり方 形態素解析 量をともなう特徴 組み合わせ特徴量 モデル 機械学習の種類 教師あり学習 分類 (質的変数の予測) 回帰 (量的変数の予測) 教師あり学習でのデータセット 教師なし学習 クラスタリング 次元削減(次元圧縮) 頻出パターンマイニング 異常値検出 アルゴリズムの評価 訓練データとテストデータ 学
この教科書は、はてなサマーインターンの講義資料として作成されたものです: https://github.com/hatena/Hatena-Textbook 機械学習編1(基礎編)では、最も初歩的な分類器である単純パーセプトロンを題材に、機械学習の基本について勉強しました。機械学習編2(実用編)では、実問題に機械学習を適用する上でのコツや、各種の機械学習アルゴリズムの使い分け、高次元データへの対処法、といったトピックについて解説していきます。 実問題に機械学習を適用する タスクを定義する データを特徴ベクトルに変換する 評価方法を決める 正解データの正例と負例は均等に ベースラインとなる手法を実装する 実データに向き合うときの心構え 機械学習のワークフロー 1. 前処理 データセット作成 サンプリング 特徴抽出 欠損値・欠測値への対応 値のスケーリング 特徴選択 次元削減 2. 学習 モデ
おつかれさまです。今日はちょっと趣を変えて、近年のいわゆる「機械学習」という技術のアプローチをカジュアルに少しカテゴリ分けしたいと思います。 といっても、自分はアカデミックの研究者ではなく大量の論文を読み漁るということもほとんどしないので、理論的なバックグラウンドに基づいたソリッドなカテゴリ分けはできません。ここで紹介するのはあくまで、実用上の機械学習技術者から見た視点で「こんな傾向があるかなぁ」くらいの気持ちで書いたものです。 <代表的な4つのアプローチ> 1、最適化(目的関数ベース) まず始めは最適化手法をベースにした機械学習のアルゴリズムです。たぶん一番例が多いんじゃないでしょうか。 ここでは、ある解きたい課題を目的関数によって定式化し、適切な最適化手法を使って解きます。伝統的な線形回帰や線形識別はもちろん、主成分分析(PCA)や非負行列因子分解(NMF)なんかもこの枠組みで解かれる
以前は MNISTの例を使って画像識別を試してみた けど、次はカラー画像についての識別を試してみる。 「アイドルなんてみんな同じ顔に見える」って 最近も言われてるのかどうか知らないけど、自分もつい5年前くらいまではそう思っていたわけで。その識別を機械学習でやってみよう という試み。 最近はほとんどライブに行かなくなってしまったけど大好きなももいろクローバーZちゃんを題材にしてみることに。 5人のメンバーの顔は機械学習によってどれくらい分類できるようになるのか?? CIFAR-10 CIFAR-10 という、32×32サイズのカラー画像を10種類のクラスに分類する識別課題があり、そのデータセットが公開されている。これを実際にTensorFlowで学習するための畳み込みニューラルネットワークのモデルや関数などがtensorflow.models.image.cifar10パッケージに同梱されて
最近おそ松さんというアニメが流行っていますね。 6つ子のおそ松くんのアニメを現代版にアレンジした作品なのですが、その過程でそれぞれの兄弟の特徴が付けられています。 左から、おそ松、から松、チョロ松、一松、十四松、とど松で、順に長男次男三男・・・となっています。 簡単にまとめると、このようになります。 生まれ 名前 色 特徴 長男 おそ松 赤 クズ 次男 から松 青 ナルシスト 三男 チョロ松 緑 ツッコミ、意識高い系 四男 一松 紫 コミュ障 五男 十四松 黄色 マイペース 六男 とど松 ピンク 甘え上手、腹黒 それぞれの色を着ているときは、簡単に見分けられますが、そうでないときは見分けるのに困難を伴います。 髪や目つきにも特徴があるので、見分けることができるので、このような表を作ってらっしゃる方もいます。 それでも結構苦労したので、同じくディープラーニングで学習させたモデルで判別できない
最近、ディープラーニングが流行ってるせいか、機械学習関連の本や学習法をまとめた記事がバズっているのをよく目にします。 みんな興味はあるけど、なかなか手を出しにくい分野だから、学習方法が注目されているのだと思うのですが、それにしても多すぎると思いました。なので、機械学習のまとめをまとめてみました。Navarまとめのまとめみたいな。 人工知能ブームに追従する機械学習ブームの中、今年勉強するものの参考になれば幸いです。 オススメ本のまとめのまとめ breakbee.hatenablog.jp d.hatena.ne.jp d.hatena.ne.jp blog.livedoor.jp d.hatena.ne.jp d.hatena.ne.jp 学習に役立つ情報のまとめのまとめ qiita.com d.hatena.ne.jp qiita.com d.hatena.ne.jp aidiary.ha
皆様こんにちは,@a_macbeeです. (大分時間ギリギリになってしまいましたが)この記事はAdvent Calendar 2015 - VOYAGE GROUP 2日目の担当分になります. 2015年は良くも悪くも深層学習がバズワードとなって盛り上がった年でした. 面白い論文が続々発表されたり,関連書籍が次々出版されたり,最近だとGoogleが発表した深層学習ツールTensorFlowが話題となってます. このビッグウェーブに乗るしかないということで,この記事では自他共に認めるPython大好きな私がPython製の深層学習ライブラリである「Keras」について紹介します. Keras KerasはPython製の深層学習ライブラリです. もともとはバックエンドとしてTheanoを採用していたのですが,つい最近TensorFlowも選択できるようになりました.ここでは,折角なのでTen
_ なぜ機械学習といえばPythonなのか TDでmrknから機械学習の話を聞く会に参加。 家に帰ってからスルーしてはいかんなぁとWEB+DBを買うことになった。 WEB+DB PRESS Vol.89(佐藤 歩) いろいろ聞いて、どうやらPythonが機械学習のフルスタックを持っている点が大きいということがわかる。 ちょうど、最初にWebアプリケーションのフルスタックを用意したのがRailsだったというのにちょっと似ているのかなと思った。 特に、Array(忘れた。Sequenceかな?)のAPIによる統一が大きいとのこと。それによってCとのインターフェイスが標準化されてモジュールが集まりやすい。 RubyであればNArrayがその役回りを持つのかも知れないが、NArrayは標準ライブラリではないとか。 統計のあれこれが揃いまくっているのが大きくてRが使われているというような話もあった。
ちょっと前に話題になってたんですが、何でもCRANに確率的勾配降下法(Stochastic Gradient Descent)を実装した{sgd}というパッケージが公開されているそうで。JSS掲載予定のVignetteもあるみたいです。 CRAN - Package sgd Stochastic gradient decent methods for estimation with large data sets ということで、ミーハーかもですが試しにちょっと触ってみようかと思います。ちなみに今回検証に用いたマシンはWindows 7 (64bit)、8コア (3.60GHz)、メモリ32GBというスペックです。 確率的勾配降下法について 最近はMLPシリーズとか良いテキストが沢山出ているので、そちらでも読んでみて下さい*1。 オンライン機械学習 (機械学習プロフェッショナルシリーズ) 作
「データマイニング」全般を学習できるYoutube動画シリーズ。 Utah Dataさんによる講義(英語)。 動画リスト(1~10) Data Mining Lecture 1 Part 1 Data Mining Lecture 1 Part 2 Data Mining Lecture 2 Part 1 Data Mining Lecture 2 Part 2 Data Mining Lecture 3 Part 1 Data Mining Lecture 3 Part 2 Data Mining Lecture 3 Part 3 Data Mining Lecture 4 Part 1 Data Mining Lecture 4 Part 2 Data Mining Lecture 5 Part 1 Data Mining Lecture 5 Part 2 Data Mining Le
こんにちは。検索編成部&研究開発チームの原島です。 クックパッドのレシピには、内部で、様々な情報が付与されています。例えば、こちらの「母直伝♪うちの茹でない塩豚」というレシピには「肉料理」という情報が付与されています。これらの情報は、クックパッドの様々なプロダクトで利用されています。 レシピに情報を付与する方法は沢山ありますが、その一つに機械学習があります。クックパッドでは、レシピが肉料理か否か、魚料理か否か、...という分類を行うことで、「肉料理」や「魚料理」などの情報をレシピに付与しています。 今日は、分類をどのように実現しているか、その裏側を紹介します。 ■ 実装フェーズ まず、分類器を実装する際に気をつけたことを紹介します。 モデルを決定する 分類を行うには、そのための機械学習のモデルを決定する必要があります。クックパッドでは、十分な精度が出るだけでなく、リファレンスが多いという点
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く