[B! Qiita][機械学習] ni66lingのブックマーク

ni66ling id:ni66ling

Qiitaと機械学習に関するni66lingのブックマーク (9)

2019年、俺の読んだ論文50本全部解説(俺的ベスト3付き) - Qiita
第一位 Focal Loss for Dense Object Detection 物体検知のためのFocal Loss これは不均衡データに対処するための損失関数Focal Lossを提案した論文なのですが, とにかくそのシンプルさにやられました. 画像のFLの式を見てください. たったこれだけです. ptは正解ラベルに対する予測値なのですが, ptが大きければ大きいほど損失値をしっかり抑えられるように設計された関数となっています. 正解ラベルに対して0.6と予測するサンプルを学習に重要視せず, 0.3とか0.1とか予測しちゃうサンプルにしっかりと重要視するのです. 自分も7月くらいまでは不均衡データに関する研究していたのですが, 自分が考えた多くのアイディアが結局Focal Lossの下位互換に帰結してしまうのです. しかもこの損失関数の汎用性は非常に高く, あらゆるタスクに入れること
ni66ling 2020/01/22
2019

機械学習

qiita
リンク
機械学習システムにおける「技術的負債」とその回避策 - Qiita
はじめに空前のAIブームだった2017年、Yahooニュースでは毎日のように『〇〇が△△のAIを開発』のような見出しが目立ちました。2018年は『AIの運用』の時代になるとも言われています。しかし、AI（機械学習）を載せたシステムの開発・テスト・運用の方法は2018年4月現在、まだ確立されていない分野です。今回は、技術的負債という観点から、機械学習システム特有の課題点とその回避策のヒントまとめたGoogleの論文 Machine Learning: The High Interest Credit Card of Technical Debt (2014) を翻訳します。Google翻訳+軽い手作業ですのでご留意を。ちなみにタイトル『機械学習：技術的負債の高金利クレジットカード』の意味は、機械学習システムがまるで高金利のクレジットカードのように、気づかないうちに技術的負債を蓄積して
ni66ling 2019/03/16
技術的負債

qiita

機械学習
リンク
機械学習モデルの実装における、テストについて - Qiita
数あるフレームワークに付属するExample、機械学習モデルを実装してみた、という話。これらに共通して言えるのは「テストがない」ということです。機械学習のモデルだって、アプリケーションに組み込まれればプロダクションコードの一部です。テストがない実装を本番環境に組み込むか？というと通常そんなことありえないと思います。 (スタジオジブリ紅の豚より拝借) 忘れられがちな点ですが、機械学習モデルは「リリースした瞬間」が最高精度になります。なぜなら、リリースした瞬間こそがその時点で手に入るフルフルのデータを使って鍛え上げたモデルであり、それ以降はどんどん未知のデータが入ってくるためです。そのため、モデルの精度、また妥当性をいつでも検証できるようにしておくというのはとても重要です。これは通常のコードにテストをつける理由と同等で、つまり機械学習モデルだからと言って特別ではないということです。本
ni66ling 2016/12/15
機械学習

テスト

qiita
リンク
カーネルとは直感的に説明するとなんなのか？ - Qiita
How to intuitively explain what a kernel is?に対する回答がわかりやすかったので和訳まずは質問の意図から。質問者は、「カーネルとは直感的に説明するとなんなのか？」を聞いています。それに対する回答のひとつが、上記のリンク先です。和訳カーネルとはふたつのベクトル $\boldsymbol{x}$ と $\boldsymbol{y}$ の内積を(たいていはとても高次元の)特徴空間で計算する方法であり、これがカーネル関数が時々「一般化内積」と呼ばれる理由です。 $\mathbb{R}^n$ 上にあるベクトルをなんらかの特徴空間 $\mathbb{R}^m$ へ写す写像 $\varphi:\mathbb{R}^n \rightarrow \mathbb{R}^m$ があるとします。すると、その空間での $\boldsymbol{x}$ と $\bol
ni66ling 2016/01/27
kernel

機械学習

qiita
リンク
数学を避けてきた社会人プログラマが機械学習の勉強を始める際の最短経路 - Qiita
巷ではDeep Learningとか急に盛り上がりだして、機械学習でもいっちょやってみるかー、と分厚くて黄色い表紙の本に手をだしたもののまったく手が出ず（数式で脳みそが詰む）、そうか僕には機械学習向いてなかったんだ、と白い目で空を見上げ始めたら、ちょっとこの記事を最後まで見るといいことが書いてあるかもしれません。対象勉強に時間が取れない社会人プログラマそろそろ上司やらお客様から「機械学習使えばこんなの簡単なんちゃうん？」と言われそうな人理系で数学はやってきたつもりだが、微分とか行列とか言われても困っちゃう人この記事で行うこと数学の基礎知識に慣れるための、数式が最初から出てこないプログラマ向けの数学入門書の紹介機械学習の初学者には鉄板の、オンライン講座（MOOC）の機械学習コース紹介環境 WindowsでもMacでもLinuxでも大丈夫(MATLAB/Octaveというツール
ni66ling 2015/05/27
Deep Learning

機械学習

qiita
リンク
CaffeでDeep Learning つまずきやすいところを中心に - Qiita
はじめに近年Deep Learningへの注目が高まっていますが、多くの場合膨大なデータを必要とすること、学習にはGPU計算環境が必要であったりなど、独特の敷居の高さがあります。この記事では、この敷居を大きく下げるであろうCaffeについて紹介します。ただ、Caffeを紹介する記事はすでに良いものがたくさんあり、そもそも公式documentがかなり充実しているので、今回は躓きやすい部分や他の記事があまり触れていない部分を中心に紹介していきます。 Caffeって何？ CaffeはDeep Learningのフレームワークの一つです。Deep Learningは一般に実装が難しいとされていますが、フレームワークを使えばかなり手軽に扱うことができます。代表的なフレームワークには、 Caffe theano/Pylearn2 Cuda-convnet2 Torch7 などがあります。この中でも
ni66ling 2015/01/07
Deep Learning

Caffe

機械学習

qiita
リンク
広告と機械学習 - Qiita
Machine Learning Advent Calendar向けの記事です。普段はGunosyという会社で社長業をしながら社長をしています。ざっくりいうと結論だけ知りたい人はここだけ広告における機械学習の応用の多くはCTR予測や運用の最適化のため(クエリー予測とか)の予測問題今後は「CVRの予測」や「アクティブなユーザーの予測」がホットな話題になる(加えてその運用をどう最適化するかといった話題も) 現在は検索エンジンの応用例が多い。今後はディスプレイ広告やタイムライン広告への応用が増えていく個人のユーザー属性を集めることが今まで以上にメディアのビジネス的に重要になる広告や推薦エンジンに限らずドメイン知識は非常に重要。ドメイン知識と機械学習の知識を持ったエンジニアが意思決定に携わる会社は今後大きくのびる(と思う) 広告について最近はもっぱら広告の開発をしており、広告分野で
ni66ling 2013/12/24
機械学習

Gunosy

広告

Qiita
リンク
Matrix Factorizationとは - Qiita
Machine Learning Advent Calendarです。普段はGunosyという会社で推薦システムを作ってますはじめに推薦システムに関する最近の文献を読むと結構な割合で出てくるMatrix Factorizartion(MF)と呼ばれる手法があります。ざっくり言うとこの手法は協調フィルタリングにおける次元削減を行うことでよりよい推薦を行おうという手法であり、 Netflix Prize(100万ドルの賞金が賭けられた推薦システムのコンテスト)で最も成果を上げたモデルの一つでもあります。本記事ではこの手法を紹介していきます。協調フィルタリングまず協調フィルタリングについておさらいしましょう。あるサービスで3人のユーザが５つのアイテムに対して5段階評価をしたとき、その評価値を以下のようにベクトルで表すことができます。 \vec{user_{1}} = (4, 5,
ni66ling 2013/12/18
機械学習

Gunosy

qiita

advent calendar
リンク
Machine Learningのカレンダー | Advent Calendar 2013 - Qiita
今年もやりましょうか。 Machine Learning Advent Calendar 2013とはパターン認識・機械学習・自然言語処理・データマイニング等、データサイエンスに関するアドベント・カレンダーです。参加方法とりあえず参加登録をポチる自分の担当の日に機械学習に関するちょっとした記事を書くみんなで読む記事内容は、パターン認識・機械学習・自然言語処理・データマイニング等、データサイエンスに関する事でしたら何でもOKです。テーマに沿っていれば分量は問いません。（PRMLの読んだ箇所のまとめ、実装してみた、論文紹介、数式展開、etc.）皆さんのご参加をお待ちしております。 Qiitaで数式を書く方法「母国語が数式なのだけれどQiitaで数式は書けるのか」という心配からAdvent Calendarへの参加を躊躇されている皆さんのために、はてな風TeX記法をQiita上
ni66ling 2013/12/02
ML

機械学習

Qiita

adventcalendar
リンク
1