Survey on machine learning approaches to class-imbalanced data. 不均衡データの学習に関するサーベイ資料です.
Summary. Tapping the power of AI technologies requires customizing them to your business context. The purpose of your first 1-2 pilot projects is only partly to create value; more importantly, the success of these projects will help convince stakeholders to invest in building up your company’s AI capabilities. When you’re considering a pilot AI project, ask yourself the following questions: Does
2. 自己紹介 ・Facebookページ https://www.facebook.com/matsukenbook ・Twitterアカウント @kenmatsu4 ・Qiitaでブログを書いています(統計、機械学習、Python等) http://qiita.com/kenmatsu4 (3500 contributionを超えました!) ・趣味 - バンドでベースを弾いたりしています。 - 主に東南アジアへバックパック旅行に行ったりします (カンボジア、ミャンマー、バングラデシュ、新疆ウイグル自治区 etc) 旅行の写真 : http://matsu-ken.jimdo.com Twitterアイコン
デジタルトランスフォーメーションを加速する最先端AI技術群「NEC the WISE」: 最先端AI技術群 ~NEC the WISE~ | NEC 2012年頃から話題になっている,NECが提唱する異種混合学習とは一体何なのか,ということが気になって簡単に調べた. 以下の記述は,自分の理解に基づいていること,学習理論については詳しくないことを断っておく. 概要 異種混合学習技術は多種多様なデータに混在するデータ同士の関連性から、特定の規則性を自動で発見するとともに、分析するデータに応じて参照する規則を切り替えます。これにより、“単一の規則性のみを発見して、それを参照するような従来の機械学習”では分析が困難であった「規則性が変化するデータ」でも高精度な予測や異常検出が可能になります。 デジタルトランスフォーメーションを加速する最先端AI技術群「NEC the WISE」: 最先端AI技術群
paper100knock #3 機械学習の研究してる人は全員読んだ方がいい。そう断言できるぐらい良い内容が書かれています。 ICML2012で発表された最近の機械学習に関する研究の問題点を論じた論文。 「あなたは現実世界で役立つデータに対して機械学習の研究を行っていますか?」 http://icml.cc/2012/papers/298.pdf 著者はNASAのJPL(ジェット推進研究所)、カリフォルニア工科大学に所属するKiri L. プロフィール写真の笑顔が素敵ですね。 http://www.wkiri.com/ 発表動画を探してみたんですが、ICML2012で発表した際のビデオはサーバのクラッシュにより喪失したとのこと。 The video for my controversial ICML 2012 talk is no longer available (lost in a s
IBISML(情報論的学習理論と機械学習) 日本で開催されている学会IBISMLのメーリングリスト。機械学習に関する情報が流れてくる。 Google Groupで管理されているでの色々と便利。 https://groups.google.com/forum/?hl=ja&fromgroups#!forum/ibisml 人工知能学会 日本人工知能学会が運営するメーリングリスト。 人工知能や日本で開催される様々な学会イベントが雑多に流れてくる。 http://www.ai-gakkai.or.jp/mailing-list/ NA digest 数値解析・数値計算に関するメーリングリスト。先週先生に教えてもらって知りました。 http://www.netlib.org/na-digest-html/ 研究関連でもしオススメのメーリングリストがあれば教えて下さい。
[概要] 最近のkaggle のコンペのwinning solution で、stacked generalization がよく使われています。これの元になった論文は、1992 年のWolpert さんによるものです。 triskelion さんのブログKaggle Ensembling Guide | MLWave の中でもこの手法についての説明があります。 様々な学習器を上手く組み合わせて、より精度の良いモデルを作ろうというのが基本的な考え方です。具体的には次の図のような感じです。 level 0 は、元となるデータです。またこの場合における各学習器はgeneralizer と呼ばれています。level 0 のデータにgeneralizer を適用して生成されたデータがlevel 1 のデータとなります。 その後も、同様に名づけられています。 [過去のコンペ] まずは、多層パーセプト
記事のタイトル通り、競馬で回収率100%を超える方法を見つけたので、その報告をする。 ちなみに、この記事では核心部分はぼかして書いてあるため、読み進めたとしても「競馬で回収率100%を超える方法」が具体的に何なのかを知ることはできない。(私は本当に有効な手法を何もメリットが無いのに公開するほどお人好しではないので) 本当に有効な手法を見つけたいのであれば、あなた自身がデータと向き合う以外の道は無い。 ただし、大まかな仕組み(あと多少のヒントも)だけは書いておくので、もしあなたが独力でデータ解析を行おうという気概のある人物なのであれば、この記事はあなたの助けとなるだろう。 ちなみに、これは前回の記事の続きなので、読んでない方はこちらからどうぞ。 stockedge.hatenablog.com オッズの歪みを探す さて、前回からの続きである。 前回の記事のブコメで「回収率を上げたいならオッズ
This document discusses the data management platform (DMP) used for ad targeting and delivery in SmartNews Ads. The DMP collects, cleans, and aggregates over 14 million user profiles and ad data from multiple sources. It uses this first-party data to perform user clustering, CTR and CVR prediction using machine learning models, and lookalike targeting. Future work may include targeting based on us
FIT2012で行われた「ビジネスで生きる機械学習技術」セッションの招待講演資料です。 http://www.ipsj.or.jp/event/fit/fit2012/program/data/html/event/event_A-7.html 【講演概要】 世の中で得られる知見の多くは、何らかの観測対象の時間変化や、観測対象グループにおける珍しい個体の出現を捉えたものと考えることができます。特に急速な変化や異常な個体の検出するための異常検知技術は、ビジネスにおけるデータ収集・蓄積インフラの浸透とともに応用が広がっています。従来は、蓄積されたデータを目で見て確認する、閾値を設けてアラートを出す、あるいは経験に基づいて異常パターンをルール化する、などのアプローチが主流でした。しかしながら、収集できるデータの変数と量が飛躍的に増大する中で、比較的単純かつ過去に起きた異常のみ扱えるルールベース手
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く