タグ

機械学習に関するnikkoroのブックマーク (48)

  • 異常検知の世界へようこそ - Preferred Networks Research & Development

    比戸です。 先週Jubatusの最新0.4.0がリリースされましたが、外れ値検知機能の追加が目玉の一つとなっています(jubaanomaly)。昨年PFIへ入社して初めて手がけた仕事が公開されたということで感慨ひとしおですが、便乗してあまり語られることのない異常検知の世界について書きたいと思います。以下の資料は昨年のFIT2012で使ったものです。 異常検知とは簡単にいえば、「他に比べて変なデータを見つけ出す」タスクです。お正月にテレビで繰り返し流れた、おすぎとピーコのCM(*1)がわかりやすいイメージですね。機械学習の枠組みで言えば”教師無し学習”に属します。分類や回帰、クラスタリングなど応用も多く人気も研究熱も高いタスクに比べると、マイナーです。SVMとか、Random Forestとか、Boostingとか、最近だとDeep Neural Networkとか、有名な必殺技アルゴリズム

    異常検知の世界へようこそ - Preferred Networks Research & Development
  • Deep Learning を実装する

    Learning Deep Architectures for AI (第 3 回 Deep Learning 勉強会資料; 松尾)Ohsawa Goodfellow

    Deep Learning を実装する
  • 【ML advent calendar 2012記事】Computer... | DERiVE コンピュータビジョン ブログ

    このサイトについて DERiVEはコンピュータビジョン、画像認識が専門のMasaki Hayashiがお送りしている、コンピュータビジョン(Computer Vision)を中心としたITエンジニア、研究向けのブログです。※「DERiVE メルマガ別館」は2015/9月で廃刊致しました、 ML Advent Calendar2012のこの記事へのリンクから飛んできた皆さんこんにちは。この記事は私が担当させていただく、2012/12/19のML advent calender向け記事になります。 まず最初に、はじめてこのブログにいらっしゃった非コンピュータビジョンクラスタ向けに、簡単に自己紹介をしておきます。私は慶応義塾大学の後期博士課程に所属している、学生研究者の林(@payashim)と申します。私は修士修了後、(画像以外の計測も含めて)各種計測システムの開発者をしておりましたが、昨年退

  • Machine Learningのカレンダー | Advent Calendar 2012 - Qiita

    Machine Learning Advent Calendar 2012とは パターン認識・機械学習・自然言語処理・データマイニング等、データサイエンスに関するアドベント・カレンダーです。 当初PRML Advent Calendarとして立てたのですが、PRMLは敷居が高すぎるのかネタだと思われてるのか皆ROMる気満々で執筆側に誰も回ってくれる気配がなかったので、対象を機械学習全般にしてみました。URLが変更になりすみません。 参加方法 とりあえず参加登録をポチる 自分の担当の日に機械学習に関するちょっとした記事を書く みんなで読む 記事内容は、パターン認識・機械学習・自然言語処理・データマイニング等、データサイエンスに関する事でしたら何でもOKです。テーマに沿っていれば分量は問いません。 (PRMLの読んだ箇所のまとめ、実装してみた、論文紹介、数式展開、etc.) 皆さんのご参加をお

    Machine Learningのカレンダー | Advent Calendar 2012 - Qiita
  • 入門 機械学習

    目次 訳者まえがき はじめに 1章  Rを利用する 1.1 機械学習のためのR 1.1.1 Rのダウンロードとインストール 1.1.2 IDEとテキストエディタ 1.1.3 Rパッケージの読み込みとインストール 1.1.4 機械学習のためのRの基礎知識 1.1.5 Rに関する情報 2章 データの調査 2.1 探索と確証 2.2 データとは何か? 2.3 データ内の列の型を推論する 2.4 意味推論 2.5 数値による要約 2.6 平均値、中央値、最頻値 2.7 分位数 2.8 標準偏差と分散 2.9 探索的データの可視化 2.10 複数の列の関係の可視化 3章 分類:スパムフィルタ 3.1 白か黒か?二値分類 3.2 やさしい条件付き確率入門 3.3 初めてのベイズスパム分類器を書く 3.3.1 分類器を定義し、非スパム(難)でテストする 3.3.2 分類器をすべての種類の電子メールに対し

    入門 機械学習
  • ニューラルネットの逆襲 - Preferred Networks Research & Development

    岡野原です。Deep Learningが各分野のコンペティションで優勝し話題になっています。Deep Learningは7、8段と深いニューラルネットを使う学習手法です。すでに、画像認識、音声認識、最も最近では化合物の活性予測で優勝したり、既存データ・セットでの最高精度を達成しています。以下に幾つか例をあげます。 画像認識 LSVRC 2012 [html]  優勝チームスライド [pdf], まとめスライド[pdf] Googleによる巨大なNeuralNetを利用した画像認識(認識として有名)[paper][slide][日語解説] また、各分野のトップカンファレンスでDeep Learningのチュートリアルが行われ、サーベイ論文もいくつか出ました。おそらく来年以降こうした話が増えてくることが考えられます。 ICML 2012 [pdf] ACL 2012 [pdf] CVPR

    ニューラルネットの逆襲 - Preferred Networks Research & Development
  • 風が吹けばジュンク堂で「機械学習の学習」 - Cybozu Inside Out | サイボウズエンジニアのブログ

    先週の木曜日(*1)、ジュンク堂書店池袋店で行われたトークセッションに、サイボウズ・ラボのメンバー3人が登壇者として参加してきました。題して「今度こそわかる!? PRMLの学習の学習」。 PRMLとは、人工知能の分野で世界的に有名な教科書、パターン認識と機械学習(Pattern Recognition and Machine Learning)のことです。「どうしてジュンク堂でPRML?」「学習の学習って何?」「で、なぜサイボウズ・ラボ?」——そこには、PRMLをめぐる1つのストーリーがあったのでした。 ジュンク堂池袋店で行われた「PRML同人誌 『パターン認識と機械学習の学習』(暗黒通信団) 刊行記念トークセッション──今度こそわかる!? PRMLの学習の学習」には、神嶌敏弘氏、naoya_t氏に加え、サイボウズ・ラボから光成滋生、中谷秀洋、竹迫良範の3人が講師として参加。木曜夜にも

    風が吹けばジュンク堂で「機械学習の学習」 - Cybozu Inside Out | サイボウズエンジニアのブログ
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • データサイエンティストのつくり方

    スライドは、弊社の梅により弊社内の技術勉強会で使用されたものです。 近年注目を集めるアーキテクチャーである「Transformer」の解説スライドとなっております。 "Arithmer Seminar" is weekly held, where professionals from within and outside our company give lectures on their respective expertise. The slides are made by the lecturer from outside our company, and shared here with his/her permission. Arithmer株式会社は東京大学大学院数理科学研究科発の数学の会社です。私達は現代数学を応用して、様々な分野のソリューションに、新しい高度AIシステム

    データサイエンティストのつくり方
  • hamadakoichi blog

    2017/10/28 "第60回 データマイニング+WEB @東京( #TokyoWebmining 60th ) ー 機械学習 活用 祭り ー" を開催しました。 第60回 データマイニング+WEB @東京( #TokyoWebmining 60th ) ー 機械学習 活用 祭り ーEventbrite Google グループ 会場提供して下さった FreakOut さん、どうもありがとうございました。素敵なトークを提供してくれた講師メンバーに感謝します。多くの方々の参加を嬉しく思っています。 参加者ID・バックグラウンド一覧: 参加者セキココ:第60回 データマイニング+WEB @東京 セキココ (作成してくれた [Twitter:@komiya_atsushi] さんに感謝) 以下、全講師資料、関連資料、ツイートまとめです。 AGENDA: ■Opening Talk: O1.「デー

    hamadakoichi blog
  • MapReduceできる10個のアルゴリズム - データサイエンティスト上がりのDX参謀・起業家

    HadoopとMahoutにより、ビッグデータでも機械学習を行うことができます。Mahoutで実装されている手法は、全て分散処理できるアルゴリズムということになります。Mahoutで実装されているアルゴリズムは、ここに列挙されています。論文としても、2006年に「Map-Reduce for Machine Learning on Multicore」としていくつかのアルゴリズムが紹介されています。 そこで今回は、(何番煎じか分かりませんが自分の理解のためにも)この論文で紹介されているアルゴリズムと、どうやって分散処理するのかを簡単にメモしておきたいと思います。計算するべき統計量が、summation form(足し算で表現できる形)になっているかどうかが、重要なポイントです。なってない場合は、”うまく”MapReduceの形にバラす必要があります。 ※例によって、間違いがあった場合は随時

    MapReduceできる10個のアルゴリズム - データサイエンティスト上がりのDX参謀・起業家
  • LASSO and Ridge regression - データサイエンティスト上がりのDX参謀・起業家

    今回はLASSOとリッジ回帰についてです。 パッケージは「glmnet」、「lars」、「lasso2」で実行できます。 glmnetとlarsの作者はFriedman、Hastie、Efron、Tibshiraniと有名な先生ですが、lasso2の作者は知らないです。。 内容もほぼ一緒なので、LASSOをするときはglmnet一択で良いと思います。 まずは使用例から。。。 データはLARSパッケージにあるdiabetesを使います。 このデータである結果変数y(中性脂肪?)をx(性別や血圧など)によって予測するモデルを作ります。 まずは単純な線形回帰をします。 library(lars) library(glmnet) data(diabetes) Linear <- lm(diabetes$y ~ diabetes$x) Linear$coefficients これが推定結果です。 (

    LASSO and Ridge regression - データサイエンティスト上がりのDX参謀・起業家
  • 機械学習 はじめよう 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    機械学習 はじめよう 記事一覧 | gihyo.jp
  • Google、脳のシミュレーションで成果……猫を認識 | RBB TODAY

    Googleは26日(現地時間)、同社の「Google X Labs」が人間の脳をシミュレーションする研究で大きな成果を挙げたと発表した。コンピューターがを認識する能力を自ら獲得することに成功したという。 自動運転車の研究などでも知られる同研究所は、人間の脳の働きをシミュレーションするために大規模なネットワークを用いる新たの方法を開発。このシステムにYouTubeの動画を1週間見せつづけたところ、がどういうものかを学習し、を認識できるようになったという。 従来の技術でもコンピューターに画像を見分けさせることは可能だが、例えば人間の顔をコンピューターに自動選別させるには、人間の顔がどういうものかを人間がコンピューターに教育する必要がある。しかし、今回の研究成果では、コンピューターはがどういうものであるか人間に教えられること無く、自力で理解した。これは機械学習の「self-taugh

    Google、脳のシミュレーションで成果……猫を認識 | RBB TODAY
  • Article - 機械学習の「朱鷺の杜Wiki」

    2018年† 特集「機械学習の数理」 数理科学8月号,No.662 (2018) 前半は機械学習・深層学習の数理について入門と微分幾何学(情報幾何学)・数理統計学の観点からの記述で、後半で言語や交通流や生物多様性への応用について数理的構造を解説。最後は人工知能技術について甘利先生の記事とこの分野のソフトウェアについてのまとめコラム。 -- こびとさん ↑ 2014年† 特集『データを読み解く技術 ー ビッグデータ,e-サイエンス,潜在的ダイナミクス』電子情報通信学会誌,vol.97, no.5 (2014) 連載解説『Deep Learning(深層学習)』,人工知能学会誌,vol.28, no.3〜vol.29, no.4 (2013〜2014) 特集「ヒューマンコンピュテーションとクラウドソーシング」人工知能,vol.29, no.1 (2014) ↑

  • 第5回「ビッグデータに立ち向かう機械学習」|情報処理学会 連続セミナー2012 「ビッグデータとスマートな社会」

    第5回「ビッグデータに立ち向かう機械学習」では、ビッグデータを有効に使いこなす技術の一つとして注目されている「機械学習」について、その研究分野をリードする研究者の方々に最先端の技術動向を紹介いただく。まず、コーディネータの松井知子が「機械学習」の研究分野をホットに俯瞰する。続いて、4名 の第一線の研究者の方々に、バイオサイエンスからマーケティグまで幅広い応用を持つ「機械学習」の核心となるアイディアとその可能性について、実例を織り交ぜながら説明いただく。 【略歴】1988年東京工業大学大学院修士課程了。同年NTT(株)入社。話者・音声認識の研究に従事。1998年よりATR音声翻訳通信研究所、2000年よりATR音声言語通信研究所及び音声言語コミュニケーション研究所に出向。2001年1月~6月米ルーセント・テクノロジー社ベル研究所客員研究員。2003年より情報・システム研究機構統計数理研究所准

  • NECが「異種混合学習技術」、雑多なビッグデータから法則発見

    図●NECが実施した電力消費予測実験のグラフ。上の従来技術による予測に比べて、下の「異種混合学習技術」による予測では実績と予測のずれが小さい(NECの資料より) NECの情報・ナレッジ研究所は2012年6月22日、ビッグデータの解析に役立つ「異種混合学習技術」を開発したと発表した。6月28日に英国で開催される「機械学習」分野の国際学会「The 29th International Conference on Machine Learning(ICML2012)」で詳細を報告する。2013年度の実用化を目指す方針だ。 機械学習Machine Learning)とは、コンピュータプログラムを使って大量のデータから有用な規則性、ルール、判断記述などを抽出する技術。製造・流通業などの需要予測や、スパムメールの判定、ネット広告の表示、デジタルカメラの顔認識、囲碁・将棋などのゲームといった分野に幅広

    NECが「異種混合学習技術」、雑多なビッグデータから法則発見
  • #devsumiE 「オンライン機械学習で実現する大規模データ処理」で聞いたことのメモ - #garagekidztweetz

    ツイート via http://jubat.usDevelopers Summit 2012 の2日目、 13:10〜14:00 の【17-E-3】「オンライン機械学習で実現する大規模データ処理」だけに参加してきたので、わたしがとってきたメモを共有したいと思います。 [Cloud Development] 13:10〜14:00【17-E-3】オンライン機械学習で実現する大規模データ処理 西川 徹 氏 【17-E-3】 オンライン機械学習で実現する大規模データ処理 View more presentations from Developers Summit <講演概要> 大規模データ処理は、Hadoopの普及や大手ベンダーの参入により、ますます盛り上がってきました。大規模データを活用しようとするこのビッグウェーブは、まだ始まったばかりです。データの量が増えるだけでなく、扱うデータの多様性は

    #devsumiE 「オンライン機械学習で実現する大規模データ処理」で聞いたことのメモ - #garagekidztweetz
  • Jubatusを公開しました - Preferred Networks Research & Development

    先日、NTTと共同研究開発したJubatusを公開しました。 OSSで公開されてますので、興味がある方は使ってみるなり、ソースコードを眺めるなり、できればプロジェクトに参加していただけたらと思います。 Jubatus(ユバタス)は、大規模分散上でリアルタイムで機械学習を行うためのフレームワークです。 このプロジェクトは元々、機械学習やデータ解析が好きなPFIと、ネットワークやシステム運用実績が豊富で技術力があるNTT情報流通プラットフォーム研究所と組んで何かできないかということで始めました。 「大規模分散」+「リアルタイム」+「深い解析」という三つの特徴を持った上でデータを分析するためにどのようなアーキテクチャが考えられて、その上でどのような解析ができるのかというのを日々試行錯誤して作っています。 今回はリリース第1段ということで、手法としては分類(教師有学習の多クラス分類)に絞ってOSS

    Jubatusを公開しました - Preferred Networks Research & Development
  • SSII08-Organized session -Object Recognition-

    一般物体認識とは,制約のない実世界シーンの画像に対して計算機がその中に含まれる物体を一般的な名称で認識することであり,コンピュータビジョンの究極の課題の一つであります.世の中には物体のカテゴリー数が数万種類あるといわれ,これらを認識することは非常に難しい問題です.しかしながら昨今では,回転やスケールに対する特徴量の不変性,機械学習の進歩,Bag-of-keypoints等のアプローチの進展,計算機の高速化等により,一般物体認識の問題にチャレンジする研究が増えています.オーガナイズドセッションでは,顔.人検出における有効な特徴選択,画像分類問題,物体認識の高速化の各側面から,それぞれの分野の第一線で活躍中の講師をお招きし,最新の一般物体認識の研究動向を紹介し,現在の課題を明確にするとともに今後の展開などについて会場の皆様とともに議論を深めたいと思います.