タグ

機械学習に関するmoozのブックマーク (10)

  • Random forest - Wikipedia

    英語版記事を日語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、{{翻訳告知|en|Random forest|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明があ

    Random forest - Wikipedia
    mooz
    mooz 2011/08/14
    "識別、回帰、クラスタリングに用いられる", "ランダムサンプリングされたトレーニングデータによって学習した多数の決定木を使用する"
  • Conditional random field - Wikipedia

    Conditional random fields (CRFs) are a class of statistical modeling methods often applied in pattern recognition and machine learning and used for structured prediction. Whereas a classifier predicts a label for a single sample without considering "neighbouring" samples, a CRF can take context into account. To do so, the predictions are modelled as a graphical model, which represents the presence

    Conditional random field - Wikipedia
    mooz
    mooz 2011/06/02
    CRF, Conditional random field.
  • SDM2011でwavelet木を用いた大規模グラフデータベースの高速類似度検索手法について発表しました - Yasuo Tabeiの日記

    4月28日から4月30日に開催されたデーターマイニングの国際会議 SIAM Conference on Data Mining (SDM2011)にてwavelet木を用いた大規模グラフデータベースの高速類似度検索手法について発表してきました。 Yasuo Tabei and Koji Tsuda: Kernel-based Similarity Search in Massive Graph Databases with Wavelet Trees, Eleventh SIAM International Conference on Data Mining (SDM), Arizona, USA, 2011. Link to the paper 研究では大規模グラフデーターの索引による高速な類似度検索手法を提案しました。近年、グラフデータベースに登録されているグラフの数は大規模化してい

    SDM2011でwavelet木を用いた大規模グラフデータベースの高速類似度検索手法について発表しました - Yasuo Tabeiの日記
  • 統計的機械学習 | 中川研究室

    統計的機械学習 統計的機械学習とは、観測されたデータから統計的手法を用い新たな知識を導出することである。 統計的機械学習についての教科書的な内容はこちらを参照してほしい。 統計的機械学習には種々の分類がある。主要なものを説明しよう。 教師あり学習と教師なし学習 教師あり学習(supervised learning)では、観測データと、そのデータの意味が与えられる。例えば、文書分類問題であれば、観測された文書とその文書の属するカテゴリー(スポーツ、芸能、など)の対のデータ集合(これをtraining dataと呼ぶ。)である。学習によって、観測データの持つ属性と意味の関係を推定し、未知のデータ(これを test data と呼ぶ。)が与えられると、そのデータの意味を出力する。 教師なし学習(un-supervised learning)では、観測データだけが与えられる。観測データたちの

  • 機械学習超入門 〜そろそろナイーブベイズについてひとこと言っておくか〜 - EchizenBlog-Zwei

    最近では機械学習の認知度も上がってきていて専門家でなくてもナイーブベイズやSVMなどの名前を知っている人も増えてきたように思う。 そんなわけでちょっと機械学習をはじめてみようかな、と思っている人も多いのではないだろうか。とはいえ「数式よくわからない」「確率嫌い」といった理由で尻込みしているケースも多いのでは。 そこで予備知識ゼロでもわかるような機械学習の入門記事を書いてみたよ。 機械学習を「作りたい」のか「使いたいのか」 まず最初に確認したいのがこれ。使いたいだけならまずはSVMを使ってみれば良い。世の中にはlibsvmやsvmlightという良いツールがあるのでそれを使おう。以下の記事は機械学習を「作りたい」「仕組みを知りたい」人向けの内容になっている。 「最も簡単な機械学習はナイーブベイズ」という幻想 機械学習といえばナイーブベイズという話がよくある。ナイーブ(単純)という名前からいか

    機械学習超入門 〜そろそろナイーブベイズについてひとこと言っておくか〜 - EchizenBlog-Zwei
  • Apache Mahout - Overview

    For Creating Scalable Performant Machine Learning Applications Download Mahout Apache Mahout(TM) is a distributed linear algebra framework and mathematically expressive Scala DSL designed to let mathematicians, statisticians, and data scientists quickly implement their own algorithms. Apache Spark is the recommended out-of-the-box distributed back-end, or can be extended to other distributed backe

  • 有名どころな機械学習手法の年表 - 木曜不足

    ちょっと機械学習の比較的有名なモデルやアルゴリズムの初出について年表を作ってみた。 って今週末用の資料なんだけどねw 1805 Method of Least Squares 1901 PCA (Principal Component Analysis) 1905 Random Walk -1925 Logistic Regression 1936 Fisher's Linear Discriminant Analysis 1946 Monte Carlo Method 1948 n-gram model 1950 RKHS (Reproducing Kernel Hilbert Space) 1950s Markov Decision Process -1957 Perceptron 1958 Kalman Filter 1960s Hidden Markov Model -1961 N

    有名どころな機械学習手法の年表 - 木曜不足
  • The Learning Behind Gmail Priority Inbox読んだメモ - 糞糞糞ネット弁慶

    The Learning Behind Gmail Priority Inbox(pdf) GmailにおけるPriority Inbox(日語だと優先トレイ)に関する論文(というよりもメモ書き)。 簡単なまとめ モデルはpassive-aggressive(PA-2) 分類というよりスコアとその閾値で判別 Feature Featureの量は多いがカテゴリ分類できる。 Social features : 送信者と受信者間の交流(例:送信者のメールの何割を受信者が読んだか) Content features : 受信者のメールに対する行動に対応するようなヘッダーや最近の単語?(recent term) Thread features : ユーザがそのスレッドを始めたかどうかみたいな情報 Label features : ユーザのフィルタによって付けられたラベルの情報を分析 これらfeat

    The Learning Behind Gmail Priority Inbox読んだメモ - 糞糞糞ネット弁慶
    mooz
    mooz 2011/01/08
    passive-aggressive (PA-2), 分類として解くよりランキングして閾値で分ける方が良い
  • 敵対的学習 - 機械学習の「朱鷺の杜Wiki」

    敵対的学習 (adversarial learning)† スパムメールの検出や,アクセスログを利用したネットワークからの侵入検出に機械学習技術が利用されている.すると,送信や侵入を企てる敵対者 (adversary) は,意図的に入力パターンを変更して,検出を回避しようとする.こうした,敵対的な環境下での利用を想定した機械学習の研究は敵対的学習 (adversarial learning) や 敵対的環境下での機械学習 (machine learning in adversarial environments) と呼ばれる. 敵対者の攻撃を検出する識別器の頑健性の評価や強化する,敵対者側の立場から識別器を回避する,そして防御側と識別器の間のゲーム理論の立場からの均衡の考察などの研究がある. ここでは,攻撃側の攻撃可能性についての文献1の研究を紹介する. スパムフィルタなどの分類器があり,

  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • 1