[B! データマイニング] nextbigthingのブックマーク

nextbigthing id:nextbigthing

データマイニングに関するnextbigthingのブックマーク (15)

Zansa | 学生が主催する統計・データマイニングの勉強会
2014年10月16日(木)に、第19回Zansa勉強会が行われました。今回は、@horihorio さん、@takeshi0406 さん、@aki_n1wa さんにご講演いただきました。素晴らしい発表をありがとうございました。以下は、アップしていただいた資料です。『統計と会計』@horihorio さん
nextbigthing 2012/12/20
データマイニング

統計
リンク
ニューラルネットの逆襲 - Preferred Networks Research & Development
岡野原です。Deep Learningが各分野のコンペティションで優勝し話題になっています。Deep Learningは7、8段と深いニューラルネットを使う学習手法です。すでに、画像認識、音声認識、最も最近では化合物の活性予測で優勝したり、既存データ・セットでの最高精度を達成しています。以下に幾つか例をあげます。画像認識 LSVRC 2012 [html] 優勝チームスライド [pdf], まとめスライド[pdf] Googleによる巨大なNeuralNetを利用した画像認識（猫認識として有名）[paper][slide][日本語解説] また、各分野のトップカンファレンスでDeep Learningのチュートリアルが行われ、サーベイ論文もいくつか出ました。おそらく来年以降こうした話が増えてくることが考えられます。 ICML 2012 [pdf] ACL 2012 [pdf] CVPR
nextbigthing 2012/11/02
人工知能

論文

機械学習

データマイニング

deep learning
リンク
速水桃子「パターン認識と機械学習入門」
IBIS 2021 https://ibisml.org/ibis2021/ における最適輸送についてのチュートリアルスライドです。『最適輸送の理論とアルゴリズム』好評発売中！ https://www.amazon.co.jp/dp/4065305144 Speakerdeck にもアップロードしました: https://speakerdeck.com/joisino/zui-shi-shu-song-ru-men
nextbigthing 2012/10/20
機械学習

データマイニング
リンク
統計的機械学習における量子アニーリング
KDD2014勉強会: Large-Scale High-Precision Topic Modeling on Twitter
nextbigthing 2012/10/20
データマイニング

機械学習
リンク
統計的機械学習入門
統計的機械学習入門(under construction) 機械学習の歴史ppt pdf 歴史以前人工知能の時代実用化の時代導入ppt pdf 情報の変換過程のモデル化ベイズ統計の意義識別モデルと生成モデル次元の呪い損失関数, bias, variance, noise データの性質数学のおさらいppt pdf 線形代数学で役立つ公式確率分布情報理論の諸概念 (KL-divergenceなど) 線形回帰と識別ppt pdf 線形回帰正規方程式正規化項の導入線形識別パーセプトロンカーネル法ppt pdf 線形識別の一般化カーネルの構築法最大マージン分類器ソフトマージンの分類器 SVMによる回帰モデル SVM実装上の工夫クラスタリングppt pdf 距離の定義階層型クラスタリング K-means モデル推定ppt pdf 潜在変数のあるモデル EMアル
nextbigthing 2012/10/18
機械学習

データマイニング

アルゴリズム

統計
リンク
FrontPage - 情報論的学習理論と機械学習の「朱鷺の杜Wiki」
朱鷺の杜Wiki（ときのもりうぃき）† 朱鷺の杜Wikiは，機械学習に関連した，データマイニング，情報理論，計算論的学習理論，統計，統計物理についての情報交換の場です．これら機械学習関係の話題，リンク，関連事項，書籍・論文紹介などの情報を扱います．更新されたページを確認するにはRSSリーダを使って右下のRSSリンクをチェックするか，最終更新のページを参照してください．ページの中でどこが更新されたかを見るには，上の「差分」をクリックして下さい．数式の表示に MathJax を利用しています．数式の上でコンテキストメニューを使うと各種の設定が可能です．特に設定をしなくても数式は閲覧できますが，フォントをインストールすれば数式の表示がきれいで高速になります．詳しくは数式の表示のページを参照して下さい．ごく簡単なWikiの使い方がこのページの最後にあります．トップページやメニューなど
nextbigthing 2012/08/07
機械学習

データマイニング
リンク
［インタビュー］情報の新しい流れをつくりたい–東大のエンジニア集団が立ち上げた次世代マガジンサービスGunosy | Startup Dating [スタートアップ・デイティング]
情報を集約し最適化したものを届けるキュレーションサービスが注目を浴びている。そうした中、東大の学生エンジニア集団が立ち上げた「Gunosy」がある。2011年10月にサービスをリリースし、先日の5月上旬にリニューアルをおこない、現在ユーザ数が順調に伸びているサービスだ。そのGunosyの開発者である福島くん関くん吉田くんの3人にインタビューをおこない、Gunosy立ち上げの理由やサービスにかける思いなどの話を聞いてきた。 3人の出会いとGunosyのきっかけ Gunosyを立ち上げたのは、福島良典くん（東京大学工学研究科システム創成学科専攻修士2年）、関喜史くん（同大、工学系研究科技術経営戦略学専攻修士2年）、吉田宏司くん（同大、工学研究科技術経営戦略学専攻修士2年）の3人で立ち上げたサービスだ。 3人は東京大学のシステム創成学科知能社会システムコース出身というつながりだ。高専出身の関くん
nextbigthing 2012/06/08
gunosy

データマイニング
リンク
Tutorial_ja - bayon - Google Code
Code Archive Skip to content Google About Google Privacy Terms
nextbigthing 2012/03/27
クラスタリング

bayon

研究

データマイニング
リンク
Koichi Hamada
Senior Staff Research Engineer, Artificial Intelligence As a senior staff research engineer for Artificial Intelligence, I develop a broad range of mobile and online services utilizing AI, such as games, gaming platforms, entertainment content distributions. I have developed dozens of machine learning systems for hundreds of million users and accelerated services. For example, I have developed doz
nextbigthing 2011/12/12
データマイニング
リンク
iddy.jp
iddy.jp 2024 著作権. 不許複製プライバシーポリシー
nextbigthing 2011/12/12
データマイニング
リンク
データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します（この論文は@doryokujin君のポストで知りました、ありがとうございます！）。必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
nextbigthing 2011/11/24
データマイニング

研究
リンク
テキストマイニングのための機械学習超入門　一夜目 - あんちべ！
テキストマイニングに必要なパターン認識と機械学習について学びます。非常に初歩的な話から始めます。対象者は「テキストマイニングに興味があり、用いられる手法の中身を知りたい（けれど高度な数学は厳しい…）」というビジネスマンや学生さんです。数式は出来る限り「使います」。使わないと意味するところは理解できません。ただし、愚直に数式の一行一行を手計算で順を追って解いていきますし、必要な数学知識はその都度説明し、前提知識は求めませんので「数式出てくるの？じゃあついていけないのでは…」という心配は不要です。この記事の特徴は「機械学習の手法をやたら冗長な数式と過剰なまでの例を用いて、くどくどと同じ話を何度も説明する」ことです。筆者ことあんちべは純文系出身で、数学や統計学、プログラミングは全然学生時代やってこなかった上、業務でも機械学習を使うことなんて皆無、それどころか機械学習なんて言葉は就職してからよう
nextbigthing 2011/11/05
テキストマイニング

機械学習

データマイニング
リンク
類似度と距離 - CatTail Wiki*
２つのデータが似ている度合いを，類似度の大きさや距離の近さといった数値にしてあらわすことで，クラスタ分析や，k-近傍法，多次元尺度構成法(MDS)をはじめとするいろいろな分析を行うことが可能となる．ここでは，よく知られている類似度や距離について述べる．類似度という概念は，２つの集合の要素がまさにどれだけ似ているかを数量化したものであり，距離とは，要素同士の離れ具合，従って非類似度とちかい概念と考えてもよい．参考までに数学における距離の概念の定義を示すと，距離空間の定義 Sを１つの空でない集合とし，dをSで定義された2変数の実数値関数 d(SxS)　→　R が，以下の４条件（距離の公理） D1 ：（非負性）　任意のx,y∈Sに対して d(x,y)≧0． D2 ：（非退化性）　x,y∈Sに対し d(x,y)=0 　⇔　x=y． D3 ：（対称性）　任意のx,y∈Sに対して d(x
nextbigthing 2011/10/19
研究

データマイニング

クラスタリング

類似度

algorithm
リンク
機械学習 - 機械学習の「朱鷺の杜Wiki」
機械学習とは，Arther Samuel によれば「明示的にプログラミングすることなく，コンピュータに行動させるようにする科学」のことです．歴史的には，人工知能の研究分野の中で，人間が日々の実体験から得られる情報の中から，後に再利用できそうな知識を獲得していく過程を，コンピュータにおいて実現したいという動機から生じました．現在では，数値・文字・画像・音声など多種多様なデータの中から，規則性・パターン・知識を発見し，現状を把握や将来の予測をしたりするのにその知識を役立てることが目的となっています．しましまの私見に基づいて，機械学習の各種の問題を整理しました． ↑ 他分野との関連† 確率論：機械学習で扱うデータは，いろいろな不確定要素の影響を受けており，こうして生じた曖昧さを扱うために利用されます．統計：観測されたデータを処理する手法として長く研究されてきたため深い関連があります．特
nextbigthing 2011/09/05
機械学習

データマイニング

svm

wiki
リンク
Polaris -
Sorry, this page is written only in Japanese. Please contact me if you would like English information/translation of the software. データマイニングでは，外界で観測された現象をキーワード（シンボル）や数値に変換し，そのデータをコンピュータに与えます．コンピュータは，与えられたデータがどのような性質を持つのか計算し，データの中に埋もれている特徴的な事象を見出します．あたかもコンピュータが「この事象は興味深いなぁ」とデータに共感してユーザに結果を返しているように思えますが，そういう訳ではありません．現在のコンピュータは与えられたシンボルの意味や数値の大小の意味を理解することができません．例えば，「顔が白い」というパターンがマイニングで得られたとき，「顔」「白色」の
nextbigthing 2011/07/04
アルゴリズム

データマイニング
リンク
1