[B! Research] [7ページ] Kshi_Kshiのブックマーク

Kshi_Kshi id:Kshi_Kshi

Researchに関するKshi_Kshiのブックマーク (224)

http://ocw.u-tokyo.ac.jp/courselist/504.html?teachcat=2
Kshi_Kshi 2011/12/31
講義

Research
リンク
NEC(Japan)
NEC ESGデータブック2024 社会とNECのサステナブルな成長を支える取り組みを、4つの要素「ガバナンス」「戦略」「リスク管理」「指標・目標」で紹介
Kshi_Kshi 2011/12/31
Research

データマイニング

機械学習
リンク
強化学習とは？(What is Reinforcement Learning?)
強化学習の概要，応用上の利点，適用例，基礎理論，代表的手法，応用に必要な技術などの説明。本ページの記述は下記の解説記事をもとにWEB用に修正したものである：木村元，宮崎和光，小林重信：強化学習システムの設計指針，計測と制御, Vol.38, No.10, pp.618--623 (1999), 計測自動制御学会. 6 pages, postscript file, sice99.ps (1.31MB) PDF file, sice99.pdf (148KB) 第１章：強化学習の概要 1.1 強化学習 (Reinforcement Learning) とは? 1.2 制御の視点から見た強化学習の特徴 1.3 応用上期待できること第２章：強化学習の適用例：ロボットの歩行動作獲得第３章：強化学習の基礎理論 3.1 マルコフ決定過程(Markov decision proc
Kshi_Kshi 2011/12/31
Research

強化学習
リンク
Dirichlet Distribution, Dirichlet Process and Dirichlet Process Mixture
Kshi_Kshi 2011/12/26
ディレクレ分布

Research

Slide
リンク
Visualizing the Dirichlet
Random thoughts of a computer scientist who is working behind the enemy lines; and lately turned into a double agent. Last week, while working with Foster Provost and Xiahoan Zhang, one of our PhD students, we were trying to understand the internals of the Latent Dirichlet Allocation. In particular, we were getting strange results from the LDA-C program by David Blei, and we wanted to figure out w
Kshi_Kshi 2011/12/26
Wikipedia-ディレクレ分布の記事を書いた人のブログ記事

Research
リンク
木曜不足
9月24日に「図解即戦力 ChatGPT」という本が出ます。タイトルは ChatGPT ですが、中身は大規模言語モデルの仕組みを解説する本になっています。図解即戦力　ChatGPTのしくみと技術がこれ1冊でしっかりわかる教科書作者:中谷秀洋技術評論社Amazon ChatGPTなどのAIを扱った入門書はすでに数え切れないほど出ており、何番煎じ？　柳の下にもうドジョウ残ってないでしょ？　と突っ込まれたら返す言葉もないですが（苦笑）、同じジャンルの他の本とは異なる特長を備えるように書いたつもりです。大規模言語モデル（生成AI）は情報科学や機械学習、自然言語処理、数学などさまざまな技術や分野が複合した複雑な体系を持ちます。そのことを指して「大規模言語モデルは総合格闘技」とも言われたりします。しかし、実際に『総合格闘技』として扱った入門書、つまり関係するさまざまな技術にわたってAIを解説す
Kshi_Kshi 2011/12/26
id: n_shuyo さんのLDAについての記事.

Research

機械学習

LDA
リンク
生成モデル - 機械学習の「朱鷺の杜Wiki」
生成モデル (generative model) / 識別モデル (discriminative model)† クラス分類を解くための手法は識別モデルと生成モデルに分けられる．データとクラスの確率変数をそれぞれ \(X\) と\(C\) で表す．パラメータは \(\theta=(\theta_1,\theta_2)\)．生成モデル (generative model) \(X\) と\(C\) の結合確率をモデル化： \[\Pr[X,C|\theta]=\Pr[X|C,\theta_1]\Pr[C|\theta_2]\] パラメータはデータ集合とパラメータの同時確率を最大化するように学習： \[\Pr[\{x_i,c_i\}_i^N,\theta]=\Pr[\theta]\prod_i^N\Pr[x_i,c_i|\theta]=\Pr[\theta]\prod_i^N\Pr[x_i
Kshi_Kshi 2011/12/26
生成モデル

Research

機械学習
リンク
Dirichlet distribution - Wikipedia
The support of the Dirichlet distribution is the set of K-dimensional vectors whose entries are real numbers in the interval [0,1] such that , i.e. the sum of the coordinates is equal to 1. These can be viewed as the probabilities of a K-way categorical event. Another way to express this is that the domain of the Dirichlet distribution is itself a set of probability distributions, specifically the
Kshi_Kshi 2011/12/26
ディレクレ分布

Research
リンク
パープレキシティ
パープレキシティ情報処理辞書 > パープレキシティ英語：perplexity 日本語：パープレキシティ (パープレキシティ) 分野：自然言語処理説明：パープレキシティ(PP)は情報理論の指標であり、エントロピー(H)の２のべき乗として定義される。n-gram言語モデルの評価基準として用いるときは、評価用の文集合（長さL）に対して以下の通りに計算される。一般的にはパープレキシティが低いとモデルは評価文集合をうまくモデリングできていることを意味する。しかし、低いパープレキシティは必ずしもうまく機能する言語モデルと同等であるとは限らない。言語モデルの唯一の正確な評価基準はタスクで誤差が下がるかどうかである。参考文章：英語：http://en.wikipedia.org/wiki/Perplexity
Kshi_Kshi 2011/12/26
指標-パープレキシティ

Research
リンク
Google Sites: Sign-in
Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode
Kshi_Kshi 2011/12/17
機械学習とか勉強会のページ

Research
リンク
http://yattemiyou.net/docs/lda_gibbs.pdf
Kshi_Kshi 2011/12/15
まとめ

Research

LDA
リンク
機械学習はじめよう記事一覧 | gihyo.jp
運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。
Kshi_Kshi 2011/12/15
Research

機械学習

あとで読む
リンク
Latent Dirichlet allocation - Wikipedia
One application of LDA in machine learning - specifically, topic discovery, a subprobl em in natural language processing – is to discover topics in a collection of documents, and then automatically classify any individual document within the collection in terms of how "relevant" it is to each of the discovered topics. A topic is considered to be a set of terms (i.e., individual words or phrases) th
Kshi_Kshi 2011/12/15
ＬDA-wiki

Research

LDA

機械学習
リンク
probabilistic latent semantic analysis - 機械学習の「朱鷺の杜Wiki」
probabilistic latent semantic analysis (pLSA)† 文書と単語など，離散2変数の計数データの生成モデル．文書(document)：\(d\in\mathcal{D}=\{d_1,\ldots,d_N\}\)，語(word)：\(w\in\mathcal{W}=\{w_1,\ldots,w_M\}\)，潜在変数の話題(topic)：\(z\in\mathcal{Z}=\{z_1,\ldots,z_K\}\) を使った文書と単語の生成モデルがpLSA (probabilistic latent semantic analysis) \[\Pr[d,w]=\Pr[d]\sum_{z\in\mathcal{Z}}\Pr[w|z]\Pr[z|d]\] これは，文書と語について対称に定義することもできる \[\Pr[d,w]=\sum_{z\in\mat
Kshi_Kshi 2011/12/15
LDAの元になったアルゴリズム

Research

LDA

機械学習
リンク
Gibbsサンプラー - 機械学習の「朱鷺の杜Wiki」
Gibbsサンプラー (Gibbs sampler)† 一度に一つの確率変数だけを更新するMCMCの一つであり，MCMC の中でも最もよく使われるものであろう．目的の分布から決まる条件付分布に従って乱数を発生させる．いわゆる rejection rate は 0 だが，確率変数の値がとどまる確率は 0 ではないので，Metropolis-Hastings法より必ずよく動くというわけではない． -- あかほ ↑
Kshi_Kshi 2011/12/15
ギブスサンプリング

Research

LDA

機械学習
リンク
[Gibbs Sampling（ギブスサンプリング）] by かうぱーと
いよいよGibbs Samplingについてのメモです。教科書などでは「ギブスサンプラー」と書かれている方が多いのですが、私はGibbs Samplingで習ったのでここではこれで通します。【Gibbs Samplingの手順】 #include <stdlib.h> #include <stdio.h> #include <math.h> #include "randlib.h" int main( void ) { // 母集団の平均値 double trueMean = 5.0; // 母集団の分散 double trueVar = 1.0; // 観測値数 int dataNum = 1000; // 観測値格納域 double y[dataNum]; // 観測値の平均 double xbar = 0.0; // 観測値の分散 double xvar = 0.0; // 事
Kshi_Kshi 2011/12/15
ギブスサンプリング

Research

LDA

機械学習
リンク
多変量正規分布をギブスサンプリングで - 木曜不足
引き続き「パターン認識と機械学習」(PRML) 11章予習中。 Gibbs サンプリング、これはもう試してみるしか。 syou6162 さんが試してはるの( http://d.hatena.ne.jp/syou6162/20090115/1231965900 )をなぞるだけでもいいんだけど、せっかくだから多次元一般化しよう。 r_mul_norm1 <- function(x, mu, Sig) { idx <- 1:length(mu); for(a in idx) { b <- idx[idx!=a]; # b = [1,D] - a s <- Sig[b,a] %*% solve(Sig[b,b]); # Σ_ab Σ_bb ^ -1 # (PRML 2.81) μ_a|b = μ_a + Σ_ab Σ_bb ^ -1 (x_b - μ_b) mu_a_b <- mu[a] + s
Kshi_Kshi 2011/12/15
ギブスサンプリング

Research

LDA

機械学習
リンク
PythonでLDAを実装してみる
Latent Dirichlet Allocationはテキストのような不連続データのための生成的確率モデル。入力はドキュメント。出力はドキュメントを特徴づける何か（tf-idfみたいなもん）。基本的なアイディアは、あるドキュメントは潜在的ないくつかのトピックが混合していて、それぞれのトピックは語の分布で特徴づけられている、ということ。論文[1]ではαとβというパラメータを用いてドキュメントが以下のように生成されると仮定している。ドキュメントのトピックの分布θがディリクレ分布Dir(α)に基づいて選ばれる。ドキュメントの語数N個になるまで以下を繰り返す。トピックznが多項分布Mult(θ)に基づいて選ばれる。単語wnが確率p(wn|zn,β)で選ばれる。ただし、トピックzの数をk個、単語wの種類をV個とすると、パラメータαはk次元のベクトル、βはk x V次元の行列でβij=
Kshi_Kshi 2011/12/15
LDAを実装してみた

Research

LDA

機械学習

Python
リンク
Latent Dirichlet Allocations の Python 実装 - 木曜不足
LDA とは "Latent Dirichlet Allocation"。文書中の単語の「トピック」を確率的に求める言語モデル。「潜在的ディリクレ配分法」と訳されていることもあるが、その名前だと「それってなんだっけ？」という人のほうが多そうｗ。各単語が「隠れトピック」(話題、カテゴリー)から生成されている、と想定して、そのトピックを文書集合から教師無しで推定することができる。特徴は、果物の apple と音楽の apple とコンピュータ関連の apple を区別することが出来る(ことが期待される)という点。そのために、どのトピックを生成しやすいかという分布を各文章も持つ。細かい話は略。結果の見方としては、定量的にはパープレキシティを見るし(一般に小さいほどいい)、定性的には各トピックがどのような単語を生成するか、その確率上位のものを見てふむふむする。この「各トピックが生成する単語」
Kshi_Kshi 2011/12/15
LDAを実装してみた

Research

LDA

機械学習

Python
リンク
ディリクレ分布 - Wikipedia
ディリクレ分布（ディリクレぶんぷ、英: Dirichlet distribution）は、連続型の確率分布である。ベータ分布を多変量に拡張して一般化した形をしており、そのため多変量ベータ分布とも呼ばれる。ディリクレ分布の確率密度関数は、同時に発生することのない個の事象がそれぞれ回発生したときに、各事象の起こる確率がである確率を与える（ただし、は整数である必要はない）。つまり、試行の回数が無限大なら各事象の発生の相対頻度はになるが、試行回数が有限だと、そこにずれが生じる。そのずれを表すモデルである。
Kshi_Kshi 2011/12/15
ディリクレ分布

Research
リンク
前のページ 3 4 5 6 7 8 9 10 11 12 次のページ