第33回R勉強会@東京(#TokyoR)の発表内容です。 http://atnd.org/events/42438 当日見ながら実行できるように先行公開します。

第33回R勉強会@東京(#TokyoR)の発表内容です。 http://atnd.org/events/42438 当日見ながら実行できるように先行公開します。
tokyor-document - Presentation Transcript Rによる文書モデルの可視化 ~ディリクレ分布、混合ディリクレ分布、LDA #tokyoR @nokuno 自己紹介 2 Twitter: @nokuno はてな:id:nokuno 自然言語処理勉強会を主催(第2回は9/25開催) PRML/R/Python/Hadoopなど 2002~2006:コミケで同人ゲーム売ってた 2007~2008:未踏でSocial IMEの開発 2009~現在:Web業界勤務(←今ここ) 今日の話題 3 文書モデルとは Wikipediaの可視化 生成モデルの可視化 ディリクレ分布 混合ディリクレ分布 LDA 文書モデルとは 4 文書の生成確率をモデル化 単語の多項分布を利用するのが一般的 文書を、その文書が含む単語の割合で
SVD入門 SVDについてはwikipediaやteramonagi大先生のRcppEigen & singular value decompositionを参照していただきたく思います。 今回やっていることを手順ごとに簡単に書くと、 1.行列XをX=UΣV^Tと分解 2.情報量の多い上位k個の特異値を用いk列の正規直交ベクトルV_kを得る 3.XV_kを計算することで情報量を圧縮した空間に元々の行列XをX_kに写像する 情報が落ちるというマイナス面はあるのですが、ノイズ軽減、計算時間削減などの効果もあります。 今回はディスプレイ広告をクリックするか否かを広告の情報などから学習するモデルの構築をSVDを使った例として挙げています。 といっても、ノイズの多いスパースなデータをSVDで圧縮してC-SVM(ソフトマージンSVM)にかけるだけの簡単なお仕事です。 今考えると発生させたデータはスパー
AndroVMがいつの間にかGenymotionに名前変わってました。 Genymotion - BOOST YOUR APP TESTING! Simple, practical and effective. 「x86エミュレータとそんなに変わらないんでしょ」と思っていましたが、これを機にインストールして動かしてみたらサックサクのヌルヌルで驚きました。 もしかして、実機より速いのでは?と思って2、3000行の比較的小規模なライブラリでconnectedInstrumentTestを実行して、その実行時間を比較してみました。 結果は環境によって結構変わると思うので、あくまで目安で。 実機よりも速かった しかもエミュレータだとGoogle Playのアプリが落とせなかったりするのですが、Googleアカウントを登録して同期することもできるし、アプリを落として実機より軽快な環境で遊ぶこともで
In optimization, line search is a basic iterative approach to find a local minimum of an objective function . It first finds a descent direction along which the objective function will be reduced, and then computes a step size that determines how far should move along that direction. The descent direction can be computed by various methods, such as gradient descent or quasi-Newton method. The step
2.4. Biclustering# Biclustering algorithms simultaneously cluster rows and columns of a data matrix. These clusters of rows and columns are known as biclusters. Each determines a submatrix of the original data matrix with some desired properties. For instance, given a matrix of shape (10, 10), one possible bicluster with three rows and two columns induces a submatrix of shape (3, 2): >>> import nu
Live Nation says its Ticketmaster subsidiary was hacked. A hacker claims to be selling 560 million customer records. An autonomous pod. A solid-state battery-powered sports car. An electric pickup truck. A convertible grand tourer EV with up to 600 miles of range. A “fully connected mobility device” for young urban innovators to be built by Foxconn and priced under $30,000. The next Popemobile. Ov
構造やクラス名、プロパティの記述方法などをルール付ける「CSSコーディング ガイドライン」策定のための参考記事を紹介します。 チームでの共有、コーディング効率やメンテナンス性などの改善のためにも、これを機会にガイドラインを導入してみてはいかがでしょうか。 コーディング規約を作ろう"制作チームの規模が大きくなればなるほど、コードの統一性は大切" ▶ コーディング規約を作ろう Webクリエイターボックス コーディング規約を見直すうえで抑えておくべきポイントを紹介。 チェックポイントコーディング規約に含むべき項目 ・ディレクトリやファイルの階層・名前 ・記述順やインデント、単位などのフォーマット ・ID,classなどの命名規則 ・対応ブラウザー CSSガイドラインを翻訳してみた"多くの開発者が関わる場合、メンテナンス可能、コード見通し良く、拡張可能にするために統一された方法を用いることが重要"
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く