seikennのブックマーク / 2011年1月20日

この世の不条理（都条例）に悩んだ小学六年生の少女が出した結論

みつばとさん（@mituba_To）のプロフィール都条例改正案が成立したら、自殺する小学六年生です。私はマンガ規制に反対、というより、マンガ規制しようとする頭の悪い大人たちの世界で生きていたくない、という絶望派です。死ぬまで残り数日です。

seikenn 2011/01/20

リンク

私のブックマーク「Web構造マイニングとWeb視覚化」

１．はじめに Webデータにおけるパターン発見をデータマイニング技術を用いて行なうことをWebマイニングと呼ぶ。Webマイニングは、自然言語処理や機械学習、データマイニングなどの人工知能の分野にとどまらず、情報検索やデータベースなど幅広い分野と関連する複合的な研究分野である。注目するWebデータの種類によって、Webマイニングは以下の3つに分類される。 1) Webページのコンテンツに注目し、自然言語処理やデータベースのアプローチを用いて、テキストマイニングによる情報抽出や半構造データにおける検索のモデル化などを目指すWeb内容マイニング 2) Webページ間を結ぶハイパーリンクによって構成されるグラフ構造に注目し、関連ページの発見や重要ページのランキング、グラフ構造のモデル化などを目指すWeb構造マイニング 3) Webページの閲覧によって生じる(サーバー側やクライアント

seikenn 2011/01/20

Web構造マイニング

リンク

頻繁に使用している便利なお役立ち系ブックマークレット・19個 - かちびと.net

個人的によく使っているブックマークレットのご紹介。どれも便利で役立つので手放せないものになっています。Web制作をしている人なのでそれ系に偏っているかも知れませんが、多少でも参考になれば幸いです。ほとんど有名なものだとは思いますが・・・というわけで、便利なお役立ちブックマークレットをいろいろとご紹介。手軽なのが素敵ですよね。以前書いてから大分経ちますので改めてエントリーしますが、少々Web制作系に偏っています。順不同です。 CSS構成を一目で確認出来るXRAY 何かと便利なXRAY。クリックした要素の詳細を教えてくれます。Web屋さんはご存じの方も多いのでは。 XRAY 今見ているページをiPhoneで「後で見る」KeepItWith.Me 最初の設定がすごくストレスだったのですが、設定後の便利さが感動したのでご紹介。PCで見ているページでブックマークレットを使って自分のiPhoneに送

seikenn 2011/01/20

ブックマークレット

リンク

条件付き確率場のマルコフ性とか準マルコフ連鎖とか - 射撃しつつ前転改

実装する上ではどうでもいい、言葉の定義の問題のところに足を突っ込みつつあるような気もするけれど、CRFについて調べていたらどんどん混乱してきたので、現在のところの理解をまとめてみる。たぶん、突っ込みどころはいっぱいありますので、突っ込んで頂けると幸いです。 CRFは入力Xと出力Yの組をたくさん与えることで、未知のXに対してもP(Y|X)を計算できるようにするモデルである。ただし、Yは構造を持つ（この構造を持つというのがどう言うことかもややこしくて今調べているのだが、こちらはとりあえず棚上げする）ものとする。 CRFはであるということしか規定せず、自然言語処理ではlinear chain CRFとsemi markov CRFの2つ、特にlinear chain CRFがよく使われている。 linear chain CRFは出力Yが一本鎖の構造になっているところが特徴である。linear c

seikenn 2011/01/20

リンク

条件付確率場 - 機械学習の「朱鷺の杜Wiki」

関連文献† John Lafferty, Andrew McCallum, and Fernando Pereira "Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data" ICML2001 GoogleScholarAll:Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data C.Sutton and A.McCallum "An Introduction to Conditional Random Fields for Relational Learning"：&amazon(0262072882);の一部 Book/Probabili

seikenn 2011/01/20

CRF

リンク

Dirichlet分布 - 機械学習の「朱鷺の杜Wiki」

Dirichlet分布 (Dirichlet distribution)† 実数ベクトル \(\mathbf{x}=(x_1,\ldots,x_k)\) とパラメータベクトル \(\mathbf{\alpha}=(\alpha_1,\ldots,\alpha_k)\) に対して，Dirichlet分布の確率密度関数は \[f(\mathbf{x},\mathbf{\alpha})=\frac{1}{B(\mathbf{\alpha})}\prod_{i=1}^k {x_i}^{\alpha_i-1}\] ただし，\(x_i\ge 0\) かつ \(\sum_{i=1}^k x_i=1\)， \(\alpha_i\ge 0\)， \(B(\mathbf{\alpha})\) は多変量ベータ関数． \(A=\sum_i^k\alpha_i\) として， i番目の要素の平均：\(\frac{\a

seikenn 2011/01/20

ディリクレ分布

リンク

ディリクレ分布まとめ - あらびき日記

この記事は abicky.net のディリクレ分布まとめに移行しました

seikenn 2011/01/20

ディリクレ分布

リンク

ディリクレ分布 - Wikipedia

ディリクレ分布（ディリクレぶんぷ、英: Dirichlet distribution）は、連続型の確率分布である。ベータ分布を多変量に拡張して一般化した形をしており、そのため多変量ベータ分布とも呼ばれる。ディリクレ分布の確率密度関数は、同時に発生することのない個の事象がそれぞれ回発生したときに、各事象の起こる確率がである確率を与える（ただし、は整数である必要はない）。つまり、試行の回数が無限大なら各事象の発生の相対頻度はになるが、試行回数が有限だと、そこにずれが生じる。そのずれを表すモデルである。定義と性質[編集] をパラメータ、実数ベクトルを確率変数とするときの次ディリクレ分布の確率密度関数は以下の式で定義される。ここではK-1次元単体上の点であり、、を満たす。また、であり、は多変量に拡張したベータ関数で、以下の式で定義される。このとき、の期待値は、同じく分散

seikenn 2011/01/20

ディリクレ分布

リンク

probabilistic latent semantic analysis - 機械学習の「朱鷺の杜Wiki」

probabilistic latent semantic analysis (pLSA)† 文書と単語など，離散2変数の計数データの生成モデル．文書(document)：\(d\in\mathcal{D}=\{d_1,\ldots,d_N\}\)，語(word)：\(w\in\mathcal{W}=\{w_1,\ldots,w_M\}\)，潜在変数の話題(topic)：\(z\in\mathcal{Z}=\{z_1,\ldots,z_K\}\) を使った文書と単語の生成モデルがpLSA (probabilistic latent semantic analysis) \[\Pr[d,w]=\Pr[d]\sum_{z\in\mathcal{Z}}\Pr[w|z]\Pr[z|d]\] これは，文書と語について対称に定義することもできる \[\Pr[d,w]=\sum_{z\in\mat

seikenn 2011/01/20

PLSA

リンク

PythonでPLSAを実装してみる

probabilistic latent semantic analysis (PLSA)は、・文書dがP(d)で選ばれる・潜在変数zがP(z|d)で選ばれる・語wがP(w|z)で生成されるというプロセスを経て、結果として(d,w)のペアが観測されるという文書と語の生成モデル。式で表すと (1) となる。P(d,w)の尤もらしい確率分布を見つけたい。対数尤度関数は (2) となる。n(d,w)は語wが文書dに出現する回数。この式は訓練データn(d,w)（;どの語がどの文書に何回出現したか）が尤もらしい確率分布P(d,w)に従うとき最大になる。ベイズの定理を用いると (3) となることを利用して、この尤度関数を最大化するためにEMアルゴリズムを用いて実装してみる。（過学習を回避するために文献ではTempered EM (TEM)を用いている。）尤度関数が収束するまで以下のE-ste

seikenn 2011/01/20

PLSA

リンク

Gibbsサンプラー - 機械学習の「朱鷺の杜Wiki」

2023-12-04 python 2023-11-22 PRML/errata2 2023-11-21 PRML/errata1 2023-11-01 しましま/IBIS2023 2023-10-29 IBIS 2023-06-16 人工知能学会全国大会 2023-06-11 しましま/人工知能学会全国大会2023 2023-03-28 Book 2022-11-27 朱鷺の社 2022-11-24 しましま/IBIS2022 2022-07-08 AutoTicketLinkName 2022-06-17 しましま/人工知能学会全国大会2022 2021-11-13 しましま/IBIS2021 2021-10-29 回帰分析 2021-06-11 しましま/人工知能学会全国大会2021 2021-03-07 MenuBar 2021-02-15 python/numpy 2020-12

seikenn 2011/01/20

ギブスサンプラー

リンク

URLをちょっといじるだけでGmailのマルチアカウントを素早く切り替える方法 | ライフハッカー・ジャパン

デスク配線がスッキリ。Ankerの全部入り12 in 1モニタースタンドが突然8,250円OFFされてた #Amazonセール

seikenn 2011/01/20

Gmail

リンク

ステミングとは？

ステミングとは？ 2008-01-20-1 [IIR][NLP][Algorithm][Programming] 「Introduction to Information Retrieval」[1]の第二章（次回の輪講の範囲）の2.2.4に出てくるステミング (Stemming) の話題をまとめました。 § 英語などの欧米系の言語では、意味的には同じ単語が語形変化により表層文字列が異なることがある。例えば、"retrieves", "retrieved", "retrieving", "retrieval" などで[2]、実用上これらを同じ意味のものと見なしインデックス作成時に同じ単語として扱いたいという要求がある。ステミング (stemming) はこのような語形変化を取り除き同一の単語表現に変換する処理である。ステミングの手法として、ポーターのアルゴリズム (Port

seikenn 2011/01/20

ステミング

リンク

ステミング - Google 検索

ステミング ... 検索エンジンのアルゴリズムで、語形が変化する単語の語幹でマッチングを行うこと。英語などの言語には、意味的には同じ単語で語形が変化するものがある。

seikenn 2011/01/20

検索結果

リンク

Slim3 pluginでScenic3の使い方 - やさしいデスマーチ

Slim3には簡単にプロジェクトを作成する為に使えるEclipse pluginがあります。@tomotaro1065 さんが中心になって作られていますが、ご厚意でScenic3の対応もしていただいています。ですが、自分で使ってみて使い方が解らないのではないか？と気付きました。そこで、Scenic3の仕組みを含めてチュートリアルを書く事にします。内容は後でドキュメントに反映させるつもりです。 Scenic3ってなにさ？ scenic3は t2 frameworkのようなPageクラスをslim3で実現するslim3の拡張ライブラリです。 Scenic3はSlim3を薄くラップしたライブラリで、Slim3の設計思想である「"Simple" and "Less Is More"」を踏襲しつつ、1つのPageクラスに複数のアクションメソッドを記述できるようになります。spin-upへの影響は最小

seikenn 2011/01/20

Slim3

リンク

まとめブログアンテナ｜まとめブログ更新情報と過去ログ検索

著作権について当サイトの文章に関する著作権等は各権利所有者に帰属し、著作権法で認められた範囲で引用として掲載させていただいております。万が一問題がございましたら、お手数ですが問題箇所についてお問い合わせください。トップ画像を描いて頂きました

seikenn 2011/01/20

リンク

「喫茶店プログラミング」のための環境構築(VMwarePlayer + CentOS5.5+Apache2.2.3+MySQL5.5.8+PHP5.3.5+Ruby1.8.7+おまけ) - blog@sotm.jp

ソフトウエア Windows 7 Home Premium (64bit)VMware Player 3.1.3 build-324285Tera Term 4.67 作る物 CentOS # cat /etc/redhat-release CentOS release 5.5 (Final) # uname -a Linux localhost.localdomain 2.6.18-194.32.1.el5 #1 SMP Wed Jan 5 17:52:25 EST 2011 x86_64 x86_64 x86_64 GNU/Linux Apache # /usr/sbin/httpd -v Server version: Apache/2.2.3 Server built: Aug 30 2010 12:28:40 MySQL # mysql --version mysql Ver 1

seikenn 2011/01/20

リンク

スマートフォン関連の基礎勉強法 : LINE Corporation ディレクターブログ

こんにちは、ブロググループの飯田 (@iishun) です。 2011 年はさらにスマートフォン市場の拡大が加速すると云われています。弊社でも 2010 年 10 月にライブドア全体のスマートフォン関連事業を推進していくスマートフォングループが設立されました。が、各コンテンツのスマートフォンサイト・アプリは各グループのコンテンツ担当が運用するのでスマートフォン関連の知識は必須になります。そこで今回は僕がここ最近実践しているスマートフォンに関する勉強法を、実際に使用した参考書籍と共に紹介してみます。これから「スマートフォンの事を勉強しなきゃ！」と思った人に役に立ってもらえればなと思います。 1. HTML5/CSS3 の特徴を知る HTML5/CSS3 がスマートフォン用のマークアップ言語というわけじゃありませんが、スマートフォンのウェブサイト (Webkit 系) は HTML5/CS

seikenn 2011/01/20

リンク

はてなブックマーク年間ランキング TOP100 の推移 - Cube Lilac

Delicious が閉鎖するとかしないとかで話題になったときに，個人的には集合知の実現方法として期待された SBM (Social BookMark) も終焉を迎えるのかなぁとか考えていましたが，上記のニュースを受けて，国内の SBM サービス一番手であるはてなブックマークも「大丈夫なのか？」と存続を心配する声もぽつぽつ聞こえました．そんな時に，ちょうど歴代はてブ多い順 / 月ごとのランキング 2017年9月 1位～50位と言う Web サイトを発見したので，今回はこの Web サイトに列挙されてある各年のはてなブックマーク年間ランキング TOP100 のブックマーク数をグラフ化して，はてブが Web サービスとしてどの位成長し続けているのか見てみる事にします．尚，各年の上位 10件位は何年もの間ずっとブクマし続けられている記事があるので TOP10 位までは除外して見るほ

seikenn 2011/01/20

リンク

フィルタリング・カテゴライズ用リンク集 - Cube Lilac

はてなブックマーク年間ランキング TOP100 の推移の最後に触れた「はてブ衆愚化」の話に関して．「はてブは終わった終わった」みたいなのは2年以上まえから言われてるんだろうけど、最近は本格的に面白い情報が見つからなくなった気がする。アフィリエイトというインセンティブのある2chまとめ系の躍進によって、情報過多に陥ってはてブの地位が相対的に下がったという考え方もできるけど。ただ2chまとめ系のブログの情報は流し読み以上の価値を感じなくて、ただの懐古かもしれないけど、興味深い記事が多かった昔のはてブのようなサイトを見たいという欲求がある。いまさらはてブ衆愚化の話。ホットエントリに挙がってくる記事に関して現状発生している問題の一つとして，特定のジャンル・スタイル（所謂，定番サイト）のものが非常に多くピックアップされてしまうと言うものがあります．代表的なものとしては，痛いニュース(ﾉ∀`

seikenn 2011/01/20

リンク

モバイル開発に欠かせないテストツール14選

Adobe Device Central CS5 Adobe CS5 をパッケージ購入すると一緒についてくるモバイルデバイスのテスト環境。様々なエミュレーターが存在しますが、オールインワンで素早くテストがしたい場合はこちらがオススメです。特に Flash を活用したモバイルサイトをテストするのであれば欠かせない存在です。 Android SDK Javaで開発されているので、Mac, Windows, Linux で動作する公式のエミュレーター。2011年1月現在、Android OS 1.1 〜 2.3 までのテストが可能。エミュレーターは実際のスマートフォンと同じ動作をするので、ディフォルトのブラウザだけでなく、Opera Mini や Firefox など他のブラウザをインストールしてテストすることができます。 iOS SDK XCode も含め諸々ダウンロードしなければいけませんし

seikenn 2011/01/20

リンク

年末だし面白いWeb漫画教えろ

■編集元：ネトゲ実況板より「年末だし面白いWeb漫画教えろ」 1 既にその名前は使われています :2010/12/26(日) 23:35:23 ID:geTDYqV3 既にその名前は使われています :2010/12/26(日) 23:35:44 ID:geTDYqV3 まずはおれからいくぜハナムラさんじゅっさい Pixivで趣味的に始めた連載が無料コミックサイト「漫画街」での web連載を経て、来年の1/11に単行本リリース。絵のクオリティーといいマンガ作りのうまさといい、しかも毎週更新という神仕様。ローグ-運命の洞窟- 1981年に発売されたダンジョン探索型のコンピュータRPG「ローグ」を漫画化。ローグを知らない人でも普通に面白く読める。 4 既にその名前は使われています :2010/12/26(日) 23:38:03 ID:6D0ejMMv 胎界主 5

seikenn 2011/01/20

web漫画

リンク

グーグル発「Hadoop」、日本企業も利用へ

Hadoopは、グーグルが検索エンジン用に開発したバッチ処理システムを基に開発された、オープンソースソフトだ。グーグルが開発した分散ファイルシステム「Google File System（GFS）」を模した「Hadoop Distributed File System（HD FS）」と、データ処理機構「MapReduce」を模した「Hadoop MapReduce」で構成する。米国では米VISAや米JPモルガン・チェースのような大手金融機関が、バッチ処理にHadoopを使用する。そのHadoopがいよいよ、日本企業でも使われ始めた。例えば楽天は、ある商品に対するお薦め商品をリストアップする「レコメンド処理」にHadoopを使用する。NTTデータは、全国の渋滞情報をリアルタイムに可視化するシステムの構築にHadoopを採用した。三菱UFJインフォメーションテクノロジーもHadoopを使っ

seikenn 2011/01/20

hadoop

リンク

地獄のミサワのロックマンエロ同人誌がシュールすぎワロタｗｗｗ｜やらおん！

1 名前：以下、名無しにかわりましてVIPがお送りします[] 投稿日：2011/01/19(水) 11:00:05.17 ID:HAk1zggH0 http://dl6.getuploader.com/g/nasinasinasi/62/vlero036282.jpg http://dl6.getuploader.com/g/nasinasinasi/63/vlero036283.jpg http://dl6.getuploader.com/g/nasinasinasi/64/vlero036284.jpg http://dl6.getuploader.com/g/nasinasinasi/65/vlero036285.jpg http://dl6.getuploader.com/g/nasinasinasi/66/vlero036286.jpg 7 名前：以下、名無しにかわりましてVIP

seikenn 2011/01/20

くそわろたw

リンク

2万円のキーボード一体型PC登場、新顔のx86 CPU「PMX-1000」搭載、SDカードからも起動可能

seikenn 2011/01/20

これいいね

リンク

はてなブックマーク

タグ

2011年1月20日のブックマーク (25件)

この世の不条理（都条例）に悩んだ小学六年生の少女が出した結論

私のブックマーク「Web構造マイニングとWeb視覚化」

頻繁に使用している便利なお役立ち系ブックマークレット・19個 - かちびと.net

条件付き確率場のマルコフ性とか準マルコフ連鎖とか - 射撃しつつ前転改

条件付確率場 - 機械学習の「朱鷺の杜Wiki」

Dirichlet分布 - 機械学習の「朱鷺の杜Wiki」

ディリクレ分布まとめ - あらびき日記

ディリクレ分布 - Wikipedia

probabilistic latent semantic analysis - 機械学習の「朱鷺の杜Wiki」

PythonでPLSAを実装してみる

Gibbsサンプラー - 機械学習の「朱鷺の杜Wiki」

URLをちょっといじるだけでGmailのマルチアカウントを素早く切り替える方法 | ライフハッカー・ジャパン

ステミングとは？

ステミング - Google 検索

Slim3 pluginでScenic3の使い方 - やさしいデスマーチ

まとめブログアンテナ｜まとめブログ更新情報と過去ログ検索

「喫茶店プログラミング」のための環境構築(VMwarePlayer + CentOS5.5+Apache2.2.3+MySQL5.5.8+PHP5.3.5+Ruby1.8.7+おまけ) - blog@sotm.jp

スマートフォン関連の基礎勉強法 : LINE Corporation ディレクターブログ

はてなブックマーク年間ランキング TOP100 の推移 - Cube Lilac

フィルタリング・カテゴライズ用リンク集 - Cube Lilac

モバイル開発に欠かせないテストツール14選

年末だし面白いWeb漫画教えろ

グーグル発「Hadoop」、日本企業も利用へ

地獄のミサワのロックマンエロ同人誌がシュールすぎワロタｗｗｗ｜やらおん！

2万円のキーボード一体型PC登場、新顔のx86 CPU「PMX-1000」搭載、SDカードからも起動可能

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス