みつばとさん(@mituba_To)のプロフィール 都条例改正案が成立したら、自殺する小学六年生です。私はマンガ規制に反対、というより、マンガ規制しようとする頭の悪い大人たちの世界で生きていたくない、という絶望派です。死ぬまで残り数日です。
みつばとさん(@mituba_To)のプロフィール 都条例改正案が成立したら、自殺する小学六年生です。私はマンガ規制に反対、というより、マンガ規制しようとする頭の悪い大人たちの世界で生きていたくない、という絶望派です。死ぬまで残り数日です。
1.はじめに Webデータにおけるパターン発見をデータマイニング技術を用いて行なうこと をWebマイニングと呼ぶ。Webマイニングは、自然言語処理や機械学習、データ マイニングなどの人工知能の分野にとどまらず、情報検索やデータベースなど 幅広い分野と関連する複合的な研究分野である。 注目するWebデータの種類によって、Webマイニングは以下の3つに分類される。 1) Webページのコンテンツに注目し、自然言語処理やデータベースのアプローチを用いて、 テキストマイニングによる情報抽出や半構造データにおける検索のモデル化などを 目指すWeb内容マイニング 2) Webページ間を結ぶハイパーリンクによって構成されるグラフ構造に注目し、 関連ページの発見や重要ページのランキング、グラフ構造のモデル化などを 目指すWeb構造マイニング 3) Webページの閲覧によって生じる(サーバー側やクライアント
個人的によく使っているブックマークレットのご紹介。どれも便利で役立つので手放せないものになっています。Web制作をしている人なのでそれ系に偏っているかも知れませんが、多少でも参考になれば幸いです。ほとんど有名なものだとは思いますが・・・ というわけで、便利なお役立ちブックマークレットをいろいろとご紹介。手軽なのが素敵ですよね。以前書いてから大分経ちますので改めてエントリーしますが、少々Web制作系に偏っています。順不同です。 CSS構成を一目で確認出来るXRAY 何かと便利なXRAY。クリックした要素の詳細を教えてくれます。Web屋さんはご存じの方も多いのでは。 XRAY 今見ているページをiPhoneで「後で見る」KeepItWith.Me 最初の設定がすごくストレスだったのですが、設定後の便利さが感動したのでご紹介。PCで見ているページでブックマークレットを使って自分のiPhoneに送
実装する上ではどうでもいい、言葉の定義の問題のところに足を突っ込みつつあるような気もするけれど、CRFについて調べていたらどんどん混乱してきたので、現在のところの理解をまとめてみる。たぶん、突っ込みどころはいっぱいありますので、突っ込んで頂けると幸いです。 CRFは入力Xと出力Yの組をたくさん与えることで、未知のXに対してもP(Y|X)を計算できるようにするモデルである。ただし、Yは構造を持つ(この構造を持つというのがどう言うことかもややこしくて今調べているのだが、こちらはとりあえず棚上げする)ものとする。 CRFはであるということしか規定せず、自然言語処理ではlinear chain CRFとsemi markov CRFの2つ、特にlinear chain CRFがよく使われている。 linear chain CRFは出力Yが一本鎖の構造になっているところが特徴である。linear c
関連文献† John Lafferty, Andrew McCallum, and Fernando Pereira "Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data" ICML2001 GoogleScholarAll:Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data C.Sutton and A.McCallum "An Introduction to Conditional Random Fields for Relational Learning":&amazon(0262072882);の一部 Book/Probabili
Dirichlet分布 (Dirichlet distribution)† 実数ベクトル \(\mathbf{x}=(x_1,\ldots,x_k)\) とパラメータベクトル \(\mathbf{\alpha}=(\alpha_1,\ldots,\alpha_k)\) に対して,Dirichlet分布の確率密度関数は \[f(\mathbf{x},\mathbf{\alpha})=\frac{1}{B(\mathbf{\alpha})}\prod_{i=1}^k {x_i}^{\alpha_i-1}\] ただし,\(x_i\ge 0\) かつ \(\sum_{i=1}^k x_i=1\), \(\alpha_i\ge 0\), \(B(\mathbf{\alpha})\) は多変量ベータ関数. \(A=\sum_i^k\alpha_i\) として, i番目の要素の平均:\(\frac{\a
ディリクレ分布(ディリクレぶんぷ、英: Dirichlet distribution)は、連続型の確率分布である。ベータ分布を多変量に拡張して一般化した形をしており、そのため多変量ベータ分布とも呼ばれる。ディリクレ分布の確率密度関数は、同時に発生することのない 個の事象がそれぞれ 回発生したときに、各事象の起こる確率が である確率を与える(ただし、は整数である必要はない)。つまり、試行の回数が無限大なら各事象の発生の相対頻度は になるが、試行回数が有限だと、そこにずれが生じる。そのずれを表すモデルである。 定義と性質[編集] をパラメータ、実数ベクトル を確率変数 とするときの次ディリクレ分布の確率密度関数は以下の式で定義される。 ここで はK-1次元単体上の点であり、、を満たす。また、 であり、 は多変量に拡張したベータ関数で、以下の式で定義される。 このとき、 の期待値は 、同じく分散
probabilistic latent semantic analysis (pLSA)† 文書と単語など,離散2変数の計数データの生成モデル. 文書(document):\(d\in\mathcal{D}=\{d_1,\ldots,d_N\}\), 語(word):\(w\in\mathcal{W}=\{w_1,\ldots,w_M\}\), 潜在変数の話題(topic):\(z\in\mathcal{Z}=\{z_1,\ldots,z_K\}\) を使った文書と単語の生成モデルがpLSA (probabilistic latent semantic analysis) \[\Pr[d,w]=\Pr[d]\sum_{z\in\mathcal{Z}}\Pr[w|z]\Pr[z|d]\] これは,文書と語について対称に定義することもできる \[\Pr[d,w]=\sum_{z\in\mat
probabilistic latent semantic analysis (PLSA)は、 ・文書dがP(d)で選ばれる ・潜在変数zがP(z|d)で選ばれる ・語wがP(w|z)で生成される というプロセスを経て、結果として(d,w)のペアが観測されるという文書と語の生成モデル。 式で表すと (1) となる。P(d,w)の尤もらしい確率分布を見つけたい。対数尤度関数は (2) となる。n(d,w)は語wが文書dに出現する回数。この式は訓練データn(d,w)(;どの語がどの文書に何回出現したか)が尤もらしい確率分布P(d,w)に従うとき最大になる。ベイズの定理を用いると (3) となることを利用して、この尤度関数を最大化するためにEMアルゴリズムを用いて実装してみる。(過学習を回避するために文献ではTempered EM (TEM)を用いている。)尤度関数が収束するまで以下のE-ste
2023-12-04 python 2023-11-22 PRML/errata2 2023-11-21 PRML/errata1 2023-11-01 しましま/IBIS2023 2023-10-29 IBIS 2023-06-16 人工知能学会全国大会 2023-06-11 しましま/人工知能学会全国大会2023 2023-03-28 Book 2022-11-27 朱鷺の社 2022-11-24 しましま/IBIS2022 2022-07-08 AutoTicketLinkName 2022-06-17 しましま/人工知能学会全国大会2022 2021-11-13 しましま/IBIS2021 2021-10-29 回帰分析 2021-06-11 しましま/人工知能学会全国大会2021 2021-03-07 MenuBar 2021-02-15 python/numpy 2020-12
ステミングとは? 2008-01-20-1 [IIR][NLP][Algorithm][Programming] 「Introduction to Information Retrieval」[1]の第二章 (次回の輪講の範囲)の2.2.4に出てくるステミング (Stemming) の 話題をまとめました。 § 英語などの欧米系の言語では、 意味的には同じ単語が語形変化により表層文字列が異なることがある。 例えば、"retrieves", "retrieved", "retrieving", "retrieval" などで[2]、実用上これらを同じ意味のものと見なし インデックス作成時に同じ単語として扱いたいという要求がある。 ステミング (stemming) はこのような語形変化を取り除き 同一の単語表現に変換する処理である。 ステミングの手法として、 ポーターのアルゴリズム (Port
ステミング ... 検索エンジンのアルゴリズムで、語形が変化する単語の語幹でマッチングを行うこと。英語などの言語には、意味的には同じ単語で語形が変化するものがある。
Slim3には簡単にプロジェクトを作成する為に使えるEclipse pluginがあります。@tomotaro1065 さんが中心になって作られていますが、ご厚意でScenic3の対応もしていただいています。ですが、自分で使ってみて使い方が解らないのではないか?と気付きました。そこで、Scenic3の仕組みを含めてチュートリアルを書く事にします。内容は後でドキュメントに反映させるつもりです。 Scenic3ってなにさ? scenic3は t2 frameworkのようなPageクラスをslim3で実現するslim3の拡張ライブラリです。 Scenic3はSlim3を薄くラップしたライブラリで、Slim3の設計思想である「"Simple" and "Less Is More"」を踏襲しつつ、1つのPageクラスに複数のアクションメソッドを記述できるようになります。spin-upへの影響は最小
著作権について当サイトの文章に関する著作権等は各権利所有者に帰属し、著作権法で認められた範囲で引用として掲載させていただいております。万が一問題がございましたら、お手数ですが問題箇所についてお問い合わせください。 トップ画像を描いて頂きました
ソフトウエア Windows 7 Home Premium (64bit)VMware Player 3.1.3 build-324285Tera Term 4.67 作る物 CentOS # cat /etc/redhat-release CentOS release 5.5 (Final) # uname -a Linux localhost.localdomain 2.6.18-194.32.1.el5 #1 SMP Wed Jan 5 17:52:25 EST 2011 x86_64 x86_64 x86_64 GNU/Linux Apache # /usr/sbin/httpd -v Server version: Apache/2.2.3 Server built: Aug 30 2010 12:28:40 MySQL # mysql --version mysql Ver 1
こんにちは、ブロググループの飯田 (@iishun) です。 2011 年はさらにスマートフォン市場の拡大が加速すると云われています。弊社でも 2010 年 10 月にライブドア全体のスマートフォン関連事業を推進していくスマートフォングループが設立されました。 が、各コンテンツのスマートフォンサイト・アプリは各グループのコンテンツ担当が運用するのでスマートフォン関連の知識は必須になります。 そこで今回は僕がここ最近実践しているスマートフォンに関する勉強法を、実際に使用した参考書籍と共に紹介してみます。これから「スマートフォンの事を勉強しなきゃ!」と思った人に役に立ってもらえればなと思います。 1. HTML5/CSS3 の特徴を知る HTML5/CSS3 がスマートフォン用のマークアップ言語というわけじゃありませんが、スマートフォンのウェブサイト (Webkit 系) は HTML5/CS
Delicious が閉鎖するとかしないとかで話題になった ときに,個人的には 集合知の実現方法 として期待された SBM (Social BookMark) も終焉を迎えるのかなぁとか考えていましたが,上記のニュースを受けて,国内の SBM サービス一番手であるはてなブックマークも「大丈夫なのか?」と存続を心配する声もぽつぽつ聞こえました. そんな時に,ちょうど 歴代はてブ多い順 / 月ごとのランキング 2017年9月 1位~50位 と言う Web サイトを発見したので,今回はこの Web サイトに列挙されてある各年のはてなブックマーク 年間ランキング TOP100 のブックマーク数をグラフ化して,はてブが Web サービスとしてどの位成長し続けているのか見てみる事にします.尚,各年の上位 10件位は何年もの間ずっとブクマし続けられている記事があるので TOP10 位までは除外して見るほ
はてなブックマーク 年間ランキング TOP100 の推移 の最後に触れた「はてブ衆愚化」の話に関して. 「はてブは終わった終わった」みたいなのは2年以上まえから言われてるんだろうけど、最近は本格的に面白い情報が見つからなくなった気がする。アフィリエイトというインセンティブのある2chまとめ系の躍進によって、情報過多に陥ってはてブの地位が相対的に下がったという考え方もできるけど。ただ2chまとめ系のブログの情報は流し読み以上の価値を感じなくて、ただの懐古かもしれないけど、興味深い記事が多かった昔のはてブのようなサイトを見たいという欲求がある。 いまさらはてブ衆愚化の話。 ホットエントリに挙がってくる記事に関して現状発生している問題の一つとして,特定のジャンル・スタイル(所謂,定番サイト)のものが非常に多くピックアップされてしまうと言うものがあります.代表的なものとしては,痛いニュース(ノ∀`
Adobe Device Central CS5 Adobe CS5 をパッケージ購入すると一緒についてくるモバイルデバイスのテスト環境。様々なエミュレーターが存在しますが、オールインワンで素早くテストがしたい場合はこちらがオススメです。特に Flash を活用したモバイルサイトをテストするのであれば欠かせない存在です。 Android SDK Javaで開発されているので、Mac, Windows, Linux で動作する公式のエミュレーター。2011年1月現在、Android OS 1.1 〜 2.3 までのテストが可能。エミュレーターは実際のスマートフォンと同じ動作をするので、ディフォルトのブラウザだけでなく、Opera Mini や Firefox など他のブラウザをインストールしてテストすることができます。 iOS SDK XCode も含め諸々ダウンロードしなければいけませんし
■編集元:ネトゲ実況板より「年末だし面白いWeb漫画教えろ」 1 既にその名前は使われています :2010/12/26(日) 23:35:23 ID:geTDYqV3 既にその名前は使われています :2010/12/26(日) 23:35:44 ID:geTDYqV3 まずはおれからいくぜ ハナムラさんじゅっさい Pixivで趣味的に始めた連載が無料コミックサイト「漫画街」での web連載を経て、来年の1/11に単行本リリース。 絵のクオリティーといいマンガ作りのうまさといい、しかも毎週更新という神仕様。 ローグ-運命の洞窟- 1981年に発売されたダンジョン探索型のコンピュータRPG「ローグ」を漫画化。 ローグを知らない人でも普通に面白く読める。 4 既にその名前は使われています :2010/12/26(日) 23:38:03 ID:6D0ejMMv 胎界主 5
Hadoopは、グーグルが検索エンジン用に開発したバッチ処理システムを基に開発された、オープンソースソフトだ。グーグルが開発した分散ファイルシステム「Google File System(GFS)」を模した「Hadoop Distributed File System(HD FS)」と、データ処理機構「MapReduce」を模した「Hadoop MapReduce」で構成する。 米国では米VISAや米JPモルガン・チェースのような大手金融機関が、バッチ処理にHadoopを使用する。 そのHadoopがいよいよ、日本企業でも使われ始めた。例えば楽天は、ある商品に対するお薦め商品をリストアップする「レコメンド処理」にHadoopを使用する。NTTデータは、全国の渋滞情報をリアルタイムに可視化するシステムの構築にHadoopを採用した。三菱UFJインフォメーションテクノロジーもHadoopを使っ
1 名前:以下、名無しにかわりましてVIPがお送りします[] 投稿日:2011/01/19(水) 11:00:05.17 ID:HAk1zggH0 http://dl6.getuploader.com/g/nasinasinasi/62/vlero036282.jpg http://dl6.getuploader.com/g/nasinasinasi/63/vlero036283.jpg http://dl6.getuploader.com/g/nasinasinasi/64/vlero036284.jpg http://dl6.getuploader.com/g/nasinasinasi/65/vlero036285.jpg http://dl6.getuploader.com/g/nasinasinasi/66/vlero036286.jpg 7 名前:以下、名無しにかわりましてVIP
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く