_ [コンピュータ] Bayesian Sets何はともあれ一番目立つところにリンクをば。 ここのところちょっと時間が取れたので、以前から気になっていたBayesian Setsを実装してみました。Bayesian Setsは、ある単語を入力すると、それと関係が深い単語を推測して返してくれるというものです。Google Setsというサービスを聞いたことがある方もおられるかもしれませんが、やりたいことはあれと同じです。理論的な話に興味がある場合はここを参照するか、元論文に当たってください。 論文で「高速」と紹介されているだけあって、Wikipediaから17万文書を使って学習させたにも関わらず結構な速度で動いてくれています。辞書に登録されている単語数も44万と豊富。これだけのものを現実的な時間で捌いているというだけでも、かなり驚きです。無理やりアドホックに処理を端折って計算量を減らしている
ネットエイジグループは9月27日、子会社としてTAGGYを設立し、ポータルサイト「TAGGY」アルファ版のサービスを開始した。 TAGGYは画像共有サービス「Flickr」や動画共有サービス「YouTube」、ソーシャルブックマークサービス「Deli.cio.us」など、ユーザーがコンテンツをアップロードしていき、「タグ」を使って情報を分類するCGMサービスの検索やクリッピングが可能なサービスだ。9月26日に開催された「CNET Japan Innovation Conference 2006 Autumn〜Web 2.0時代に成長するテクノロジー企業の戦略」の講演でも概要が発表されている。 今回、アルファ版では画像共有サービスやソーシャルブックマークサービスなどのCGMサービスのタグ情報を横断検索できる「タグサーチ機能」と、タグ単位での「フィード配信機能」、ウェブ上の記事や注目するタグを
ベイジアン (bayesian)、ベイズ (bayes)、ナイーブベイズ (naive bayes) ってなんですか? ベイジアン (bayesian)、ベイズ (bayes)、ナイーブベイズ (naive bayes) という言葉は、POPFile や類似のメールフィルターの議論においてよく使われます。これらはたいていの場合、数学の公式のことを言っています。 Thomas Bayes は 1700 年代に確率論を研究した人で、彼の業績は ベイズ統計(Bayesian Statistics)として知られています。そして、この方法は、最近メールフィルタリングの分野でよくとりあげられるようになってきました。それはグループの異なるメッセージを分類するのに非常によい成績を発揮するからです。 POPFile はベイズの定理を用いて、あるメールが work、personal、spam のどのバケツに分
重要なお知らせ:ベイズウィキのURLが変わります. † サーバーを京都大学に移動することにより ベイズウィキのURLが変わります. 新URLは,http://hawaii.sys.i.kyoto-u.ac.jp/~oba/bayeswiki/index.php で, すでに過去のデータをそのまま移して稼働中です. 以後の閲覧・書き込みは新サイトでおねがいします. ここ,旧サイトはしばらくしたら削除します. ↑ お知らせ † スパム対策に設置した併設会議場のほうのスパムがひどくなってきたので、 スパム対策を強化した本家pukiwiki のほうをメインとするべく整備中です。 2007/05/18 コメントスパム対策のために、合言葉を設定しました。 コメントを書き込むときには お名前欄に自分のハンドル名とともに bayes と半角英字で書き込む ようにして下さい。 2007/05/09 投
しばらく、資料集の紹介だったので、ここらへんで専門に勉強しない人に向けた機械学習についての解説をすこしだけします。 主なタスクは、以下の様なものです。 (1) Supervised 訓練用にサンプルを用意して、機会に学習させた後、テスト用の別なサンプルでどれぐらい学んだかをテストします。 教師が必要で、通常人間が訓練用サンプルを準備します。 Classification (分類) あらかじめ決めておいたカテゴリーに、サンプルを分類します。 Regression サンプルごとに、数字を予測します。 (2) Unsupervised 訓練用のサンプルを必要としないタスク。 教師なし。 Anomaly Detection めずらしいサンプル、ほかと違うサンプルを見つけます。 Clustering サンプルがどのように分類できるか、カテゴリーを発見します。 Summarization *注意 デー
ネット世界をタグで分類する「フォークソノミー」 2005年2月 7日 コメント: トラックバック (0) Daniel Terdiman 2005年02月07日 写真共有サイト『Flickr』(フリッカー)がなんらかの目安になるとすると、デジタル写真愛好家の世界では猫好きが支配的だということになる――犬の飼い主はおそらく納得しないだろうが。 Flickrには、サイト上の写真にタグ[写真の分類を示すキーワードやラベルのようなもの]をつけるシステムがあり、写真の投稿者や閲覧者がこのタグを自由に追加し、検索などに役立てている。このタグを検索することで、「cat」または「cats」(猫)のタグがついた画像が2万3081枚あり、「dog」または「dogs」(犬)とつけられた1万7463枚を大きく上回っていることがわかるのだ。 もちろん、Flickrのシステムは猫派と犬派の争いを助長するために作られた
最近忙しくてマトモにニュースをチェックしていないので、もう1つタグについて考えていたことを。タイトルは正確に言えば「ソーシャルブックマークのタグ付けはフォークソノミーと相容れない要素もある」とした方が良いかも。 昨日のエントリで「同じ人物であったとしても、時と場合によってタグの付け方に差が出るのは仕方ない(だって人間だもん)」という内容を書いたのですが、ではその差を無くすにはどうすれば良いのでしょうか。ここで言う「タグ」とは、ソーシャルブックマークでタグ付けを行うことを想定しているので、ソーシャルブックマークを使用する場合で考えてみたいと思います。 ソーシャルブックマークを利用する目的は、言うまでもなく「後から読み返したい・利用したいと思ったWEB上のコンテンツを記録しておくため」です。タグは記録しておいたコンテンツを検索しやすくするために、インデックスとして付与されます。であれば、ソーシ
Folksonomy is a classification system in which end users apply public tags to online items, typically to make those items easier for themselves or others to find later. Over time, this can give rise to a classification system based on those tags and how often they are applied or searched for, in contrast to a taxonomic classification designed by the owners of the content and specified when it is p
【IT用語】Folksonomy 〜タグで繋がるみんなの分類〜 西村 悟, 千野 晋平, 三木 光範, 廣安 知之 ISDL Report No. 20050911001 2005年 10月 24日 1 はじめに 従来, Web上, コンピュータ上に限らず, 日常においても, 例えば, 図書館の本棚など, 何かを分類するためには, カテゴリという階層構造が用いられる事が一般的である. しかし近年, Web上では, folksonomyというカテゴリ分けに変わる新たな分類手法が注目されている. 本稿では, folksonomyと従来のカテゴリ分けとの違いに注目し, folksonomyの有効性と今後の展望について述べる. 2 folksonomyとは folksonomyとは, folks(人々の)とtaxonomy(分類学)を組み合わせた造語で, 「みんなの分類」という意味で
Folksonomies - Cooperative Classification and Communication Through Shared Metadata This paper examines user-generated metadata as implemented and applied in two web services designed to share and organize digital media to better understand grassroots classification. Metadata - data about data - allows systems to collocate related information, and helps users find relevant information. The creati
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く