タグ

ブックマーク / kunimiya.hatenablog.com (9)

  • 『パターン認識と機械学習』を読み始めています - 図書館情報学を学ぶ

    博士課程になっていまさらという気もしますが、機械学習の教科書として名高い『パターン認識と機械学習』を読み始めています。 パターン認識と機械学習 上 - ベイズ理論による統計的予測 作者: C. M.ビショップ,元田浩,栗田多喜夫,樋口知之,松裕治,村田昇出版社/メーカー: シュプリンガー・ジャパン株式会社発売日: 2007/12/10メディア: 単行購入: 18人 クリック: 1,588回この商品を含むブログ (111件) を見る 以前紹介した『集合知プログラミング』とは対照的に、この機械学習の基礎理論となるガウス統計理論と良くつかわれる確率分布の理論を丁寧に解説しつつ、SVMやニューラルネットワークなどの機械学習理論を紹介しています。カバーしている内容が広範囲に渡るため、この機械学習の理論の勉強をする人は多く、勉強会も数多く開かれているようです(参考:google:PRML+

    『パターン認識と機械学習』を読み始めています - 図書館情報学を学ぶ
    yuiseki
    yuiseki 2011/10/03
  • 情報推薦アルゴリズムの効果をどう評価するのか - 図書館情報学を学ぶ

    以前このブログでも紹介した『集合知プログラミング』を読みつつ、細々とデータマイニングの勉強を続けているこの頃です。それに関連して情報推薦についての研究動向についても調べていたりしているのですが、そうしていくうちに疑問に感じることがありました。 それは、情報推薦アルゴリズムの有効性を正しく評価できるのか?ということです。アルゴリズムというと、素数の判定やソートなどが思い浮かびますが、その場合の有効性はいかに少ない時間で計算結果を出せるかという、定量的な尺度で評価することが可能です。しかし情報推薦の場合は効率性ではなくユーザーの明示化できない欲求に応えることという数値化しにくい目的であるので、果たしてそこで導入されるアルゴリズムの有効性はそもそも評価できるのだろうか?と思うのです。 情報検索のアルゴリズムの場合は、適合率と再現率の2つの尺度によって評価することができます。適合率とは「検索結果中

    情報推薦アルゴリズムの効果をどう評価するのか - 図書館情報学を学ぶ
    yuiseki
    yuiseki 2008/12/27
  • 情報科学は主観評価の積み重ね - 図書館情報学を学ぶ

    先日、「情報推薦アルゴリズムの効果をどう評価するのか」という記事を書きましたが、各所から様々なフィードバックを頂きました。私の理解力が不十分なため、指摘を完全にまとめることはできないのですが、強く印象に残ったことについて書いてみようかと思います。 工学的立場からの研究にはよく見られるのですが、個人的には、そもそも情報科学の世界において、なんらかの「正解」や「客観評価」が存在するかのような前提を置くというのは、ありがちな誤解だと思っています。 情報科学における評価はヒトによる主観性評価しかありえず、そのように評価が行われてきたと認識しています。 (参照:http://d.hatena.ne.jp/kunimiya/20081223/p1#c1230090389) id:tmasao さんから頂いたご指摘です。 言われてみれば、その通りかもしれません。そもそも情報の価値というものが受け取る人に

    情報科学は主観評価の積み重ね - 図書館情報学を学ぶ
    yuiseki
    yuiseki 2008/12/27
  • ウェブサイエンスの抱える「再現性」の問題 - 図書館情報学を学ぶ

    ここしばらく利用履歴について記事を書いてきましたが、それに関連して「ウェブサイエンスにおける再現性の問題」について少し語ってみたいと思います。 ウェブサイエンスとは 現在のウェブは、ブログやSNS、ソーシャルブックマークといった様々な形態のウェブサービスによって複雑に構成されています。そのウェブのネットワークを分析し、ユーザーの情報行動や話題の伝播を解き明かし、応用技術を生み出していくのがウェブサイエンスという研究分野です。 社会のあらゆる情報がウェブにある現在、ウェブサイエンスは人々の生活環境を整える重要な研究であるといえます。 しかし、私の考えでは、ウェブサイエンスには再現性の点で問題点を抱えていると思います。 再現性とは 科学における重要な概念として、「再現性」というものがあります。再現性とは、ある研究で示された実験結果が再現できることを指します。科学の最大の目的は普遍的な法則性の発

    ウェブサイエンスの抱える「再現性」の問題 - 図書館情報学を学ぶ
    yuiseki
    yuiseki 2008/12/24
  • プログラマーに最適なデータマイニングの教科書 『集合知プログラミング』 - 図書館情報学を学ぶ

    集合知プログラミング 作者: Toby Segaran,當山仁健,鴨澤眞夫出版社/メーカー: オライリージャパン発売日: 2008/07/25メディア: 大型購入: 91人 クリック: 2,220回この商品を含むブログ (277件) を見る当初はサンプルコードがPythonということで購入した書ですが、読んでみると内容の素晴らしさに驚嘆しました。私が今までに読んだオライリーシリーズでも屈指の名作だと思います。 『集合知プログラミング』とは 『集合知プログラミング』は、Amazonの協調フィルタリングのように、ウェブ上のデータを収集してユーザーの嗜好にあったコンテンツを推薦したり、大量のデータを分かりやすく分類・可視化するプログラムを簡単に実装する技術を解説した書籍です。Webプログラミングをかじったことのある方でしたら、だれしもAmazonのような推薦サービスを作ってみたいと思ったこと

    プログラマーに最適なデータマイニングの教科書 『集合知プログラミング』 - 図書館情報学を学ぶ
    yuiseki
    yuiseki 2008/11/17
  • 図書館と一般人が新聞社の脅威になった日 - 図書館情報学を学ぶ

    http://2channel2.blog32.fc2.com/blog-entry-286.html 猥褻記事問題に関する毎日新聞の謝罪に虚偽があったという話。毎日新聞側では「9年前のウェブ版スタートから猥褻記事の問題が発生していた」と内部調査結果で述べていたが、今回11年前にも猥褻記事が載っていたということが発覚したらしい。 ここで興味深いのは、11年前の記事を大学図書館・国立国会図書館のマイクロフィルムから入手したということ。 414 名前:名無しさん@九周年[] 投稿日:2008/08/11(月) 21:51:17 id:dd6VF8p80 なお、物証自体はここで手に入ります。 http://sinbun.ndl.go.jp/cgi-bin/outeturan/E_S_kan_lst.cgi?ID=007278 007278  The Mainichi Daily News(創刊:

    図書館と一般人が新聞社の脅威になった日 - 図書館情報学を学ぶ
    yuiseki
    yuiseki 2008/08/14
  • 『フューチャリスト宣言』で図書館情報学が言及されている - 図書館情報学を学ぶ

    フューチャリスト宣言 (ちくま新書) 作者: 梅田望夫,茂木健一郎出版社/メーカー: 筑摩書房発売日: 2007/05/08メディア: 新書購入: 15人 クリック: 170回この商品を含むブログ (680件) を見るといっても1フレーズだけですけど。 茂木 将来の課題としては、動画にどんなタグをつけるかが、非常に深刻でもあり、おもしろい問題でもあります。いまはユーザーが勝手にタグをつけているんですよね。 梅田 そこがウェブ2.0。あれはある種の発明で、要するに不特定多数の人たちが勝手にタグをつけることができるという仕組みは、短いプログラムで書けるわけですが、それを作った瞬間にワーッとタグがついた。タグは分類学、図書館情報学に沿ってつけなければならないという常識をひっくり返した。タグなんていうものは専門家しかつけられないと思うんじゃなくて、誰でもいいから思いついたタグをつけてくれと言うと、

    yuiseki
    yuiseki 2007/05/11
  • チャットサービスLingrで図書館について語りませんか? - 図書館情報学を学ぶ

    blog『図書館情報学を学ぶ』交流所(at Lingr) Web2.0ライクなチャットサービスLingrに、ブログ『図書館情報学を学ぶ』専用のチャットルームを開設しました。Lingrでチャットをするのにアカウント申請等は不要であるので、誰でも手軽に会話することが出来ます。 図書館について語りたいという方は是非ご来室ください。

    yuiseki
    yuiseki 2007/02/06
  • 資料や人がいなければ「空間への期待」を満たすことはできないのでは? - 図書館情報学を学ぶ

    書店は「空間への期待」を選んだ。図書館は大丈夫? http://loud-minority.cocolog-nifty.com/loud_minority/2007/01/post_6e16.html 図書館が生き残るためには「空間への期待」に重視すべきという意見は基的に賛成なのですが、以下の部分を見てひっかかりました。 人も資料も大事なんだろうとは思いますが、まず何よりも「空間」として期待されるのが先なんじゃないかと思いました。私は逆なのではないかと思います。「空間」として期待されるためには人や資料がまず無ければならないと思うのです。書店が成立するためにはという商品と、それを整備する書店員がいなくては成立しませんよね?元書店員の方としてはそれは当たり前に存在するものなのかもしれませんが、図書館ではそういった低レイヤーの部分から考えなければならないのだと私は捉えています。 往来堂は「人

    資料や人がいなければ「空間への期待」を満たすことはできないのでは? - 図書館情報学を学ぶ
    yuiseki
    yuiseki 2007/01/24
  • 1