2009年2月12日のブックマーク (3件)

  • Latent Semantic Indexing - naoyaのはてなダイアリー

    情報検索におけるベクトル空間モデルでは、文書をベクトルとみなして線形空間でそれを扱います。この文書ベクトルは、文書に含まれる単語の出現頻度などを成分に取ります。結果、以下のような単語文書行列 (term document matrix) が得られます。 d1 d2 d3 d4 Apple 3 0 0 0 Linux 0 1 0 1 MacOSX 2 0 0 0 Perl 0 1 0 0 Ruby 0 1 0 3 この単語文書行列に対して内積による類似度などの計算を行って、情報要求に適合する文書を探すのがベクトル空間モデルによる検索モデルです。 見ての通り、単語文書行列の次元数は索引語の総数です。文書が増えれば増えるほど次元は増加する傾向にあります。例えば索引語が100万語あって検索対象の文書が 1,000万件あると、100万次元 * 1,000万という大きさの行列を扱うことになりますが、単

    Latent Semantic Indexing - naoyaのはてなダイアリー
  • まさかここまでひどいとは - 書評 - 子どもの貧困 : 404 Blog Not Found

    2009年02月12日03:00 カテゴリ書評/画評/品評Taxpayer まさかここまでひどいとは - 書評 - 子どもの貧困 二児の父として、このことは知っているつもりだった。 子どもの貧困 阿部彩 関連entriesも少なくない。 site:http://blog.livedoor.jp/dankogai/ 子供 - Google 検索 404 Blog Not Found:貧乏な社会で子を産むな 404 Blog Not Found:書評 - 若者をい物にし続ける社会 なのに、いかに知らなかったかを改めて思い知らされた。 かつて親だった人も、すでに親になった人も、これから親になる人も、必読。 難しいではないので、高校生以上の未成年も、読んでおくべき。 書「子どもの貧困」は、日の子どもの貧困がいかにひどいかを、情ではなく理で説いた渾身の一冊。 はじめに iv 「子どもの貧困

    まさかここまでひどいとは - 書評 - 子どもの貧困 : 404 Blog Not Found
    solidscan
    solidscan 2009/02/12
    国が国民に子供を作るなという制度を設計し、国民は空気を読む。人口抑制政策の成功例。
  • C++ の string と vector の reserve() の挙動 - bkブログ

    C++ の string と vector の reserve() の挙動 C++ の string と vector には前もって容量を確保するための reserve() というメンバ関数があります。何気なく使っていた関数ですが最近になって興味深い挙動に気づきました。 reserve() の基 string と vector の reserve() は前もって容量 (capacity) を確保しておくためのメンバ関数です。前もって容量を確保 (reserve) しておけば、データの追加時に発生する再割り当て (reallocation) を防ぐことができ、効率的です。 たとえば、何もしないで文字列に 1,000文字追加した場合、(内部的に倍々で容量を増やしていくため)10回程度の再割り当てが発生しますが、 s.reserve(1000) のように容量を確保しておけば 1回の割り当て (

    solidscan
    solidscan 2009/02/12