タグ

2009年2月15日のブックマーク (2件)

  • 大規模データ処理のための行列の低ランク近似 -- SVD から用例ベースの行列分解まで -- - 武蔵野日記

    id:naoya さんのLatent Semantic Indexing の記事に触発されて、ここ1週間ほどちょくちょく見ている行列の近似計算手法について書いてみる。ここでやりたいのは単語-文書行列(どの単語がどの文書に出てきたかの共起行列)や購入者-アイテム行列(どの人がどのを買ったかとか、推薦エンジンで使う行列)、ページ-リンク行列(どのページからどのページにリンクが出ているか、もしくはリンクをもらっているか。PageRank などページのランキングの計算に使う)、といったような行列を計算するとき、大規模行列だと計算量・記憶スペースともに膨大なので、事前にある程度計算しておけるのであれば、できるだけ小さくしておきたい(そして可能ならば精度も上げたい)、という手法である。 行列の圧縮には元の行列を A (m行n列)とすると A = USV^T というように3つに分解することが多いが、も

    大規模データ処理のための行列の低ランク近似 -- SVD から用例ベースの行列分解まで -- - 武蔵野日記
    Ctrans
    Ctrans 2009/02/15
  • 典故と古典 - 文言基礎

    「典故」というのは、文章を書く際の「よりどころとなる古典の文句」のことです。中国においては、先秦時代から秦代・前漢時代と、質量ともに優れた文献が蓄積され、前漢末に劉向・劉歆の父子が国家的な図書事業を成し遂げる頃までに、後世にも多大な影響を与えた書物文化の礎が築かれました。さらにその後の文化の発達にともない、また仏教という外来の教えをも受け入れつつ、「古典」は巨大化してゆきました。 魏晋南北朝時代、貴族が主導する文化が発達しましたが、その中では文学が重い地位を占めました。彼らの書いた詩文は、洗練に洗練を加えてゆきましたが、なかでも、(1)韻律の洗練と、(2)典故の洗練、はその顕著なものです。それゆえ、この時代の詩文には、「韻律」と「典故」にまつわる、徹底的な技巧が凝らされているのです。 「典故」をよく知り、自由自在に応用できるのが、当時の教養ある貴族であった、というわけです。「典故」を用いれ

    典故と古典 - 文言基礎