タグ

2013年5月11日のブックマーク (5件)

  • Apache TomcatからELBにアクセスする際に気をつけたい事 sun.net.inetaddr.ttl=-1 | Developers.IO

    それは予告なく突然起こった TomcatからELBを経由したEC2インスタンスが見つからない。Management Consoleで確認するとちゃんと起動している。なぜ?分からない。ELBの障害でも無さそうだ。ELBへHTTPリクエストしているTomcat側の問題か?謎が深まるばかり。 ELBのIPアドレスは変わることがあるらしい いろいろ調べていると分かったことがある。ELBのIPアドレスは変わることがあるらしいと。たしかに、各種ドキュメントにはELBはドメイン名を使うように至る所で注意書きがあった。確かに、ELBは単一のサーバーではなく、ELBというサービスだからIPが変わるのは理解できる。でも今回は、ELBはちゃんとドメイン名で書いているはずだぞ。全て正しく設定されているはずなのにTomcatがConnection Refusedとエラーを吐いている。 TomcatがDNSキャッシュ

  • 単語の頻度からLDAまでの流れの簡単なイメージのメモ - 唯物是真 @Scaled_Wurm

    トピックモデルのLDA(Latent Dirichlet Allocation)が難しいって話をよく聞きますけど,詳しい理論的な部分はともかくどういう流れに位置するものかってのはわかりやすいので簡単にメモ. 専門でないので,詳しくは参考文献を読んだほうがいいです. トピック 同じ文書内で使われる確率が高いような似た意味を持つ単語の集まり. 例えばスポーツトピックなら「野球」「サッカー」「ボール」が出やすい,など. トピックモデルは文書のトピックと,トピックに属する単語を推定する. 単語頻度からトピックモデルまでの流れのイメージ 文書をモデル化しよう→単語の頻度 同義語や多義語を捉えよう≒次元削減をしよう→LSA=SVD→以下がトピックモデル 確率的にしよう→PLSI ベイズ的にしよう=訓練データに登場しなかったものにも対応できる→LDA トピック数が自動で決まるようにしよう→ノンパラメトリ

    単語の頻度からLDAまでの流れの簡単なイメージのメモ - 唯物是真 @Scaled_Wurm
  • GoogleNewsのレコメンドの中身 - UMEko Branding

    先日、全体ゼミで発表したときの内容ですが、ここにまとめときます。。GoogleNewsのレコメンドの中身を追った論文の要約です。少し前の全体ゼミで用いた資料です。ソース:Abhinandan Das,Mayur Datar,Ashutosh Garg,Shyam Rajaram,"Google News Personalization: Scalable OnlineCollaborative Filtering",WWW2007不勉強な個所が多々ありますので、誤っている箇所等ありましたら、是非ご指摘ください。 個人的には、最近のモデルベースの手法の勉強・おさらいという意味で用いているので、GoogleNews独自の拡張なり実装の部分の内容が省かれている場合があります。また、データ構造やMapReduceを用いた計算の仕組みの部分は、ここでは省略しています。。一応、 全体像 ・LSH(Lo

  • 推薦システム-神嶌敏弘.pdf

  • SSDをHDDのキャッシュにする「bcache」、Linuxカーネルに登場

    次期Linuxカーネルバージョン3.10の目玉機能のひとつになるとみられる「bcache」がカーネルソースツリーにマージされた。bcacheはLinuxのカーネルレベルで動作するブロックレイヤキャッシュの実装系。特定のデバイスを他のデバイスのキャッシュとして利用できるという機能。ここでは主にHDDのキャッシュとしてSSDを活用するケースが想定されている。 bcacheが提供するキャッシュ機能はZFSのL2Arcの動作に似ているが、bcacheはライトバックに関してもキャッシュを実施するという違いがある。デフォルトの設定ではシーケンシャルアクセスに対してはキャッシュを提供せず、ランダムI/Oに対してキャッシュを提供する。SSDの特性を活かし、もっとも効果がでるケースでSSDを動作させる。実装はトランスパレントになっており、利用するにあたってアプリケーションやユーザ側に変更の必要はない。 bc

    SSDをHDDのキャッシュにする「bcache」、Linuxカーネルに登場