タグ

2010年6月14日のブックマーク (6件)

  • スペクトラルクラスタリングは次元圧縮しながらKmeansする手法 - 武蔵野日記

    機械学習系のエントリを続けて書いてみる。クラスタリングについて知らない人は以下のエントリ読んでもちんぷんかんぷんだと思うので、クラスタリングという概念については知っているものとする。 それで、今日はスペクトラルクラスタリングの話。自然言語処理以外でも利用されているが、これはグラフのスペクトルに基づくクラスタリングの手法で、半教師あり学習への拡張がやりやすいのが利点。なにをするかというとクラスタリングをグラフの分割問題(疎であるエッジをカット)に帰着して解く手法で、どういうふうに分割するかによって Normalized cut (Ncut) とか Min-max cut (Mcut) とかいろいろある。 完全にグラフが分割できる場合はこれでめでたしめでたしなのだが、実世界のグラフはそんな簡単に切れないことが往々にしてある。それで近似してこのグラフ分割問題を解くのだが、Normalized c

    スペクトラルクラスタリングは次元圧縮しながらKmeansする手法 - 武蔵野日記
    mooz
    mooz 2010/06/14
    スペクトラルクラスタリング
  • 2005-09-08

    Windows NT の時代から NTFS ファイルシステムは“代替 データ ストリーム(Alternate Data Stream)”と呼ばれる機能を持っています。 【参照】プログラマから見た NTFS 2000 Part1: ストリームとハード リンク http://www.microsoft.com/japan/msdn/windows/windows2000/ntfs5.asp この機能により、一つのファイルが複数のデータストリームを持つことが可能になります。(※データストリームの最大数は?※) NTFS 代替データストリーム(概念図) http://forensics.sakura.ne.jp/PPT/NTFSADS.pdf 例えばこの機能は、Macintoshファイル・サービスにおいて「データ・フォークとリソース・フォークの保存」に利用されたり、サムネール画像のインデクシングに

    2005-09-08
    mooz
    mooz 2010/06/14
    代替データストリーム. ファイルサイズには含まれない領域. http://www.geocities.co.jp/Playtown-Denei/1184/satoimo/ も.
  • Google Sites: Sign-in

    Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode

    mooz
    mooz 2010/06/14
  • inforno :: 基礎を終えた人のScalaミニtips

    どう書く?orgでScalaを書いてくれる人もでてきたので、超一部の方向けにScalaのことでも書いてみようと思います。言うなれば、基礎を終えた人のScalaミニtips。知っている人は知っている、でもあまり知られていないことを並べていきます。 下に行くほどマニア度あがります、たぶん。FPよりの話が多いかもしれません。はやりのYコンビネータの話とか。たぶん。 ではいってみましょう。 Predefされているものは把握しておきましょう Scalaにはscala.Predefというオブジェクトがあります。この中で定義されているものは常にインポートされていて使える状態になっているので把握しておきましょう。 例: 1def exit(status: Int): Nothing = { 2 java.lang.System.exit(status) 3 throw new Throwable() 4}

    mooz
    mooz 2010/06/14
  • クラウド時代の分散マシン操作ライブラリ Svengali - Ryoの開発日記

    ご無沙汰してます。ryo_gridです。 前々から公開すると言っていたライブラリ http://ryo.hayamin.com/idea/twit/6056*1 http://d.hatena.ne.jp/kanbayashi/20091020/p1 http://d.hatena.ne.jp/kanbayashi/20091217/p1 を公開します。 コンテンツ Svengaliとは 何ができるか サンプルコード インストール ドキュメント プラグイン プラットフォーム Svengaliという名前について これから さらにその先へ ご要望はコチラ キーワード 必要な方が、ここに辿り着けるようにしときましょう。 分散システム, サーバ, 設定, 設定ファイル, 自動化, デプロイ, 配布, クラスタ, サーバ管理, 分散環境, 面倒, リモート, SSH, distributed, di

    クラウド時代の分散マシン操作ライブラリ Svengali - Ryoの開発日記
    mooz
    mooz 2010/06/14
    "分散したマシンの管理や操作を行うためのライブラリ"
  • BigTableの論文読み - それなりにマジメなメモ

    簡単なメモです。 BigTable 大量のデータを扱うためのstorage system。 ・フリーのものを使うのでなければコストが高い。 ・行ごとのアクセスすることによって高速にアクセス ・スケールアウトしやすい Data model Row keyは任意のstring 例ではURLの逆を使っている<-こうすることで同じようなURLが近くなっている Row key でsortされている Column Keyはfamily:qualifier Familyでカテゴリ分け 何で複数のcolumnを束ねているのか >全部を一緒にしてしまうと大きくなりすぎてキャッシュが効かなくなる。ある程度分割することでローカリティーをあげてキャッシュが効くようにするため Timestampは書き込んだ時間 時間をkeyとして過去のデータを保存する こうすることで過去のデータにもアクセスしやすくする。 分散処理

    BigTableの論文読み - それなりにマジメなメモ