タグ

2009年9月16日のブックマーク (7件)

  • SIGMOD日本支部第42回支部大会 講演資料 - 大規模検索エンジンとレコメンドシステムを支える仕組み - DO++

    昨日、東工大で開催されたSIGMOD日支部第42回支部大会の発表資料です。 * 大規模検索エンジンとレコメンドシステムを支える仕組み [pdf] [pptx] - 近年の全文索引手法の解説 -- 転置ファイル, N-gram,半転置ファイル,格納 (VarByte, Rice, Simple9, NewPFOR)、接尾辞配列、圧縮全文索引 - レコメンデーションの内積の高速な計算, -- 単純な計算から、LSH, 補正付サンプリング - PFIの製品紹介 -- Sedue, Hotate, Reflexa ---- SIGMOD日支部大会は以前オープンソース全文検索エンジンの会に参加したことはあったのですが、コミュニティが強いなという気がします。喜連川先生の受賞記念講演も重みのある話、音の話がきけて大変ためになりました。 この一年は武者修行ということでいろんな分野の会にいくようにして

    SIGMOD日本支部第42回支部大会 講演資料 - 大規模検索エンジンとレコメンドシステムを支える仕組み - DO++
    hiromark
    hiromark 2009/09/16
    この資料は神だ。
  • DO++: 教師あり学習の比較

    ICML2006に興味深い論文がありました。 "An Empirical Comparison of Supervised Learning Algorithm", Rich Caruana caruana and Alexandru Niculescu-Mizil [link] 90年代初め以降、数多くの画期的な教師あり学習が提案されてきましたが、どれがいいかを包括的に比較したことはあまりありませんでした (文書分類などでは、SVMとAda-boosting 強いねということだったのですが Sebastiani@ACM Survey 2002) 決着をつけようじゃないかということで、11の問題に対してハイパーパラメータも完璧にチューニングして、いろいろな分類器を比較しているみたいです。比較内容は精度や再現率やクロスエントロピーなど様々で、確率を直接出さないやつはsigmoid関数など単調

    DO++: 教師あり学習の比較
    hiromark
    hiromark 2009/09/16
    あとでよむ。
  • スペクトラルクラスタリングは次元圧縮しながらKmeansする手法 - 武蔵野日記

    機械学習系のエントリを続けて書いてみる。クラスタリングについて知らない人は以下のエントリ読んでもちんぷんかんぷんだと思うので、クラスタリングという概念については知っているものとする。 それで、今日はスペクトラルクラスタリングの話。自然言語処理以外でも利用されているが、これはグラフのスペクトルに基づくクラスタリングの手法で、半教師あり学習への拡張がやりやすいのが利点。なにをするかというとクラスタリングをグラフの分割問題(疎であるエッジをカット)に帰着して解く手法で、どういうふうに分割するかによって Normalized cut (Ncut) とか Min-max cut (Mcut) とかいろいろある。 完全にグラフが分割できる場合はこれでめでたしめでたしなのだが、実世界のグラフはそんな簡単に切れないことが往々にしてある。それで近似してこのグラフ分割問題を解くのだが、Normalized c

    スペクトラルクラスタリングは次元圧縮しながらKmeansする手法 - 武蔵野日記
    hiromark
    hiromark 2009/09/16
    "結局スペクトラルクラスタリングがやっているのは、正規化して PCA や SVD といった教師なしの次元圧縮をかけたあとに Kmeans かけている"
  • Amazon.co.jp: たった1%の賃下げが99%を幸せにする: 城繁幸: 本

    Amazon.co.jp: たった1%の賃下げが99%を幸せにする: 城繁幸: 本
    hiromark
    hiromark 2009/09/16
    とりあえず読んでみる。
  • 「国内に携帯8社は多すぎる」 NEC、カシオ、日立、携帯統合で海外市場へ

    左から、カシオ日立モバイルコミュニケーションズ社長の大石健樹社長、NECの大武章人専務、カシオ計算機の高木明徳常務、日立製作所の渡邊修徳コンシューマ事業部長 「携帯電話の国内市場はほぼ半減し、回復が見込めない。生き残りをかけた合従連衡は不可避」――NECとカシオ計算機、日立製作所は9月14日、3社の携帯電話事業を統合し、共同出資の新会社「NECカシオモバイルコミュニケーションズ」を来年4月に設立すると発表した。 3社の携帯電話事業を合わせた国内シェアは、約19%でシャープに次ぐ2位。統合で開発コストを削減しながら収益力を高め、早期にシェア1位獲得を目指す。海外市場にも積極的に攻め込んでボリュームを拡大。2012年に国内700万台、海外500万台の販売を目指す。 事業統合に当たってはまず、NECが今年末までに100%子会社を設立し、NECの携帯電話事業を吸収。その上で来年4月に、カシオと日

    「国内に携帯8社は多すぎる」 NEC、カシオ、日立、携帯統合で海外市場へ
  • 中央値の物理的な説明 - Radium Software

    statpics - A Pearl: a Balanced Median Necklace 数学の概念を説明するのに,物理的な「たとえ」を使うことが,たまにあると思う。 例えば平均値の概念は,上の図の (a) のように「物理的なバランスが取れる点」として説明することができる。数直線を棒とし,値の点に等しい質量の重りを付けたときに,バランスを取ることのできる支点の位置が,平均値を表しているわけだ。 それでは中央値(メディアン)はどのように説明することができるだろう。平均値が「棒のバランス」だったのに対して,中央値は「滑車のバランス」で説明することができる。上の図の (b) のようにループ状の紐に重りを付けて,滑車にぶら下げたときに,最も下に位置する点が中央値となる。 この「滑車のバランス」は,左右の紐に同じ数の重りがあることによって得られる。どちらか片方からひとつの重りを選んで,それを極端

    中央値の物理的な説明 - Radium Software
    hiromark
    hiromark 2009/09/16
    たのしい。
  • 食べログお取り寄せ終了のお知らせ [食べログ]

    べログお取り寄せ」は、2018年7月31日をもちまして終了いたしました。 いつもべログをご利用いただき、誠にありがとうございます。 昨今のサービスの状況を鑑み、今後のサービス提供について社内で慎重に協議を進めてまいりましたが、 利用者数の減少等に伴いまして、今後お客様に十分にご満足いただけるサービスのご提供を続けることが困難であると判断したため、 「べログお取り寄せ」を2018年7月31日をもちまして終了させていただきました。 サービス開始より約10年間の長きにわたり「べログお取り寄せ」をご支持いただいた全てのお客様へ、心より御礼申し上げます。 べログでは、今後もユーザー様への一層のサービス向上に取り組んでまいりますので、ご理解いただけますと幸いです。 引き続き、べログをよろしくお願い申し上げます。

    hiromark
    hiromark 2009/09/16
    これはうまそう。