タグ

2008年8月10日のブックマーク (8件)

  • 協調フィルタリングによるレコメンド計算 : 研究開発

    自分と似た嗜好の人をもとに情報の選択を行う 協調フィルタリング システムにおける、計算方法です。 Amazonでお薦めのとか、が、表現系として最もわかりやすいシステムです。 GroupLensが初期のシステムで、割とシンプルな考えに基づレコメンド機能です。 基的に、ユーザは各アイテムに点数を付けていくものとします。 利用ユーザ(あなた)が、まだ点数をつけていないアイテムに対して、どの程度の得点を付けるかを予想するのです。 インターフェイスの街角(93) – 棚演算 UNIX MAGAZINE 2005.12 増井俊之 ユーザaのアイテムiに対する点数を aiと表記しています。 相関係数は、 共分散 Cov(a,b) ÷ a,bの標準偏差 の積です。 これは ユーザ a , ユーザ b の評価にどの程度のずれがあるのかの値です。 普通は、正の相関がある評価者が高く評価しているアイテムは

  • DO++: 機械学習のチュートリアル (ICML2008)

    今年のICML2008はUAIとCOLTの共催と大規模で行なわれたようです。いろいろな方の話を伺うと楽しかったようで。 私は適当にお勧めされた論文やらを読み漁ってます。 個人的に印象深かったのはいくつかのmulti-armed bandit problemの話かな。特にこれとか。 bandit problemは強化学習の中にでてくるような問題の一つで、元々は複数のスロットマシンがあって、これから収益を最大化したいという問題。この時、やらなければいけないことは、現在持っている結果を元に各スロットのモデルを予想するとともに、自分からちょっとリスクを冒してでも他のスロットを試しにいかないといけない。スロットAが今のところ調子いいんだけど、もしかしたらさっきは出なかったスロットBの方がすごい調子がいいかもしれない。探索と最適化がまざったような話ですね。 コンピュータ囲碁で今一番強いモンテカルロ法と

    DO++: 機械学習のチュートリアル (ICML2008)
  • mixi Engineers’ Blog » 圧縮データベースを使おう

    チャリンコ通勤による滝のような汗で、朝からTシャツがシースルーになってしまうmikioです。さて今回は、Tokyo Cabinet(TC)のデータベースを各種のアルゴリズムで圧縮して利用する方法についてご紹介します。 圧縮B+木 B+木とは、比較関数の値による順序が近いレコード群を単一のページにまとめ、各ページにB木(multiway balanced treeの略であり、二分木(binary tree)とは違います)の索引を張ったものです。理論的にはレコードの探索も更新も O(log n) の時間計算量で行え、内部ノード(B木)の操作をキャッシュすると実質的には O(1) の時間計算量で探索や更新が行えるという、かなり安定した性能を備えるデータ構造です。その上、レコードが一定の順序に基づいて並べられているので、数値の範囲検索や文字列の前方一致検索が高速に行えたり、カーソルによって順序に基

    mixi Engineers’ Blog » 圧縮データベースを使おう
    moro-tyo
    moro-tyo 2008/08/10
  • IBM 渋谷テクニカルナイト: 資料ダウンロード

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM 渋谷テクニカルナイト: 資料ダウンロード
    moro-tyo
    moro-tyo 2008/08/10
  • Google Insights for Search

    Explore issues and events in detail. Curated by the Trends Data Team.

    Google Insights for Search
  • 検索エンジンの歴史的意義と未来 - グニャラくんのグニャグニャ備忘録@はてな

    弊社森(オラの上司)が大阪市立大学で発表をしてきました。 発表資料は以下からどぞー。 検索エンジンの歴史的意義と未来 発表の前半は、コミュニケーション技術歴史を踏まえ、 多対1のコミュニケーション技術として検索エンジンを捉える試みです。 発表の後半は、コミュニケーション技術としての検索エンジンが 現在どのような課題を抱えているか、 来検索エンジンとはどうあるべきか、について語られています。 発表者の森と、 「検索エンジンは情報を減らすための技術だから面白い」と 盛り上がって話した記憶があります。 (ちばてつやの看板がある渋谷の中華料理店で) 大変面白い資料ですので、是非一読をオススメいたします。

    検索エンジンの歴史的意義と未来 - グニャラくんのグニャグニャ備忘録@はてな
  • Free Videos Online - Watch TV Online - Free Video Clips | Veoh

  • PHP GDプログラミング:Geekなぺーじ

    ここでは、PHP用グラフィックライブラリGDを使ってスクリプトを書く方法を説明したいと思います。 GDを使ったCMSを作ると、画像をサーバにアップロードして自動的にサムネイルを作ったり出来ます。 また、GDを使うと任意の絵を作成できるので、例えばAJAXと組み合わせて色々作ると楽しいかも知れません。 その他、色々と使いどころはありそうです。 基 GDの使い方 GDライブラリの設定情報を確認する 四角く塗りつぶす 画像の読み込み PNGの出力 JPEGの出力 画像の拡大と縮小 画像の回転 TrueType Fontを使った文字列出力 TrueType Fontを使った文字列出力(傾きあり) TrueType Fontで文字列を記述した場合の大きさを測る TrueColor画像(1) TrueColor画像(2) 画像上に文字列を表示 画像上にロゴをオーバーレイ 画像フィルタ 明度 カラーバ