タグ

algorithmに関するkohei_april20のブックマーク (8)

  • 新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転 改

    新はてブ正式リリース記念ということで。もうリリースから何週間も経っちゃったけど。 新はてなブックマークではブックマークエントリをカテゴリへと自動で分類しているが、このカテゴリ分類に使われているアルゴリズムはComplement Naive Bayesらしい。今日はこのアルゴリズムについて紹介してみる。 Complement Naive Bayesは2003年のICMLでJ. Rennieらが提案した手法である。ICMLというのは、機械学習に関する(たぶん)最難関の学会で、採択率はここ数年は30%を切っている。2003は119/371で、32.1%の採択率だったようだ。 Complement Naive Bayesの位置づけは 実装が簡単 学習時間が短い 性能もそこそこよい という感じで、2003年段階にあっても、絶対的な性能ではSVMに負けていた。しかし、学習が早いというのは実アプリケーシ

    新はてなブックマークでも使われてるComplement Naive Bayesを解説するよ - 射撃しつつ前転 改
  • 著名ソーシャルメディアが使っているアルゴリズムを大公開! | Moz - SEOとインバウンドマーケティングの実践情報

    “アルゴリズム”は、もっとも非人間的なものの代表だともいえる。ソーシャルメディアにとって、そのアルゴリズムが不可欠だというのは、実に皮肉めいている。 僕はこの間、グーグルがどうやってユーザーデータを集めているかについて書いた記事を掲載した(前編、後編)。今回は、著名なソーシャルメディアサイトが、ユーザーデータを活用する上でどのようにアルゴリズムを用いているのか、白日の下にさらそう。 ソーシャルメディアを成り立たせているのは人間の力だが、ユーザーが入力したデータを利用できる状態にする仕組みは、アルゴリズムによって作られている。現在活動している無数のソーシャルメディアサイトで実証済みのことだが、ユーザーの関与とアルゴリズムによる処理ルールの上手いバランスを見出すことは、とても難しくなりがちだ。これから紹介するアルゴリズムは、悪意のないユーザーと結びついて初めてうまくいくものだ。 人気ソーシャル

    著名ソーシャルメディアが使っているアルゴリズムを大公開! | Moz - SEOとインバウンドマーケティングの実践情報
    kohei_april20
    kohei_april20 2008/08/21
    どこもシンプルなんだなぁ
  • Blob Physics « Cowboy Programming

    This article was originally published in the “Inner Product� column in Game Developer Magazine, May 2006 USING VERLET PHYSICS TO SIMULATE BLOBS Download the blob code and executable: DOWNLOAD 91K Games such as Gish from Chronic Logic on the PC and LocoRoco from Sony on the PSP use a 2D physical simulation of a blob as the main character. The physics behind this blob provides the main basis for

  • B+-tree

    □ B-tree ではレコードそのものをノードに入れるので,ページに入れられる レコードの数が少ない. これに対して,通常の索引ではキー値とポインタのみであるので,一ページに 入る量が増やせる. この観点から B-tree を改良したのが B-tree で,B-tree よりも 一般的である. □ 図6.8 (p. 116) に索引部が 次の B-tree と同様で, leaf ノードのエントリ数が 最大 3 のものを示す. B-tree と異なり,データレコード自体は leaf にのみ記録されるので, v キー値の出現の様子を見ると,重複がある.(例: 25 や 16 など.) leaf ノードは 一般にポインタでつながれているので,レコードをキー順に アクセスするのは,B-tree の走査よりも簡単である. □ 格納できるエントリ数の違いを見ておく. レコードサイズが 256 で,ペー

  • Hey! Java Programming! //B-Tree Structure//

    B-Tree はツリー構造をなすデータ構造ですが、均一に枝が伸びるように設計されているためバイナリツリーよりも効率が良く、しかもハードディスクなどに簡単に保存する事ができます。 B-Tree の特徴 B-Tree 構造はツリー構造の一種です。しかしバイナリツリーと違い、ノードはページと呼ばれる単位で構成され、枝は左右均一に伸びるように設計されているのでバイナリツリーよりも一般的に使用されるツリー構造です。一つのページにはいくつか (遇数個) のデータが保存され、データとデータの間にそのデータの間となる別のページへの枝が伸びています。たとえば、1-2-3-4-5 の順番で以下のアプレットに値を入力してください。3 をルートとしてその左側に 3 よりも小さい 1-2 ページが保存され、右側に 4-5 ページが保存されます (ページの最大個数は 4 です)。 DOWNLOAD APPLET CO

  • GoogleのMapReduceアルゴリズムをJavaで理解する

    GoogleMapReduceアルゴリズムをJavaで理解する:いま再注目の分散処理技術(前編)(1/2 ページ) 最近注目を浴びている分散処理技術MapReduce」の利点をサンプルからアルゴリズムレベルで理解し、昔からあるJava関連の分散処理技術を見直す特集企画(編集部) いま注目の大規模分散処理アルゴリズム 最近、大規模分散処理が注目を浴びています。特に、「MapReduce」というアルゴリズムについて目にすることが多くなりました。Googleの膨大なサーバ処理で使われているということで、ここ数年の分散処理技術の中では特に注目を浴びているようです(参考「見えるグーグル、見えないグーグル」)。MapReduceアルゴリズムを使う利点とは、いったい何なのでしょうか。なぜ、いま注目を浴びているのでしょうか。 その詳細は「MapReduce : Simplified Data Proc

    GoogleのMapReduceアルゴリズムをJavaで理解する
  • Kazuho@Cybozu Labs: フレンド・タイムライン処理の原理と実践

    « MySQL のクエリ最適化における、もうひとつの検証方法 | メイン | MySQL (InnoDB) に直接アクセスしてタイムライン処理を高速化する話 » 2008年06月09日 フレンド・タイムライン処理の原理と実践 MySQL (InnoDB) に直接アクセスしてタイムライン処理を高速化する話に続きます。 Twitter が注目されるようになって久しい今日この頃ですが、友人の投稿を時系列に並べて表示する、というのは、Twitter に限らず Mixi の「マイミクシィ最新日記」やはてなブックマークの「お気に入り」等、ソーシャルなウェブサービスにおいては一般的な手法です。ですが、この処理 (以下「フレンド・タイムライン」と呼ぶ) は、一見簡単そうに見えて、実装には様々な困難が伴います。記事では、「フレンド・タイムライン」を実現する、プッシュ型とプル型の二種類の手法について、その原

  • 動的計画法 - Wikipedia

    動的計画法(どうてきけいかくほう、英: Dynamic Programming, DP)は、計算機科学の分野において、アルゴリズムの分類の1つである。対象となる問題を複数の部分問題に分割し、部分問題の計算結果の記録を利用して全体の問題を解く手法を総称してこう呼ぶ。 定義[編集] 細かくアルゴリズムが定義されているわけではなく、下記2条件を満たすアルゴリズムの総称である。 帰納的な関係の利用:より小さな問題例の解や計算結果を帰納的な関係を利用してより大きな問題例を解くのに使用する。 計算結果の記録:小さな問題例、計算結果から記録し、同じ計算を何度も行うことを避ける。帰納的な関係での参照を効率よく行うために、計算結果は整数、文字やその組みなどを見出しにして管理される。 概要[編集] 「動的計画法(dynamic programming)」という言葉は1940年代にリチャード・E・ベルマンが最初

    動的計画法 - Wikipedia
    kohei_april20
    kohei_april20 2008/05/23
    動的計画法っていうのか。知らなくても自然とこういう書き方はするようになるけども。
  • 1