タグ

algorithmとAlgorithmに関するtanakaBoxのブックマーク (301)

  • Bayesian Setsを試してみた - のんびり読書日記

    この前YAPC Asia 2009に参加してきたのですが、そこで「はてなブックマークのシステムについて」の発表の中で、「はてブの関連エントリはBayesian Setsを使って計算されている」という話を聞いてBayesian Setsに俄然興味が湧いてきました。Bayesian Setsは以前論文だけ少し読んで、あまりよく分からないまま放置していたのですが、せっかくなのでPerlで作って試してみました。 Bayesian Setsについて詳しくは、以下のリンク先の資料をご参照下さい。 Bayesian Setsの論文 Bayesian Setsの詳しい説明記事 bsets, The Bayesian Sets algorithm. (Matlabのコード) 実際に作成したコードは以下の通りです。上記のMatlabのコードを参考にさせていただいています。 #!/usr/bin/perl #

    Bayesian Setsを試してみた - のんびり読書日記
    tanakaBox
    tanakaBox 2009/09/18
    面白そう。
  • Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure

    画像内に映り込んだ所望のオブジェクトを排除し、違和感の無い画像を生成するシーン補完技術に関しては近年複数の研究成果が発表されている。しかし中でも2007年のSIGGRAPHにて米カーネギメロン大のJames HaysとAlexei A. Efrosが発表した手法*1はブレークスルーとなりうる画期的なものだ。 論より証拠、早速適用例を見てみよう。エントリで利用する画像はPresentationからの引用である。元画像の中から邪魔なオブジェクト等の隠蔽すべき領域を指定すると、その領域が補完された画像が自動的に生成される。 アルゴリズム 効果は抜群だがアイデア自体は単純なものだ。Web上には莫大な数量の画像がアップされており、今や対象となる画像の類似画像を一瞬にして大量に検索することができる。そこで、検索された類似画像で隠蔽領域を完全に置き換えてしまうことで違和感の無い補完画像を生成するのだ。

    Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure
    tanakaBox
    tanakaBox 2009/09/15
    集合知による補完。エロへの応用しか思いつかんw
  • YAPC::Asia 2009 1日目 「Perlで圧縮」の資料 - naoyaのはてなダイアリー

    1日目の発表を終えました。資料を公開します。 Perlで圧縮View more presentations from Naoya Ito. 発表の方は少し駆け足になってしまいました。明日ははてなブックマークのシステム事例の話をしたいと思います。 発表の様子 via: http://yapcasia2009.ficia.com/

    tanakaBox
    tanakaBox 2009/09/15
    ハフマン符号あたりまで読んだ。
  • 連載:検索エンジンを作る|gihyo.jp … 技術評論社

    運営元のロゴ Copyright © 2007-2026 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    連載:検索エンジンを作る|gihyo.jp … 技術評論社
    tanakaBox
    tanakaBox 2009/09/15
    素晴らしい連載記事。
  • 転置インデックスを実装しよう - mixi engineer blog

    相対性理論のボーカルが頭から離れないmikioです。熱いわっふるの声に応えて今回はTokyo Cabinetのテーブルデータベースにおける検索機能の実装について語ってみたいと思います。とても長いのですが、最後まで読んだあかつきには、自分でも全文検索エンジンを作れると思っていただければ嬉しいです。 デモ モチベーションをあげていただくために、100行のソースコードで検索UIのデモを作ってみました。Java 6の日語文書を対象としているので、「stringbuffer」とか「コンパイル」とか「倍精度浮動小数」とかそれっぽい用語で検索してみてください。 インデックスがちゃんとできていれば、たった100行で某検索エンジン風味の検索機能をあなたのデータを対象にして動かすことができます。ソースコードはこちら(テンプレートはこちら)です。 でも、今回はUIの話ではないのです。ものすごく地味に、全文検索

    転置インデックスを実装しよう - mixi engineer blog
    tanakaBox
    tanakaBox 2009/09/15
    転置インデックスの実装。全然読めないぜw
  • Tamarin での文字列 - steps to phantasien(2008-08-31)

    2008-08-31 近況 LL Future というイベントに呼んで頂き, 中野へ. 前日の激しい雷で眠りが浅く寝坊したら, 基調講演は Larry Wall だったらしい. 聞き逃した. なんてこったい... そしてサインを貰う準備もしていなかった. 昼飯をべる暇があったら紀伊国屋に駆けこむんだったといまだに後悔している. おしいことをした. 宴会でゴルフ場経営者に見せてもらった サイン実物はとても気が利いたもので, まったくうらやましい. 彼のは年季が入った版の上にかなり読みこまれた形跡があったので, Larry Wall も嬉しかったことだろうな. 私もいつか実現するであろう Stroustrup の来日に向け, 件のを読み込んでおかねばなるまい. パネルの内容は shibuya.js 番外編というかんじで, JS や ActionScript の上で実装した処理系の紹介を中

    tanakaBox
    tanakaBox 2009/09/15
    文字列についての話題。
  • Alcor の Abbreviation Scoring - steps to phantasien(2009-09-12)

    同僚の生産性ツール愛好家が熱に浮かされて言った. "QuickSilver の検索がすごいんだよ!" どう凄いのかというと, たとえば "Skype を検索するのに <sp> でいい!" らしい. それは凄いのかも. 私もいちおう QuickSilver を使っているけれど, 素敵機能の類はまったく活用していない. だいたい私の使うアプリケーションはどれも一文字で特定できる. Firefox, Emacs, iTerm, Activity Monitor... そういえば iTunes は iTerm と被ってる. ためしに <iu> と打ってみたら iTunes にマッチする. なんとなく凄い気がしてきた. 同僚はこのアルゴリズムが気になるらしい. 編集距離の仲間かとも思ったけれど, 違う気がする. とりあえずぐぐってみたところ, QuickSilver は 2007 年に オープンソー

    tanakaBox
    tanakaBox 2009/09/15
    ステキ。
  • 『Blogopolisの裏側』発表資料 - kaisehのブログ

    昨日のSeasar Conference 2009 Autumnで発表させていただいた『Blogopolisの裏側』の資料を公開します。 Blogopolisの裏側View more documents from kaiseh. 資料の28枚目に、重み付きボロノイ図の重心ベースレイアウトの説明用動画がありました。その動画は以下にアップしました。 講演者の皆さん、運営の皆様、当にお疲れ様でした! 追記 id:mi-changさん p14ででてる「頂点数」、「多角形数」って何を意味してるんだろう?頂点数が多いということはより多くのタグと結びついているってこと? これは、1つ1つのエントリーやブログ、地区(カテゴリ)に対応する土地の幾何データのことです。例えば、5角形の土地の場合は5個の頂点座標が必要になります。土地の頂点数はレイアウト上の理由で決まるもので、タグとは直接関係はありません。

    『Blogopolisの裏側』発表資料 - kaisehのブログ
    tanakaBox
    tanakaBox 2009/09/15
    数値化手法がお役立ち。
  • 愛媛大学工学部情報工学科プログラミングコンテスト

    2016年度コンテストは終了しました.ありがとうございました. また,これまで多くの方にご参加ご協力頂いて来たコンテストですが,サーバーの運用条件の事情変更によりコンテストを中止させて頂きます.大変申し訳ありませんが何卒ご理解を賜りますようお願い申し上げます.2013年からこれまで4回開催したコンテストにご参加頂いた全ての参加者の方,学校の監督・顧問の先生方に感謝申し上げます. 【日程】 平成28年8月10日(水)15:00~16:30 【会場】 オンライン

    tanakaBox
    tanakaBox 2009/09/06
    過去問はそれほど難しくないので、解いてみようと思う。
  • コンピュータ囲碁におけるモンテカルロ法 ~理論編~ 美添一樹

    tanakaBox
    tanakaBox 2009/09/03
    モンテカルロ木探索までの道のり。わかりやすい。GnuGoは攻め合いに弱いので僕でも勝てちゃう。もう一歩イノベーションが必要かも。
  • FrontPage - 情報論的学習理論と機械学習の「朱鷺の杜Wiki」

    朱鷺の杜Wiki(ときのもり うぃき)† 朱鷺の杜Wikiは,機械学習に関連した,データマイニング,情報理論,計算論的学習理論,統計,統計物理についての情報交換の場です.これら機械学習関係の話題,リンク,関連事項,書籍・論文紹介などの情報を扱います. 更新されたページを確認するにはRSSリーダを使って右下のRSSリンクをチェックするか,最終更新のページを参照してください. ページの中でどこが更新されたかを見るには,上の「差分」をクリックして下さい. 数式の表示に MathJax を利用しています.数式の上でコンテキストメニューを使うと各種の設定が可能です.特に設定をしなくても数式は閲覧できますが,フォントをインストールすれば数式の表示がきれいで高速になります.詳しくは 数式の表示 のページを参照して下さい. ごく簡単なWikiの使い方がこのページの最後にあります.トップページやメニューなど

    tanakaBox
    tanakaBox 2009/09/02
    情報論的学習理論,機械学習,統計,統計物理,データマイニング
  • 軽量データクラスタリングツールbayon - mixi engineer blog

    逆転検事を先日クリアして、久しぶりに逆転裁判1〜3をやり直そうか迷い中のfujisawaです。シンプルなデータクラスタリングツールを作成しましたので、そのご紹介をさせていただきます。 クラスタリングとは クラスタリングとは、対象のデータ集合中で似ているもの同士をまとめて、いくつかのグループにデータ集合を分割することです。データマイニングや統計分析などでよく利用され、データ集合の傾向を調べたいときなどに役に立ちます。 例えば下図の例ですと、当初はデータがゴチャゴチャと混ざっていてよく分からなかったのですが、クラスタリングすることで、実際は3つのグループのデータのみから構成されていることが分かります。 様々なクラスタリング手法がこれまでに提案されていますが、有名なところではK-means法などが挙げられます。ここでは詳細については触れませんが、クラスタリングについてより詳しく知りたい方は以下の

    軽量データクラスタリングツールbayon - mixi engineer blog
    tanakaBox
    tanakaBox 2009/09/02
    クラスタリングツール
  • GitHub - livedoor/cicindela2: a highly customizable recommendation engine written in perl + MySQL

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - livedoor/cicindela2: a highly customizable recommendation engine written in perl + MySQL
    tanakaBox
    tanakaBox 2009/09/01
    ]datamining] このページを見た人はこんなページも見ています。perl + MySQL
  • Tutorial_ja - bayon - Google Code

    Code Archive Skip to content Google About Google Privacy Terms

    tanakaBox
    tanakaBox 2009/09/01
    クラスタリングツール。Repeated Bisection法を使ってるみたい。
  • 目次

    ヘッダーをスキップ Oracle Data Mining概要 11g リリース1(11.1) E05704-02 索引 次へ 目次 例一覧 図一覧 表一覧 タイトルおよび著作権の情報 はじめに 対象読者 ドキュメントのアクセシビリティについて 関連ドキュメント 表記規則 サポートおよびサービス Oracle Data Miningの新機能 Oracle Data Mining 11g リリース1(11.1)の新機能 Oracle Data Mining 10g リリース2(10.2)の新機能 第I部 概要 1 データ・マイニングとは データ・マイニングとは 自動検出 予測 グループ化 実用的な情報 データ・マイニングと統計 データ・マイニングとOLAP データ・マイニングとデータ・ウェアハウス データ・マイニングで可能なこと、不可能なこと 適切な問題の設定 データの理解 データ・マイニング

    tanakaBox
    tanakaBox 2009/09/01
    Oracle Data Mining。オラクル面白そうだ。
  • クラスタリングの定番アルゴリズム「K-means法」をビジュアライズしてみた - てっく煮ブログ

    集合知プログラミング を読んでいたら、K-means 法(K平均法)の説明が出てきました。K-means 法はクラスタリングを行うための定番のアルゴリズムらしいです。存在は知っていたんだけどいまいちピンときていなかったので、動作を理解するためにサンプルを作ってみました。クリックすると1ステップずつ動かすことができます。クラスタの数や点の数を変更して、RESET を押すと好きなパラメータで試すことができます。こうやって1ステップずつ確認しながら動かしてみると、意外に単純な仕組みなのが実感できました。K-means 法とはK平均法 - Wikipedia に詳しく書いてあるけど、もうすこしザックリと書くとこんなイメージになります。各点にランダムにクラスタを割り当てるクラスタの重心を計算する。点のクラスタを、一番近い重心のクラスタに変更する変化がなければ終了。変化がある限りは 2. に戻る。これ

    tanakaBox
    tanakaBox 2009/09/01
    K-means法の可視化
  • 微分積分

    静岡理工科大学情報学部コンピュータシステム学科菅沼研究室のページです.主として,プログラミング言語( HTML,C/C++, Java, JavaScript, PHP, HTML,VB,C# ),及び,システムエンジニアとしての基礎知識(数学,オペレーションズ・リサーチやシステム工学関連の手法)を扱っています.

    tanakaBox
    tanakaBox 2009/09/01
    巡回セールスマン問題を遺伝的アルゴリズムで解く。
  • Garev Project

    注意: 以下の内容は、遺伝的アルゴリズム(GA)をあまりよく知らない素人が 行ったシミュレーションの結果です。これを元に遺伝的アルゴリズムについて 何か知ったつもりになったり、他の人に知ったかぶりした時などに 起きた損害、かいた恥などには一切責任を取りませんのであしからず。 イントロダクション プログラムは小学生の頃から組んでいたが、まともに組み出したのは 中学生くらいからだろうか。当時プログラムという趣味はかなり マニアックで、「プログラマーオタク」という図式がほぼ成り立っている頃 だった。僕らは非力なコンピューターを駆使し、ゲームを作ったり パズルを解くプログラムを作って速度を競ったりといろいろやったものだ。 さて、プログラムというと、普通考えるのはアルゴリズムの事だろう。 アルゴリズムとはある問題を解くとき場合の手順を抽象化したもので、 プログラムで表現するとほとんど整数を扱

    tanakaBox
    tanakaBox 2009/09/01
    遺伝的アルゴリズムで、オセロを作った試行錯誤の記録。面白い。
  • クラスタリングによる迷路作成アルゴリズム

    はじめに クラスタリングアルゴリズムにより、解くと絵が浮かび上がる 迷路を作成する方法を紹介する。 クラスタリングとは ウェブのリンク情報や、mixiの友人関係など、ネットワークの性質を 知りたいことがよくある。このとき、ネットワークの性質として このネットワークにおいて任意に選んだ要素Aと要素Bはつながっているか? このネットワークは全体がつながっているか? つながっていないとしたらいくつのグループに分かれるか? 要素数最大のグループはどれか? などの情報が欲しくなる。このような解析をするときに 必要となるのがクラスタリングである。 クラスタリングとは、同値関係のリストが与えられたときにグループ分けを することである。たとえば、 友達友達友達である と定義すると、友人関係は同値関係を作る。 その上で、 A君とB君は友達 C君とE君は友達 B君とD

    tanakaBox
    tanakaBox 2009/09/01
    スゲー。
  • ■邪神の啓示――『ドルアーガの塔』編

    黒字=2ちゃんねらーの質問 緑字=遠藤氏の回答(文頭のS、A~Eは遠藤氏による質問の評価点。Pはペナルティ級) 赤字=GIL@D/LAB.管理人のコメント(ないのが大半です) □ ドルアーガシリーズのストーリーって、ゲームのために作られたっていう感じがしなくてすごく好きです。勇気を身軽さにかえるティアラとか、力にかえる黄金の鎧とかの設定も当に生きた設定だと思います。 ★ バビロニアンキャッスルサーガは、もちろん「バベルの塔」にインスパイアされて作ったものです。 ある日、同僚の女子社員(和田久美ちゃん、この子が個性的な子なんですよ)と一緒に池袋まである講演会を聞きに行きました(半分仕事)。その会場で渡されたチラシの裏につらつら書いていったイメージを、彼女と共にストーリーの形にまとめたわけです。 天界と魔界の分化、イシターとドルアーガの戦い、ドルアーガの封印などなどのプレストーリーは、いまだ

    tanakaBox
    tanakaBox 2009/09/01
    迷路生成アルゴリズムは棒倒し法。