[B! programming][algorithm] satojkovicのブックマーク

ｃ++で入力画像の慣性主軸を表示させたいのですがｃｐｐをどうすればよいでしょうか？ - //-----------------//H... - Yahoo!知恵袋

ｃ++で入力画像の慣性主軸を表示させたいのですがｃｐｐをどうすればよいでしょうか？ //----------------- // Header File //----------------- #include "image.h" #include "image_processing.h" #include <fstream> #include <iostream> #include <math.h> void image_processing::extractRed(image& bmpimage){ for(int j=0;j<bmpimage.height();j++){ for(int i=0;i<bmpimage.width();i++){ bmpimage.setG(i,j,0); bmpimage.setB(i,j,0); } } return; } void image_p

satojkovic 2010/09/09

リンク

動的計画法は再帰で表せ

動的計画法の説明は常に再帰関数で書き表すことにしています．いやゆるメモ化再帰です．参照透過な関数は，同じ引数に対して同じ値を返すので，保存しておけばいいという感覚です．計算量の見積もりも簡単で，引数の異なり数に関数中のループの上限をかければおしまいです．特に再帰で書くことに慣れていれば自明に書けますし，テーブルを使ったDPと違って，ループの順番を意識する必要がありません．このテクニックは学部時代に@ohkuraに教えてもらいました．関数型言語に触れた今でこそ当たり前に見えますが，当時は目から鱗だったのを覚えています．メモ化再帰と不動点に関する@kinabaさんの日記や，プログラミングコンテスト的には@chokudaiさんの記事が参考になります．今更ですが，ちょっと例で説明します．フィボナッチ数を計算する関数fib(x)は再帰式で，fib(x) = fib(x - 1) + fib(x

satojkovic 2010/05/31

リンク

最強最速アルゴリズマー養成講座：アルゴリズマーの登竜門、「動的計画法・メモ化再帰」はこんなに簡単だった (1/5) - ITmedia エンタープライズ

動的計画法とメモ化再帰今回は、非常によく用いられるアルゴリズムである、「動的計画法」「メモ化再帰」について説明します。この2つはセットで覚えて、両方使えるようにしておくと便利です。なお、メモ化再帰に関しては、第5・6回の連載の知識を踏まえた上で読んでいただけると、理解が深まります。まだお読みになっていない方は、この機会にぜひご覧ください。中学受験などを経験された方であれば、こういった問題を一度は解いたことがあるのではないでしょうか。小学校の知識までで解こうとすれば、少し時間は掛かるかもしれませんが、それでもこれが解けないという方は少ないだろうと思います。この問題をプログラムで解こうとすると、さまざまな解法が存在します。解き方によって計算時間や有効範囲が大きく変化しますので、それぞれのパターンについて考えます。以下の説明では、縦h、横wとして表記し、プログラムの実行時間に関しては、

satojkovic 2010/05/17

リンク

猫はうろうろ - yasuhisa's blog

にゃーにゃー、ではなくてw。情報学類(今名前変わったんだっけか)のほうで出ている自然言語処理の講義ほうで、形態素解析をするための「wikipedia:ビタビアルゴリズム(Viterbi algorithm)」というのを勉強しました(GWの前くらいに)。なんか全然分かっていなかったので、書いてみることにしました。アルゴリズムの種類としては動的計画法(Dynamic Programming)に入るので、アルゴリズムデザインのほうの勉強にもなるし(という合理化)。「猫はうろうろ」という文字列は「猫、はう、ろう、ろ」や「猫、は、うろうろ」など様々な形で形態素解析することができます。これをある基準で分解したいのですが、ここでは一番単純そうな単語数最小法と呼ばれる方法でやります。このやり方で「猫はうろうろ」と「家におくりました」を形態素解析すると結果は次のようになります。 /tmp% ruby v

satojkovic 2010/05/09

ビタビアルゴリズムによる形態素解析

リンク

lucille 開発日記: non-Negative Matrix Factorization

non-Negative Matrix Factorization 今年の SIGGRAPH 2004 の論文、Efficient BRDF Importance Sampling Using A Factored Representation では、データを圧縮、インポータンスサンプルしやすいように、二次元の行列を 2 つのより要素数の少ない二次元の行列の積に分解( Y = GF のように、たとえば 4x4 行列を、 4x1 と 1x4 の 2 つの行列に分解 ) しているのですが、このとき非負値行列分解(non-negative matrix factorization, NMF)と呼ばれる手法を用いています。 NMF は、名前の通り負値の要素のない行列を、分解後の行列もまた負値の要素を持たないようする手法です。特異値分解(singular value decomposition,

satojkovic 2010/04/22

リンク

手軽にTF/IDFを計算するモジュール - download_takeshi’s diary

情報検索の分野でよく使われるアルゴリズムで「TF/IDF」というものがあります。ドキュメントの中から「特徴語」を抽出する、といったような用途でよく使われています。 TF/IDFアルゴリズムのくわしい解説はこことかここを見てください。今回はこのTF/IDFの計算を「簡単」に実現するためのperlモジュールをCPANに上げましたので、ご紹介します。なまえはLingua::JA::TFIDFといいます。 Lingua::JA::TFIDF - TF/IDF calculator based on MeCab. http://search.cpan.org/~miki/Lingua-JA-TFIDF TF/IDF実装の困りどころ TF/IDFの実装を試みた方であればわかると思うのですが、実際にやろうとすると、TF（Term Frequency）の計算はなんら難しくありませんが、IDF（Inve

satojkovic 2009/09/27

TF/IDFを計算するperlモジュール

リンク

レーベンシュタイン距離を使って電話でのイライラを解決する - kenmazの日記

電話で自分の苗字を伝えようとしても、電話相手に正しく伝わらないことがある。私が「松前です」と告げても、電話相手は「はい、増前さまですね」と間違って復唱しやがることがある。いずれ「夏前」とか「安前」とか「松苗」とか、いろいろ間違われるようになるかもしれない。このような不運な事故を回避するには、事前に間違えられやすい苗字を洗い出しておいて、ばっちり発音を練習しておく必要がある。さて「松前」と似ている苗字を洗い出すにはどうすればよいだろうか。そんなとき使えそうなのが「レーベンシュタイン距離」である。「レーベンシュタイン距離」とは、ある単語を、別の単語に書き換えるために必要な、文字の挿入／削除／置換操作の回数のことである。レーベンシュタイン距離を使えば、ある単語同士がどれくらい似ているか、ということが分かる。レーベンシュタイン距離 http://ja.wikipedia.org/wiki/%

satojkovic 2009/08/11

リンク

アルゴリズムと計算量

金庫破りと計算量膨張 n 桁の番号をもつ暗証ロックがあるとします。 2 桁であれば 00 〜 99 の 100 個の正解があるわけで、 0 番から順に入力していく解き方では、最悪の場合は 100 手目に開きます。 99 が正解とは限らないので、平均的にはこれより早く解き終わります。 0 であるときの確率は 1/100 で、このときの手数は 1 手です。 1 であるときの確率は 1/100 で、このときの手数は 2 手です。 2 であるときの確率は 1/100 で、このときの手数は 3 手です。 3 であるときの確率は 1/100 で、このときの手数は 4 手です。 : 99 であるときの確率は 1/100 で、このときの手数は 100 手です。つまり、平均手数はにより、100 手目の約半分です。ここでいう解き方をアルゴリズムといい、問題を解くための手数 (てかず) のことを計

satojkovic 2009/06/16

リンク

アルゴリズムとデータ構造編　トップページ●Programing Place

サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

satojkovic 2009/04/20

リンク

B木 - naoyaのはてなダイアリー

昨年から続いているアルゴリズムイントロダクション輪講も、早いもので次は18章です。18章のテーマはB木(B Tree, Bツリー) です。B木はマルチウェイ平衡木(多分木による平衡木)で、データベースやファイルシステムなどでも良く使われる重要なデータ構造です。B木は一つの木の頂点にぶら下がる枝の本数の下限と上限を設けた上、常に平衡木であることを制約としたデータ構造になります。輪講の予習がてら、B木を Python で実装してみました。ソースコードを最後に掲載します。以下は B木に関する考察です。 B木がなぜ重要なのか B木が重要なのは、B木(の変種であるB+木*1など)が二次記憶装置上で効率良く操作できるように設計されたデータ構造だからです。データベースを利用するウェブアプリケーションなど、二次記憶(ハードディスク)上の大量のデータを扱うソフトウェアを運用した経験がある方なら、いかにディ

satojkovic 2009/04/13

リンク

アルゴリズムイントロダクション輪講@京都 - naoyaのはてなダイアリー

社内エンジニアの間に、計算機科学をマジメにやろうという機運が高まっています。それを受けはてな社内で計算機科学に関する教科書の輪講をやろうという話になりました。という訳でまずはアルゴリズムの教科書「アルゴリズムイントロダクション第1巻改訂2版 (1)」を輪講してみることにします。はてなスタッフだけでなく社外からの参加も募集しているので、京都オフィスに近い方はぜひご参加下さい。 id:motemen がコンピュータサイエンス関連書籍の輪講を開催するとのこと。もちろん自分も参加します。教科書は何が良いか色々考えたようですが、まずはアルゴリズムイントロダクションに決まったようです。アルゴリズムイントロダクション、ちょうど今日届いたのでざっと見てみた所、数学的な観点からアルゴリズム/データ構造についての基礎を論じている良い書籍だと思いました。アルゴリズムとデータ構造は最も重要な基礎ですが、これ

satojkovic 2008/08/14

リンク

ACM/ICPC国内予選突破の手引き

ACM/ICPCの2008年度の大会日程が公開されています。国内予選は2008年7月4日，アジア地区予選会津大会は2008年10月25日～27日でホスト校は会津大学です。参加登録締め切りは2008年6月20日です。ここではACM/ICPC（ACM国際大学対抗プログラミングコンテスト: ACM International Collegiate Programming Contest）で国内予選を突破するために必要な情報を載せています。 ACM/ICPC自体については2006年度の横浜大会のWebサイトなどを読んでください。結局のところ，ACM/ICPCで良い成績を残すにはひたすら問題を解く練習をするしかありません。ですが，出題される問題の多くはいくつかのカテゴリ，例えば探索問題やグラフ問題，あるいは幾何問題などに分類することができます。つまり，「傾向と対策」が存在します。本サ

satojkovic 2008/07/03

リンク

http://homepage2.nifty.com/skimp-studio/htm/crawl_top.htm

Crawl 3Dプログラム(3Dのグラフィックや動きを扱うプログラム)入門コーナーです。 1.骨 1-1.ベクトル其の壱 1-2.ベクトル其の弐 1-3.ベクトル其の参 1-4.行列其の壱 1-5.行列其の弐 1-6.座標変換其の壱 1-7.座標変換其の弐 1-8.座標変換其の参 1-9.座標変換其の四 1-10.骨其の壱 2.球 2-1.微分其の壱 2-2.微分其の弐 2-3.積分其の壱 2-3.積分其の弐

satojkovic 2008/06/15

リンク

Part1　アルゴリズムと計算量を理解する

量理論とは，一見してつかみどころのないアルゴリズムを定量的に把握し，その良し悪しを評価する考え方である。アルゴリズム（Algorithm）とは，与えられた問題を解く手順のことだ。コンピュータの世界では，「プログラムによって問題を解く手順」ということになる。 JIS（日本工業規格）は，アルゴリズムを次のように厳格に定義している。「明確に定義された有限個の規則の集まりであって，有限回適用することにより問題を解くもの。例えば，sin(X)を決められた精度で求める算術的な手順を，もれなく記述した文」（JIS X 0001-1987より）。注目して欲しいのは，「有限個の規則」と「有限回適用」という言葉である。アルゴリズムを構成する規則の個数と，それを適用した時の処理の回数が有限であることが，アルゴリズムの条件になる。したがって，それらの“数”からアルゴリズムの良し悪しを評価できることになる。例

satojkovic 2008/06/11

リンク

Kazuho@Cybozu Labs: フレンド・タイムライン処理の原理と実践

« MySQL のクエリ最適化における、もうひとつの検証方法 | メイン | MySQL (InnoDB) に直接アクセスしてタイムライン処理を高速化する話 » 2008年06月09日フレンド・タイムライン処理の原理と実践 MySQL (InnoDB) に直接アクセスしてタイムライン処理を高速化する話に続きます。 Twitter が注目されるようになって久しい今日この頃ですが、友人の投稿を時系列に並べて表示する、というのは、Twitter に限らず Mixi の「マイミクシィ最新日記」やはてなブックマークの「お気に入り」等、ソーシャルなウェブサービスにおいては一般的な手法です。ですが、この処理 (以下「フレンド・タイムライン」と呼ぶ) は、一見簡単そうに見えて、実装には様々な困難が伴います。本記事では、「フレンド・タイムライン」を実現する、プッシュ型とプル型の二種類の手法について、その原

satojkovic 2008/06/09

リンク

ウノウラボ Unoh Labs: 圧縮アルゴリズム

尾藤正人(a.k.a BTO)ですコンピュータを使ってる方ならいつもお世話になってるデータ圧縮。 gzipのようなツールで意識して圧縮していることもあれば、フォーマット自体に圧縮機能が備わっていて、意識しないで使っているケースもあるかと思います。毎日のようにお世話になってるデータ圧縮ですが、その原理を知らない方も多いのではないでしょうか。かくいう僕自身も、つい最近までは全く知りませんでした。そこで、先日の社内勉強会で圧縮アルゴリズムについて一通りやってみました。その資料を公開します。僕も専門家ほど詳しいわけでもなく、単に勉強してみただけのくちなので、いろいろおかしな点もあるかもしれません。何かありましたら、いろいろご指摘いただければと思います。プレゼン資料の作成にはデータ圧縮法概説を大いに参考させていただきました。参考っていうか、ほとんどそのまんまです。ぶっちゃけデータ

satojkovic 2008/01/27

リンク

タグクラウドのアルゴリズム (それなりブログ)

それなりブログ 20台後半からWebエンジニアに転生した人が書く、プログラム・無駄口とかのそれなりのブログ管理人: kjirou　　座右の銘: 「三度の飯より、四度の飯」タグクラウドの大きさを決めているアルゴリズムはどうなってるのかなと、PHPのTagCloud.phpと、Rubyのtagcloud-rubyを読んみました。両方ともCSSセレクタ生成等が処理の中に入ってしまっており、ライブラリとしてはやや微妙な感じ。（元のPerlの実装に合わせているからだと思いますが）なので、アルゴリズムだけ貰おうかと。【最も基本的なアルゴリズム】最終的に、各タグの大きさは25段階の範囲で区分される。ソース内ではこれを level と読んでおり、0-24の範囲で指定している。 level算出方法は以下の通り 1. 最もタグ付けされている回数が多いタグの回数を取得し、それの平方根を求

satojkovic 2008/01/04

リンク

HowGoogleEarthReallyWorks - Google Earth の <ほんとの> 仕組み

HowGoogleEarthReallyWorks - Google Earth の <ほんとの> 仕組み目次この文書について Google Earth の <ほんとの> 仕組みパート1 終幕: 3D の仮想地球を描画する基本より良いフィルタリングを持ち込むさあ本題に入ろう Google Earth の <ほんとの> 仕組みこの文書について RealityPrime > How Google Earth [Really] Works の日本語訳です。推敲添削歓迎: 誤訳、タイポ、不統一、そのほか ... 有名サイト HowStuffWorks.com の記事 "How Google Earth Works" を読んだら, この記事が "それがどれだけスゴいか" や "その使い方" を書くだけで "それが(ほんとは)どんな仕組みで動いているのか" を説明していないこと

satojkovic 2007/11/05

リンク

B木 (B-tree)

□ 多レベル索引の一種挿入や削除のタイミングで動的な再編成が効率良く可能．レベル数は層レコード数に対してですむ． □ B-tree よりも後述の B-tree の方が良く使われるが，原理の理解は B-tree の方が理解しやすいので，先に説明する．以下ではキー値に重複がないものと仮定する．定義 8 (B木 (B-tree)) が正整数であるとする．次の B木 (a B-tree of degree ) の各ノードは次のような情報を持つページで，以下に述べる条件を満たすものである (図 6.5, p112 参照．): はroot ノード以外ではである． root ノードではである．レコードのキー値をで表すとすると，である．レコードは最大で個まで持てる．はページへのポインタである． (つまり部分木へのポインタである．) 中に現れる全てのレコード

satojkovic 2005/06/07

リンク

ブロックアルゴリズムとB-Treeアルゴリズム

ファイルサーチを高速化するB-Treeアルゴリズム ext2、ext3がベースとするブロックアルゴリズムは、ブロック数が対応するディスクのジオメトリ数に制限されること、ファイルサーチにO（n）かかる（注）こと、ファイルサイズに関係するパフォーマンス低下など、いくつかの問題があった。注：「O（n）」とは、実行時間が入力の大きさ「n」に比例するアルゴリズムである。O（n）は「nのオーダー」または「オーダーn」と読む。後述する「O（log n）」は、アルゴリズムの計算量に関する議論の場合logの底は常に2で、O（log n）の方がO（n）よりも効率が良い。例えばn＝8の場合、O（log n）は入力8に対して3回の実行で済むが、O（n）は8回の実行となる。 ReiserFS、JFS、XFSといったファイルシステムでは、こうしたブロックアルゴリズムの限界に対して、早い段階からデータベースの技術をフ

satojkovic 2005/06/07

リンク

はてなブックマーク

タグ

関連タグで絞り込む (10)

programmingとalgorithmに関するsatojkovicのブックマーク (20)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス