[B! algorithm][programming] tarchanのブックマーク

ソートの計算量と現実のプログラム

ソートアルゴリズムについての小ネタ。「ソートは迷わずクイックソート」と言われることがよくありますが[1]、場合によってはそれが最適ではないこともあるという話。ここではクイックソートと挿入ソートを比較します。 O-記法で書くとクイックソートの計算量はオーダーはO(n*log(n))で、単純な挿入ソートのそれはO(n^2)なので、見かけ上は前者のほうが速そうなのです。ただし、あくまでこの記法はnが無限に近づいたときの振舞いについて述べているだけなので、現実的なプログラムでは必ずしもクイックソートのほうが速いというわけではないです。次のような仕様のプログラムで実際に両者の速度を比較してみましょう。所定の下の整数要素を持つ配列をソートして、その所要時間出力する第一引数(len): 要素数第二引数(type): アルゴリズムの種類。'i'が挿入ソート。'q'がクイックソート。この仕様を実装

tarchan 2021/10/21

リンク

「結城浩さんのCodeIQ問題は、なぜ面白いのか？」を7つのポイントで解説！｜CodeIQ MAGAZINE

CodeIQで結城浩さんが出題する問題はいつも大人気！なぜなら結城さんは解答者をどう楽しませるかを考えつくしているから。今回は結城浩さんご自身に「なぜこんなに面白い問題を作れるのか」そのこだわりを７つのポイントに絞って書いていただきました。 by 馬場美由紀（CodeIQ中の人）はじめにこんにちは、結城浩です。いつもCodeIQでの出題にご解答いただき、ありがとうございます。今日は、CodeIQで出題しているときに私が心がけていることをお話しします。なお、以下でお話しすることはあくまで私が出題する問題に対する心がけです。CodeIQにはたくさんの出題者さんがバリエーション豊かな出題をしています。他の問題に対して批判するという意図はまったくありませんので念のため。最高の問題出題するときに心がけていることの第一、それは最高の問題を作ろうということです。せっかく時間を掛けて問題

tarchan 2013/12/17

リンク

JavaScriptの文字列を反転する１０の方法とそのパフォーマンス - 風と宇宙とプログラム

はじめに JavaScriptで文字列を反転する１０の方法を（無理矢理？）思いついたので、ちょっと簡単に紹介したい。また、それぞれについて、各ブラウザでパフォーマンスを測定してみたので、その結果も合わせて載せる。文字列のStringオブジェクトには、部分切り出し(substring, slice)や置換(replace)、連結(concat)など豊富な機能があるのに、反転(reverse)機能はない。Arrayのreverseはあるのに、Stringのreverseがないのはどうしてなのだろうか。各ブラウザとそのバージョンは以下の通り： Chrome Firefox Opera Safari IE 13.0.782.112 m 6.0 11.50 5.1(7534.50) 8.0.7600.16335 rev01: C言語的発想空の配列を作って、そこに元の文字列の後ろから１文字つづ入

tarchan 2011/08/25

リンク

ICFPC 2011 - d.y.d.

22:15 11/06/27 ICFPC 2011 ここ 8 年くらいほぼ毎年参加していた ICFP Programming Contest ですが、今年は出題者側に回ってみました。問題の原型決定の議論、画像に変なネタを仕込む、Windows版バイナリのビルドをする、対戦サーバの中身を突貫でどうにかする、などなどをしていました。ゲームのバランス調整が非常によくできていたとの評価を頂いているのですが、肝心のその辺りは、出題チーム内の熟練者達の高度な議論に既についていけなくなっており、私は全然貢献できていないという…。詳しいことは 9 月の ICFP で発表があると思いますので、ここでは今年のテーマの紹介だけ。公式の問題文はこちらです。一言でいうと、関数を呪文に変えて撃ち合う、プログラミング魔法バトル。 Lambda: the Gathering L:tG という２人対戦ゲー

tarchan 2011/06/29

リンク

diffの動作原理を知る～どのようにして差分を導き出すのか | gihyo.jp

UNIXの基本的なコマンドの1つであるdiff。これに実装されているアルゴリズムは実に興味深い世界が広がっています。本稿では、筆者が開発した独自ライブラリ「dtl」をもとに「diffのしくみ」を解説します。はじめに diffは2つのファイルやディレクトリの差分を取るのに使用するプログラムです。ソフトウェア開発を行っている方であれば、SubversionやGitなどのバージョン管理システムを通して利用していることが多いかと思います。本稿ではそのdiffの動作原理について解説します。差分の計算の際に重要な3つの要素差分を計算するというのは次の3つを計算することに帰結します。編集距離 2つの要素列の違いを数値化したもの LCS（Longest Common Subsequence） 2つの要素列の最長共通部分列 SES（Shortest Edit Script）ある要素列を別の要

tarchan 2011/03/14

リンク

マージ・ソート : 巨大データのソート法

はじめにまずはともあれ腕試し、この問題を解いてみてくださいな: 【問1】デタラメな順序で並んだ文字列の集合がテキストファイル「input.txt」に収められています。この文字列群を辞書順（昇順）に並び換えたテキストファイル「sorted.txt」を作りなさい。 ※各文字列は改行で区切られています。プログラミング教本の練習問題、あるいは学校の課題で出てきそうな“お馴染み”の問題です。ソート（整列）アルゴリズムの実装には配列/代入/条件分岐/ループなどなどプログラミングの基本中の基本となる構文を総動員するため、練習問題としてよく使われますね。早速解いてみましょう、ソート・アルゴリズムにはこれまたお馴染みのバブル・ソートを使います。C#、VB.NET、C++/CLIの3本まとめて一気にいきますよ: using System; using System.IO; using System.C

tarchan 2010/09/30

リンク

10兆までの素数のリストを作ってみませんか？

もしあなたがプログラマだったら、プログラムを書いて10兆までの素数のリストを作ってみてほしい。情報システムの開発に携わる人であれば、10兆までの素数のリストを出力するシステムの見積もりを考えてみてほしい。費用はどれくらいかかるか、納期はどれくらいか、あなたはどんな答を出すだろうか。仕様書はうまく書けるだろうか。記者がこんなことをいうのは、自分で10兆までの素数のリストを作ってみて、とても面白かったからだ。図1のプログラムを書いて出力が成功するまで約2週間、夢いっぱいの楽しいひとときを過ごせた。予期せぬ問題も発生したけれど、最後にはコンピュータがまだまだ発展する可能性を持つと感じられた。素数のリストを作る演習は、プログラミングと情報システムにおける有益な演習の一つである。アルゴリズムの有効性が納得できるこの演習の面白い点は、まずアルゴリズムの有効性を納得できる点だ。素数（prime）は

tarchan 2010/07/20

リンク

d.y.d. 2倍だけじゃない

10:01 10/07/20 それでも２倍だ先日のvectorの伸長度合いの記事に関して本当に1.5倍のほうがメモリ効率がよいのかという反応をいただきました。とても興味深い。みんな読みましょう。自分の理解メモ：「再利用ができるから嬉しい」等の議論をするなら、今までに確保したメモリ (1 + r^1 + ... + r^k) のうち、有効に使えてるメモリ r^{k-1} (バッファ拡大直後) や r^k (次のバッファ拡大直前) の割合で評価してみようじゃないかという。まず簡単のために再利用をしない場合を考えると、この割合はそれぞれ (r-1)/r^2、 (r-1)/r になります（途中計算略）。この利用率が最悪になる瞬間 (r-1)/r^2 を最善にしよう、という一つの指標で考えてみると、式を微分なりなんなりしてみると r = 2 で最大(25%)となることがわかります

tarchan 2010/07/06

黄金比すごい！＞黄金比 1.618... より小さくするのには理由がある

リンク

広く知られているinsertion sortのコードは駄目すぎる - やねうらお−よっちゃんイカを食べながら年収1億円稼げる(かも知れない)仕事術

insertion sortは「挿入ソート」と訳される。(Wikipedia→ http://ja.wikipedia.org/wiki/%E6%8C%BF%E5%85%A5%E3%82%BD%E3%83%BC%E3%83%88 ) ■　日本語版 Wikipediaの日本語のページのコードを引用すると次のようになっている。 for (i = 1; i < n; i++) { tmp = data[i]; for (j = i; j > 0 && data[j-1] > tmp; j--) { data[j] = data[j-1]; } data[j] = tmp; }上のコードでは、内側のループでinsertの必要がなかった場合でも最後にdata[j] = tmpでtmp変数をwrite backしており、しかも、insertの必要のなかった場合でもj=iが1回実行される。それらの意味に

tarchan 2009/11/27

リンク

アルゴリズムの紹介

ここでは、プログラムなどでよく使用されるアルゴリズムについて紹介したいと思います。元々は、自分の頭の中を整理することを目的にこのコーナーを開設してみたのですが、最近は継続させることを目的に新しいネタを探すようになってきました。まだまだ面白いテーマがいろいろと残っているので、気力の続く限りは更新していきたいと思います。今までに紹介したテーマに関しても、新しい内容や変更したい箇所などがたくさんあるため、新規テーマと同時進行で修正作業も行なっています。アルゴリズムのコーナーで紹介してきたサンプル・プログラムをいくつか公開しています。「ライン・ルーチン」「円弧描画」「ペイント・ルーチン」「グラフィック・パターンの処理」「多角形の塗りつぶし」を一つにまとめた GraphicLibrary と、「確率・統計」より「一般化線形モデル」までを一つにまとめた Statistics を現在は用意して

tarchan 2009/10/16

リンク

全文検索を実装したソースコードを読もう（1/4）－＠IT

第6回　全文検索を実装したソースコードを読もう倉貫義人松村章弘 TIS株式会社 SonicGarden 2009/9/3 優れたプログラマはコードを書くのと同じくらい、コードを読みこなせなくてはならない。優れたコードを読むことで、自身のスキルも上達するのだ（編集部）いよいよオープンソースの社内SNS「SKIP」を使ったコードリーディングも最終回となりました。Railsの基本的な構成から、テストコードやRSpecの書き方といった内容に加え、前回はOpenIDをRailsで活用する応用編まで、コードとともに学んできました。最終回となる今回は、SKIPの目玉機能の1つである全文検索を扱います。最終回にふさわしく、内容も高度なものになっていますが、ここまでおつきあいいただいた読者の皆さまであれば、十分に理解できる内容だと思います。 SKIPにおける全文検索機能では、任意の検索キーワード

tarchan 2009/09/09

リンク

初級C言語Q&A(15)

初出: C MAGAZINE 1996年8月号 Updated: 1996-09-21 [←1つ前] [→1つ後] [↑質問一覧] [↑記事一覧] [ホームページ] 今回は、よく知られているけどちょっと分かりにくいアルゴリズム、あるいは、今までの連載で出てきたトリッキーなコードについて、どのような原理で動作するのかを紹介してみようと思います。ただし、一般論として、凝ったコードよりも分かりやすいコードの方が価値がある場合が多いということも頭に入れておいてください。凝ったアルゴリズムＱ　【曜日の求め方】 Comp.lang.c FAQ listを見ると、曜日を求める関数として次のものが紹介されていた。 dayofweek(y, m, d) /* 0 = Sunday */ int y, m, d; /* 1 <= m <= 12, y > 1752 or so */ { stat

tarchan 2009/07/15

リンク

一番右端の立っているビット位置を求める「ものすごい」コード - 当面C#と.NETな記録

一番右端の立っているビット位置(RightMostBit)を求めるコードで速いのないかなーと探していたら、ものっっっすごいコードに出会ってしまったのでご紹介。2ch のビット演算スレで 32bit 値のコードに出会って衝撃を受けて、その後 64bit 値版のヒントを見つけたのでコードを書いてみました。この問題はハッカーのたのしみ―本物のプログラマはいかにして問題を解くか (Google book search で原著 Hacker's delight が読めたのでそれで済ませた) で number of trailing zeros (ntz) として紹介されています。bit で考えたときに右側に 0 がいくつあるかを数えるもの。1 だと 0、2 だと 1、0x80 なら 7、12 なら 2 といったぐあい。0 のときに表題どおりの問題として考えるといくつを返すの？ってことになるので、

tarchan 2009/07/14

リンク

ジャンル別ゲームの作り方とアルゴリズムまとめ - ネットサービス研究室

ゲームの作り方とアルゴリズムをジャンル別にまとめてみました。ゲーム制作や、プログラミングの勉強用にご活用ください。言語別ゲームプログラミング制作講座一覧もあわせてお読みください。リンク切れがおきていたものは、URLを表示しておくので、Internet Archiveなどでキャッシュを表示させてみてください。 RPG ゲームの乱数解析乱数を利用した敵出現アルゴリズムの解説各種ゲームプログラム解析 FF、ドラクエ、ロマサガのプログラムの解析。乱数の計算などダメージ計算あれこれ（http://ysfactory.nobody.jp/ys/prg/calculation_public.html）ダメージの計算式エンカウントについて考えてみるエンカウント（マップでの敵との遭遇）の処理方法いろいろ RPGの作り方 - ゲームヘル2000 RPGのアルゴリズムドルアーガの塔乱数の工夫の

tarchan 2009/07/07

リンク

Web上の膨大な画像に基づく自動画像補完技術の威力 - A Successful Failure

画像内に映り込んだ所望のオブジェクトを排除し、違和感の無い画像を生成するシーン補完技術に関しては近年複数の研究成果が発表されている。しかし中でも2007年のSIGGRAPHにて米カーネギメロン大のJames HaysとAlexei A. Efrosが発表した手法*1はブレークスルーとなりうる画期的なものだ。論より証拠、早速適用例を見てみよう。本エントリで利用する画像はPresentationからの引用である。元画像の中から邪魔なオブジェクト等の隠蔽すべき領域を指定すると、その領域が補完された画像が自動的に生成される。アルゴリズム効果は抜群だがアイデア自体は単純なものだ。Web上には莫大な数量の画像がアップされており、今や対象となる画像の類似画像を一瞬にして大量に検索することができる。そこで、検索された類似画像で隠蔽領域を完全に置き換えてしまうことで違和感の無い補完画像を生成するのだ。

tarchan 2009/06/30

リンク

Post by @shyouhei

とりあえずHashが何であるかとか、どういう作りになっているかとか、そういうことは既知とする。リストの配列ってことね。←これで何言ってるか分からないおまえらにはこの文章はちょっとはやい。先にデータ構造の教科書を読むことをおすすめ。以下ではHashに登録されるキーとデータのペアのことをentryと呼び、リストの配列と言ったときのリストのほうをbin、配列のほうをbucketと呼ぶ。つまり、

tarchan 2009/06/05

リンク

Canonical Huffman Codes での符号長の効率的な計算 - naoyaのはてなダイアリー

週末に参加した Managing Gigabytes の読書会で第2章のハフマン符号を担当しました。この中で Canonical Huffman Codes の解説がありますが、そこにハフマン符号の符号長を効率的に求める手法の説明が含まれています。輪講では時間切れのためこのアルゴリズムの解説が駆け足になってしまいましたので、改めて解説資料を作ってみました。2009 年の今に Managing Gigabytes を読んでいるという方はあまり多くないかもしれませんが、参考になれば幸いです。 https://www.dropbox.com/s/539fhyc7rf6b9ik/090518computing_huffman_code_length.ppt?dl=0 (PPT, 258K) 先日 Canonical Huffman Codes の習作を Python で実装しましたが、このコード

tarchan 2009/05/26

リンク

クラスタリングの定番アルゴリズム「K-means法」をビジュアライズしてみた - てっく煮ブログ

集合知プログラミングを読んでいたら、K-means 法（K平均法）の説明が出てきました。K-means 法はクラスタリングを行うための定番のアルゴリズムらしいです。存在は知っていたんだけどいまいちピンときていなかったので、動作を理解するためにサンプルを作ってみました。クリックすると１ステップずつ動かすことができます。クラスタの数や点の数を変更して、RESET を押すと好きなパラメータで試すことができます。こうやって１ステップずつ確認しながら動かしてみると、意外に単純な仕組みなのが実感できました。K-means 法とはK平均法 - Wikipedia に詳しく書いてあるけど、もうすこしザックリと書くとこんなイメージになります。各点にランダムにクラスタを割り当てるクラスタの重心を計算する。点のクラスタを、一番近い重心のクラスタに変更する変化がなければ終了。変化がある限りは 2. に戻る。これ

tarchan 2009/04/09

リンク

nabokov7; rehash : logを飼いならせ！

December 18, 200800:25 カテゴリイントラブログより勉強会ログ logを飼いならせ！ logといっても記録じゃなくて対数の方です。数学部の中で対数(log)が出てきたんですが，実際にそれがどう業務で役に立っているかの一例を紹介します。僕は統合スパムフィルタ「スパムちゃんぷるー」とか、汎用レコメンドエンジン「Cicindela」の開発もやってるんですが、これらの実装では，どちらも，確率統計の処理が大変重要になります。で，例えばここに，なにかの確率が保存されたテーブルがあったとしましょう。上の全データの確率(p)の，合計を出したいときは sum() 関数で一発ですよね。 0.1+0.2+0.9+0.6=1.8，と。でも，確率計算の場合，全部を足したものではなくて全部を掛け合わせたもの，上の例なら 0.1 x 0.2 x 0.9 x 0.6 = 0.0108 っての

tarchan 2009/04/03

リンク

自然言語処理は Python がいちばん - 武蔵野日記

現在大学1年生の人で3年後には NAIST に (というか松本研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は Perl → Python がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

tarchan 2009/03/30

リンク

はてなブックマーク

タグ

関連タグで絞り込む (28)

algorithmとprogrammingに関するtarchanのブックマーク (29)

お知らせ

今週のはてなブックマーク数ランキング（2025年11月第1週）

今週のはてなブックマーク数ランキング（2025年10月第4週）

今週のはてなブックマーク数ランキング（2025年10月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス