[B! algorithm] sobataroのブックマーク

最適化超入門

2. 過去の発表 2014年11月29日 TokyoWebMining #40 2 専門と一切関係ナシ 2chテキストマイニングとまとめサイトの自動生成セクシー女優で学ぶ画像分類入門 3. 所属自己紹介 2014年11月29日 TokyoWebMining #40 3 Twitter ID ｔｋｍ２２６１専門経営工学/最適化某データ分析会社業務分析何でも屋さん機械学習との出会い当時の研究が実用性皆無精神の逃げ道として機械学習を開始研究が詰んで、趣味が本職に言語、画像と幅広く遊んでます

sobataro 2014/12/08

16ページ目“最適化チートシート”がよい

リンク

視覚化による5つのガベージコレクションアルゴリズム入門 | POSTD

ほとんどの開発者は、自動のガベージコレクション（GC）を当たり前のように使っています。これは、私たちの仕事を容易にするために言語ランタイムが提供する素晴らしい機能の1つです。しかし、最新のガベージコレクタの中をのぞいてみれば、実際の仕組みは非常に理解しづらいことが分かります。実装の詳細が無数にあるため、それが何をしようとしているのか、また、それがとんでもなく間違った事態を引き起こしかねないことについて十分理解していない限り、すっかり混乱してしまうでしょう。そこで、5種類のガベージコレクションアルゴリズムを持つおもちゃを作ってみました。小さいアニメーションはランタイムの動作から作成しました。もっと大きいアニメーションとそれを作成するコードは github.com/kenfox/gc-viz で見ることができます。単純なアニメーションによってこうした重要なアルゴリズムを明らかにできることは

sobataro 2014/11/11

リンク

せっき～のゲーム屋さんドルアーガの塔　乱数の工夫の正体

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。ＣＥＤＥＣの講演「ゲーム世界を動かすサイコロの正体～往年のナムコタイトルから学ぶ乱数の進化と応用」より、乱数を使ったドルアーガの塔の迷路生成のアリゴリズムについて紹介です。講演内容は、こちらです http://sekigames.gg-blog.com/Entry/288/ 講演者の方も、「ナムコの乱数を取り上げるなら、ドルアーガの塔をせざるえない」という程、外せない内容との事です「このテーマだけで講演時間を全て使っても説明しきれない」（講演では、時間の関係で触りのみでしたのである程度、せっき～の解釈で補完しています） -------------------------------------------------------------------

sobataro 2014/09/25

リンク

イーライ・パリザー：危険なインターネット上の「フィルターに囲まれた世界」 | Video on TED.com

Go deeper into fascinating topics with original video series from TED

sobataro 2014/06/07

アルゴリズムによる無自覚な``Junk Information''への偏向

リンク

バンディットアルゴリズム入門と実践

39. 実際の使用イメージ試行数アーム1期待値アーム2期待値アーム3期待値活用or探索 0(0/0) 0(0/0) 1 1(1/1) 0(0/0) 2 1(1/1) 0(0/1) 3 1(1/1) 0(0/1) 4 1(2/2) 0(0/1) 5 1(2/2) 0.5(1/2) 6 1(2/2) 0.5(1/2) 7 8 0.66(2/3) 0.5(1/2) 9 0.5(2/4) 0.5(1/2) 10 0.4(2/5) 0.5(1/2) 0(0/0) 0(0/0) 0(0/0) 0(0/1) 0(0/0) 0(0/0) 0(0/2) 0(0/2) 0(0/2) 0(0/2) ・・・最も期待値の高いアーム 39 探索探索探索探索探索探索活用活用活用活用ランダム選択引くアーム結果 1 2 3 1 2 3 - アーム1 アーム2 アーム3 アーム1 アーム2

sobataro 2013/12/18

algorithm

リンク

RubyとPythonの違いからガベージコレクタを理解する - ワザノバ | wazanova.jp

http://patshaughnessy.net/2013/10/24/visualizing-garbage-collection-in-ruby-and-python Pat Shaughnessyが、ブタペストで開催されたRUPY2013でのプレゼンの前半を自らのブログで紹介しています。ガベージコレクタは、「ゴミを集める」という行為だけでなく、「新しいオブジェクトのためにメモリをあてがう。」「不要なオブジェクトを見つける」「不要なオブジェクトからメモリを取り戻す。」という、人間の心臓が血液を浄化するような働きをしている。この簡単なコードサンプルを見ると、RubyとPythonの記述はよく似ているが、それぞれの言語の内部でのインプリの仕組みは違う。 1) Rubyのメモリ Rubyは、コードが実行される前に、数千のオブジェクトを先につくり、それをリンクされたfree listに置

sobataro 2013/10/28

algorithm
GC

リンク

高速文字列解析の"別"世界 - 気ままなブログ

1月に「高速文字列解析の世界」を購入してから半年が経ちました。以下、文字列本と呼びます。高速文字列解析の世界――データ圧縮・全文検索・テキストマイニング (確率と情報の科学) 作者: 岡野原大輔出版社/メーカー: 岩波書店発売日: 2012/12/27メディア: 単行本購入: 15人クリック: 324回この商品を含むブログ (4件) を見る全文検索として、「CSA」や「FM-Index」が紹介されていますが、「全文検索システム」を作るには、これらだけでは不十分です。なぜなら、以下のような特徴があるからです。文書IDの識別が遅い。各文書IDに出現する頻度を求めるのが遅い。ちなみに、転置インデックス(or N-gramインデックス)を使った場合、これらの処理は高速ですね。インデックスを圧縮しているのだからしょうがないとも考えられますが、作りたいですよねぇ、「全文検索システム」。こ

sobataro 2013/07/09

リンク

へ、変態っ！！読めないからやめてっ！bit使ったデータ構造・アルゴリズム実装集 - Negative/Positive Thinking

この記事はCompetitive Programming Advent Calendar Div2012の2日目の記事です。 12月20日追記： Darseinさんが20日目の記事で、ビット演算についての詳しい説明を紹介してくださっています！必読ですね！！！！：）はじめに Y＾´　　　　 ∨／／／,∠ ,. ' ／l／／／／, ' , '／ !　｜ｌ }´　　　　〈〉　　変　　〈/ , ' ／／￣｀>< ／／／／／／ _,.=‐|'"´l　ｌ〈　　変　　/ 〈　　　態.　　 ∨, '／l| 　 ,.'-‐､｀/／｀7/　／''"´__　｜　ﾊ l丿　態　 { 人）　　　! !　　　（／! 　|ヽ〈_　・.ﾉ〃　〃／　 '／⌒ヾ.!　,'　!く　　 ! !　　（_ ト､__／　ヽ､_,.イ　　／ｌ　ｌ　｜:::::::｀｀`/:::::／...´..

sobataro 2012/12/03

リンク

情報系修士にもわかるダブル配列 - アスペ日記

最近話題の「日本語入力を支える技術」を途中まで読んだ。 3章がものすごく気合いが入っている。 trie（トライ）というデータ構造の2つの実装、「ダブル配列」と「LOUDS」について詳しく説明がされている。ダブル配列については、ぼくは以前論文を読んで勉強しようとしたのだが、その時は難しくてあきらめた覚えがある。しかし、この本の説明を読むことで理解ができた。ありがたい。感銘を受けたので、この本を教材に友達と2人勉強会をした。この2人勉強会というのは、ぼくが復習を兼ねて友達に教えるというのがだいたいのスタイル。しかし、いざやってみるといろいろと難しい。次のようなところでひっかかるようだ。例のサイズが小さく、イメージを喚起するのが難しい。最初の図のノード番号と、最終的なダブル配列上の位置が異なるため、混乱する。単語終端について言及がないので、どのノードが単語を表しているかがわから

sobataro 2012/04/04

リンク

グーグルのバグ予測アルゴリズムを実装したツール「bugspots」、オープンソースで公開

ソースコードのなかでバグが多いのは、より高頻度に、かつ最近になって集中的に直している部分。これが、グーグルで採用された「バグ予測アルゴリズム」であることを、先月の記事「グーグルはコードの品質向上のため「バグ予測アルゴリズム」を採用している」で紹介しました。そのバグ予測アルゴリズムを実装したツール「bugspots」がオープンソースとして公開されています。 gitのレポジトリを分析 bugspotsはRubyで記述されており、gitのレポジトリから履歴を読み込んで分析し、どのモジュールにバグが含まれている確率が高いかを示してくれます。以下のようにインストールして実行（説明ページから引用）。 $> gem install bugspots $> git bugspots /path/to/repo $> git bugspots . # (in current git directory)

sobataro 2012/01/11

リンク

竹内関数で音楽生成 - aike’s blog

Lisperの人ならみんな知ってる竹内関数（たらいまわし関数）という関数があります。定義としてはこんな感じ。そのシンプルな定義からは想像もつかないほど複雑で膨大な再帰呼び出しがおこなわれるとても興味深い関数です。たとえば引数にTarai(10,5,0)を与えると343,073回も再帰呼び出しされたりします。この関数呼び出しの引数がどのように変化するか知りたくてプログラムを書いて調べてみたところ、Tarai(10,5,0)の場合は3つの引数がそれぞれ0〜10（xは-1〜10）の間で少しずつ変化するなかで、2つの値を固定してひとつの値が下降していくような挙動があったりして、なんだか音楽の3和音のコード進行を思わせるような動き方です。そういうことなら、ということで実際に音にして聴いてみました。Tarai関数が呼ばれるたびに引数のx、y、zを、0=ミ、1=ファ、2=ソ、……、のように音に割

sobataro 2011/11/13

リンク

頻出典型アルゴリズムの演習問題としてよさげなやつ - kyuridenamidaのチラ裏

効率的な別解とか存在する問題もあるけど演習によさそうなやつをピックアップ。そのアルゴリズムじゃないと解けないわけではないって問題も多いので注意。(ただ演習するのには都合が良いかなと)※個人的難易度をつけてみました。とても主観的な難易度付けなので気にせず解いてみてください。深さ優先探索・Balls[☆]・Sum of Integers[☆]・The Number of Island[☆]・Block[★]幅優先探索・Mysterious Worm[★]・Cheese[★]・Seven Puzzle[★☆]・Stray Twins[★★]・Deven-Eleven[★★]・Summer of Phyonkichi[★★☆]ワーシャルフロイド法(For 全点対最短路問題)・Traveling Alone: One-way Ticket of Youth[★]・A reward for a Car

sobataro 2011/10/27

リンク

昔のコンピューター麻雀のアルゴリズム : 2chコピペ保存道場

sobataro 2011/10/27

リンク

過去10年間のComputer Science系論文で被引用数トップ10を作ってみた - 情報科学屋さんを目指す人のメモ（FC2ブログ版）

何かのやり方や、問題の解決方法をどんどんメモするブログ。そんな大学院生の活動「キャッシュ」に誰かがヒットしてくれることを祈って。 2000年以降の論文に限定して、 CS系論文の被引用数ランキングを作って分析してみた。この作業を通じて予想以上に得るものがあった。ランキングの作り方 CiteSeerXが公開している「Most Cited Computer Science Articles (2010/9/14)」を元データに採用した。ここから2000年以降の文章に限定した後、ハンドブックや雑誌記事などを取り除いて論文だけのランキングを作成した。被引用数は時間が経つほど増える一方なので、2000年・2001年あたりの論文が有利であることに注意する必要がある。ただし、このことがかえって得るものを増やしてくれた。アブストラクトをチェック良い機会であるので、各論文の概要や結論をチェック

sobataro 2011/09/22

リンク

AdaRank: A Boosting Algorithm for Information Retrieval

sobataro 2011/06/04

ドット絵をベクタデータに変換するらしい

リンク

diffの動作原理を知る～どのようにして差分を導き出すのか | gihyo.jp

UNIXの基本的なコマンドの1つであるdiff。これに実装されているアルゴリズムは実に興味深い世界が広がっています。本稿では、筆者が開発した独自ライブラリ「dtl」をもとに「diffのしくみ」を解説します。はじめに diffは2つのファイルやディレクトリの差分を取るのに使用するプログラムです。ソフトウェア開発を行っている方であれば、SubversionやGitなどのバージョン管理システムを通して利用していることが多いかと思います。本稿ではそのdiffの動作原理について解説します。差分の計算の際に重要な3つの要素差分を計算するというのは次の3つを計算することに帰結します。編集距離 2つの要素列の違いを数値化したもの LCS（Longest Common Subsequence） 2つの要素列の最長共通部分列 SES（Shortest Edit Script）ある要素列を別の要

sobataro 2011/04/03

リンク

クラスター分析

クラスター分析　　　　　Last modified: Aug 28, 2015 似通った個体あるいは変数のグループ化を行うための分析手法である。クラスター分析の結果は，図 1 のようなデンドログラム（樹状図）として表現される。個体が似通っているかどうかの判定基準としてはいくつかあるが，取り扱いが容易なユークリッド距離を用いる。個体のクラスター分析を行う場合には，解析に用いるデータを正規化する場合としない場合では結果がかなり異なることがある。解析に使用する変数が異なった単位で表されているときには，正規化した方がよいかもしれない。しかし，ある変数が決定的な性質を持つ場合には，正規化することは他の変数と同格に取り扱ってしまうことになるので正規化しない方がよいかもしれない。 $n$ 個の個体について，$p$ 個の変数 $X_{i1}, X_{i2}, \dots X_{ip}\ (i =

sobataro 2011/02/20

リンク

クラスタリング (クラスター分析) - Toshihiro Kamishima

クラスタリング (clustering) とは，分類対象の集合を，内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です．統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ，基本的なデータ解析手法としてデータマイニングでも頻繁に利用されています．分割後の各部分集合はクラスタと呼ばれます．分割の方法にも幾つかの種類があり，全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは，クリスプなクラスタといいます)や，逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト，または，ファジィなクラスタといいます)があります．ここでは前者のハードな場合のクラスタリングについて述べます．

sobataro 2011/02/20

リンク

基礎から学ぶコンピュータ

ビットごとの論理和とか、2の補数などの言葉の意味を知っていますか? 1と0だけで色々なことが出来る仕組みの解説から、マイクロプロセッサーがどうやってプログラムを実行していくかという、コンピュータの極めて基礎的な知識を提供するメールマガジンです。バックナンバー論理回路編アーカイブ compfund-001-012.zip (44KB) マイクロプロセッサ編アーカイブ compfund-013-046.zip (104KB) コンピュータとデータ編〈実数〉アーカイブ compfund-047-060.zip (32KB) 論理回路編号内容

sobataro 2011/02/09

リンク

Umetani, Shunji

sobataro 2011/01/30

リンク

はてなブックマーク

タグ

関連タグで絞り込む (34)

algorithmに関するsobataroのブックマーク (66)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス