[B! algorithm][Programming][Algorithm] yukimori

yukimori_726 id:yukimori_726

algorithmとProgrammingとAlgorithmに関するyukimori_726のブックマーク (82)

Hacker Newsのコメント欄で紹介される数の多い30冊 - YAMDAS現更新履歴
Top 30 Books on Amazon Based on Links in Hacker News Comments 面白いことを調べる人がいるものだ。テック系ニュースサイトとしておなじみ Hacker News におけるコメント欄で紹介される数の多い本を30冊選んでいる。調べてみたら、だいたい邦訳が出ていた。やはりプログラマのニーズに違いはないということだろうか。邦訳のあるものを紹介数が上のものから並べておく。アントレプレナーの教科書[新装版] アルゴリズムイントロダクション第3版第1巻: 基礎・ソート・データ構造・数学 (世界標準MIT教科書)、アルゴリズムイントロダクション第3版第2巻: 高度な設計と解析手法・高度なデータ構造・グラフアルゴリズム (世界標準MIT教科書) 影響力の正体説得のカラクリを心理学があばくピープルウエア第3版 CODE コードから見た
yukimori_726 2016/03/05
programming

book

algorithm
リンク
分散プログラミングモデルおよびデザインパターンの考察その1 - Software Transactional Memo
Yahooの技術者が書いたブログ tech blog.yahoo.co.jp が悪い方向に期待を裏切ってくれたのに対し、 @kuenishi さんがまとまった文章 kuenishi.hatenadiary.jp を書いていたので、僕も2番煎じぐらいでまとまった文章を書く。始めに断っておくと、分散システムというのはまだまだ事例を集めていくフェーズを抜けきっておらず、体系立った大統一理論的な分類法は確立していない。ここに書くのは、これまでの分散システム事例やこれからの分散システム事例を分類していく際にその性質をカテゴライズする一助となれば良いな、程度の文章なのであまり真に受けないで欲しい。なぜYahooの記事が期待はずれなのか人によって意見はあるとは思うが、個人的に感じたのは以下の３つ。分散システムのデザインパターンと銘打っておきながら並列・並行システムの分野の話からクラウド環境へとこじ
yukimori_726 2016/02/22
distributed

architecture

algorithm

programming
リンク
機械学習アルゴリズムへの招待 | POSTD
機械学習の問題については以前に紹介したので、次はどんなデータを収集し、どんな機械学習アルゴリズムを使うことができるのかを見ていきましょう。本投稿では、現在よく使用されている代表的なアルゴリズムを紹介します。代表的なアルゴリズムを知ることで、どんな技法が使えるかという全体的なイメージもきっとつかめてくるはずですよ。アルゴリズムには多くの種類があります。難しいのは、技法にも分類があり拡張性があるため、規範的なアルゴリズムを構成するものが何なのか判別するのが難しいということですね。ここでは、実際の現場でも目にする機会の多いアルゴリズムを例にとって、それらを検討して分類する2つの方法をご紹介したいと思います。まず1つ目は、学習のスタイルによってアルゴリズムを分ける方法。そして2つ目は、形態や機能の類似性によって（例えば似た動物をまとめるように）分ける方法です。どちらのアプローチも非常に実用的
yukimori_726 2014/06/27
machinelearning

algorithm

programming
リンク
乱択データ構造の最新事情－MinHash と HyperLogLog の最近の進歩－
MinHash, b-bit MinHash, HyperLogLog, Odd Sketch, HIP Estimator の解説です．
yukimori_726 2014/05/30
algorithm

programming

log
リンク
1000万件の高評価がたった1件だけの評価に負けないスコアランキングアルゴリズム（ライブラリ）
Leak-Free Recursive Blocks - Jeremy W. Sherman こんな感じ __weak __block block_t recurse; block_t block; recurse = block = ^(id val)...
yukimori_726 2014/05/30
algorithm

programming

library

statistics

recommendation
リンク
もし女子大生プログラマに『アルゴリズム』を図解で教えるとしたら -
2014年4月16日より2014年5月14日まで開催していたpaizaオンラインハッカソン（略してPOH![ポー！]）Vol.2「女子大生とペアプロするだけの簡単なお仕事です！」で提出された最速コードはどのような高速化のアプローチでで生み出されたのでしょうか？　POH Vol.2に登場した女子大生インターンプログラマの木野ちゃん（左のイラスト）にアルゴリズムを図解で教えるとしたら、どう教えるだろうか、という事で、今回は図解してみました。今回は前回の最速コード発表レポート（【結果発表】女子大生プログラマの心を鷲掴みにした最強のコード8選）に引き続き、最速コードの裏側に迫ります。 ■高速化のアプローチ方法について今回もPOH Vol.1 と同様に、POH Vol.2では計算量の改善による高速化を柱とするアプローチを想定して出題されました。基本は定数倍高速化によって想定解法よりも悪い計算量の
yukimori_726 2014/05/28
programming

algorithm
リンク
【読書感想】世界でもっとも強力な9のアルゴリズム ☆☆☆ - 琥珀色の戯言
世界でもっとも強力な9のアルゴリズム作者: ジョン・マコーミック,長尾高弘出版社/メーカー: 日経BP社発売日: 2012/07/19メディア: 単行本購入: 15人クリック: 437回この商品を含むブログ (21件) を見る Kindle版もあります。こちらのほうが低価格。世界でもっとも強力な9のアルゴリズム作者: ジョンマコーミック出版社/メーカー: 日経BP社発売日: 2013/10/10メディア: Kindle版この商品を含むブログ (6件) を見る内容紹介コンピュータを使い物にするアルゴリズムにはどういうものがあるか、今日的な視点から選んだ実際に役立っている9のアルゴリズムのアイデアを、章ごとに掲げてわかりやすく説明した読み物です。図を多用し、その仕組みをたとえを使いながら見せることに重点を置いています。著者が選んだ基準は、 (1)インターネットでメールやブラウザを
yukimori_726 2014/05/15
programming

book

algorithm
リンク
平方数かどうかを高速に判定する方法 - hnwの日記
平方数とは、ある整数の平方（＝二乗）であるような整数のことを言います。つまり、0,1,4,9,16,...が平方数ということになります。ところで、与えられた整数が平方数かどうかを判定するにはどうすれば良いでしょうか。与えられた整数の平方根の小数点以下を切り捨て、それを二乗して元の数になるかどうか、というのがすぐ思いつく実装です。 <?php function is_square($n) { $sqrt = floor(sqrt($n)); return ($sqrt*$sqrt == $n); } しかし、平方根の計算は比較的重い処理です。もっと高速化する方法は無いのでしょうか。多倍長整数演算ライブラリGNU MPには平方数かどうかを判定するmpz_perfect_square_p関数が存在します（PHPでもgmp_perfect_square関数として利用できます）。本稿ではこの実装
yukimori_726 2014/05/15
programming

algorithm
リンク
幅優先探索 | アルゴリズム[Ruby/Python][AOJ 0129]
『幅優先探索』をRuby/Pythonで解いてみました。AIZU Online Judgeで対応している問題は『Seven Puzzle』です。 🏀 概要深さ優先探査の説明は『通勤・通学中に理解する深さ優先探索と幅優先探索』、『アルゴリズム図鑑：iOS & Androidアプリ』が分かりやすかったです。要点は次のとおり。根ノードで始まり隣接した全てのノードを探索。階層(根ノードからの距離が近い順)にルートを調べる 🐯 サンプル問題(AOJ)Seven Puzzle Aizu Online Judge。1-7までの数字と、1つ空白のあるパズルをとく問題。 😀 Rubyコード 01234567がそろった状態(ゴール)からスタートして、0を移動させる幅優先探索で過去に到達していない状態になったら、手数(移動数)を記録すでに到達済の状態であれば、スキップ(幅優先探索なら手数が同等か
yukimori_726 2014/05/14
algorithm

python

ruby

programming
リンク
Non-blocking Transactional Atomicity | Peter Bailis
Peter Bailis :: Highly Available, Seldom Consistent Data management, distributed systems, and beyond Non-blocking Transactional Atomicity 28 May 2013 tl;dr: You can perform non-blocking multi-object atomic reads and writes across arbitrary data partitions via some simple multi-versioning and by storing metadata regarding related it ems. N.B. This is a long post, but it’s comprehensive. Reading the
yukimori_726 2014/04/17
distributed

programming

algorithm

work
リンク
グラフの自動レイアウトに挑戦 #1 グラフ構造をSVGで表示
2022-08-12 13:50:22 作成したアプリケーションとソースコードアプリケーション： https://refd6y.csb.app/ （ブラウザで実行します）ソースコード： https://codesandbox.io/s/graph-layout1-refd6y はじめに連載記事のトップのところに書いた図はこのようなものだ。これをコンピュータに自動配置させたい。 Eadesのばねモデルこのような、つながった複数の物体をコンピュータに自動配置させるのは「グラフ描画」または「グラフレイアウト」と呼ばれる分野であり、さまざまなアルゴリズムが研究されている。この連載記事では比較的単純な「Eadesのばねモデル」というアルゴリズムを採用する。 Eadesのばねモデルとは、次のようなモデルをつくって物理シミュレーションすることで、物体を配置するアルゴリズムだ。各ノード(頂点)
yukimori_726 2012/12/07
programming

algorithm

visualization

javascript

graph

java
リンク
アルゴリズムを学ぼう
関連サイト出版社による関連ページが公開されています。アルゴリズムを学ぼう (KADOKAWA/アスキー・メディアワークス) 関連書籍本書の続編『続・アルゴリズムを学ぼう』も好評発売中です。内容紹介本書のテーマは、ガチのアルゴリズムとデータ構造、そして計算量です。いや、確かに本書は女の子がいろいろでてきたり、小話が入っていたりと、ゆるふわなオーラが漂っています。しかし、あえていいましょう。それは、見かけだけである、と。プログラミングを学ぶにあたって、アルゴリズムとデータ構造は、どの言語を用いるにしてもすべての基礎であり、避けて通ることはできない道です。アルゴリズムとデータ構造を知らずにプログラムを書くことは、無免許で車を運転するぐらいに危険な行為です。しかし、アルゴリズムとデータ構造をきちんと理解せずに、プログラムを書いているプログラマーが多数いるのも事実です。それは、アルゴリズム
yukimori_726 2012/06/13
programming

algorithm

pdf

book

argorithm
リンク
行列分解ライブラリredsvdを公開しました - DO++
大規模疎行列向けの行列分解ライブラリredsvdを公開しました． redsvd 大規模疎行列向けの特異値分解や主成分分析，固有値分解を行うライブラリredsvdを公開しました．修正BSDライセンスで公開しており，コマンドラインから使える他，C++ライブラリが用意されています．例えば，行と列数がそれぞれ10万，非零の要素が1000万からなる疎行列に対する上位20位までの特異値分解を約2秒で処理します．特異値分解とか，使っている技術の詳細とか応用事例を以下に簡単に紹介しましたので，興味のある方は参考にしてください．特異値分解とはまず行列を適当に復習します．行列Xの転置をX^tと表すことにします．またIを単位行列とし，Oを全ての成分が0である零行列とします．また，行列XX^t=IであるようなXを直交行列と呼びます．Xが直交行列の時，Xvはベクトルvを長さを変えずに回転させます．ここでは
yukimori_726 2010/09/01
algorithm

programming

research
リンク
【レポート】GNU grepが高速な理由 | エンタープライズ | マイコミジャーナル
FreeBSD - The Power To Serve why GNU grep is fast (なぜGNU grepは高速なのか)といったタイトルの興味深いメールがFreeBSD開発者メーリングリストに投函された。メールを出したのはGNU grepのオリジナル開発者であるMike Haertel氏。Mike Haertel氏はFreeBSDユーザでもあり、FreeBSD開発者メーリングリストで興味深いやりとりがあったため、このメールを流したとしている。Mike Haertel氏の紹介する内容はgrep(1)の実装のみならず、高速な文字列処理を実現するひとつの方法として参考になる。紹介されているGNU grep高速さの秘訣は次のとおり。 GNU grepは入力バイトのすべてをチェックするようなことは避けている。 GNU grepはバイトごとに適用する操作を極力最小限に減らしている。 G
yukimori_726 2010/08/27
programming

algorithm
リンク
Zinnia: 機械学習ベースのポータブルな手書き文字認識エンジン
Zinnia: 機械学習ベースのポータブルなオンライン手書き文字認識エンジン [日本語][英語] Zinniaは機械学習アルゴリズム SVM を用いたポータブルで汎用的なオンライン手書き文字認識エンジンです。Zinniaは組み込みの容易さと汎用性を高めるために、文字のレンダリング機能は持っていません。Zinniaは文字のストローク情報を座標の連続として受け取り、確からしい順にスコア付きでN文字の認識結果を返すだけに機能を限定しています。また、認識エンジンは完全に機械学習ベースであるために、文字のみならずユーザの任意のマウス・ペンストロークに対して任意の文字列をマッピングするような認識エンジンを小コスト作成することができます。主な特徴機械学習アルゴリズムSVMによる高い認識精度ポータブルでコンパクトな設計 -- POSIX/Windows (C++ STLのみに依存) リエント
yukimori_726 2010/04/24
svm

algorithm

programming

research
リンク
Bayesian Setsの特許について - のんびり読書日記
別にブログに書いてもしょうがないかなーと思っていたのですが、同じような目に遭う方がいるかもしれないのでちょろっとだけ書いておきます。先日Stupaという関連文書検索システムを公開したのですが、その中で使用していたBayesian Setsというアルゴリズムが既に特許を取得されているため、公開を停止してほしいってメールが来ました。以前に公開したBayesian SetsのCPANモジュールAlgorithm::BayesianSetsも同様に下ろしてほしいとのことでした。特許の内容は以下のページに書いてあります。 http://www.wipo.int/pctdb/en/wo.jsp?WO=2007063328 特許の出願者がBayesian Setsの論文の著者と大学の機関のようなので、おそらく論文発表の前に出願したのではないかと思います。請求項の内容などをすべて詳細に読んだわけではない
yukimori_726 2010/03/30
algorithm

bayesian-sets

bayesiansets

programming
リンク
[機械学習] クラスタリングにおけるコサイン類似度に関する性質の証明 - tsubosakaの日記
bayonやCLUTOが爆速な理由 - download_takeshi’s diaryを読んで、すぐには成り立つかどうか分からなかったので証明してみた。上の記事で述べられていることはクラスタ中のベクトルとその中心ベクトルのコサイン類似度の和と、クラスタ中のベクトルを全て足したベクトルのノルムが一致するというである。ただしここでクラスタ中の要素ベクトルはすべて大きさ1の規格化されたベクトルであるとする。証明今クラスタ内に含まれるベクトルをとする。このとき全ベクトルを足しこんだ複合ベクトルをとする。またこのクラスタのセントロイドはとなる。このときセントロイドと各ベクトルとのコサイン類似度は [tex: s_i = \frac{}{||C|| ||x_i||} = \frac{}{||{C}||}] となる。ここでと正規化されていることを用いた。この類似度の合計は [tex:
yukimori_726 2010/02/16
algorithm

math

Programming

clustering

machinelearning

research
リンク
bayonやCLUTOが爆速な理由 - download_takeshi’s diary
クラスタリングツールbayonを使っていて、常々「どうしてこんなに高速に処理できんのかなぁ」と疑問に感じていました。repeated bisectionという手法自体がk-means法などと比べると効率がいいのですが、それにしても、それだけでは説明がつかないほど爆速なわけです。うまく例えられませんが、自前でk-meansのスクリプトを書いて比べてみると、自転車と新幹線くらいちがうという印象です。はじめてCLUTOを触った時、数万件程規模のクラスタリング処理が本当に「あっ」という間に終わってしまい、びっくりした記憶があります。きっと実装面でなにか特殊なことがあるんだろうなと思い、mixiエンジニアブログでbayonの記事を改めて読み漁っていたら、以下の部分が目に止まりました。このクラスタの評価は、クラスタの各要素とクラスタの中心とのcosine類似度の和としています。この和が大きいほど
yukimori_726 2010/02/14
algorithm

ベクトル

bayon

Programming

分散処理・負荷分散

research
リンク
トップクラスだけが知る「このアルゴリズムがすごい」――「探索」基礎最速マスター
トップクラスだけが知る「このアルゴリズムがすごい」――「探索」基礎最速マスター：最強最速アルゴリズマー養成講座（1/4 ページ）プログラミングにおける重要な概念である「探索」を最速でマスターするために、今回は少し応用となる探索手法などを紹介しながら、その実践力を育成します。問題をグラフとして表現し、効率よく探索する方法をぜひ日常に生かしてみましょう。まだまだ活用可能な探索前回の「知れば天国、知らねば地獄――『探索』虎の巻」で、「探索」という概念の基礎について紹介しました。すでに探索についてよく理解している方には物足りなかったかと思いますが、「問題をグラフとしてうまく表現し、そのグラフを効率よく探索する」というアルゴリズマー的な思考法がまだ身についていなかった方には、得るものもあったのではないでしょうか。前回は、「幅優先探索」と「深さ優先探索」という、比較的単純なものを紹介しましたが
yukimori_726 2010/02/06
programming

algorithm
リンク
タスク並列とデータ並列の違い（1/3）－＠IT
第5回　タスク並列とデータ並列の違い株式会社フィックスターズ好田剛介 2010/1/20 CPUの周波数の高速化競争が頭打ちになり、1コアにおける処理能力は限界となった。CPUの進化がマルチコア化に向かった結果、並列コンピューティングの門戸が開かれた（編集部）プログラムの並列化を行う前に、対象となる問題をよく知ることが重要です。その問題を従来どおりのプログラミングで実装した場合に、処理が遅く要求を満たせないことを試算あるいは実測し、高速化が必要であることを確認します。さて、並列プログラムを設計する場合に、どこからどのように手をつけていたらいいでしょうか。ソフトウェアの設計の方法には、さまざまな方法論があり、それぞれのプログラマにとってやり易いやり方があります。しかし、それぞれが好きにやればいいというのではこの連載の意味がなくなってしまうので、ここでは並列プログラムを設計する
yukimori_726 2010/01/21
programming

algorithm
リンク
1 2 3 4 5 次のページ