[B! algorithm] griefworkerのブックマーク

インクリメンタルに複数の時系列データに対する平均・標準偏差を計算する

はじめにデータ分析を行う際、それらのデータの特徴を知るために頻繁に平均や分散（データのばらつき）を計算します。それらは、n個のデータをx_1,x_2,\ldots,x_nと表すと、それぞれ次のような式で計算できました。平均 m_n = \frac{1}{n}\sum_{i=1}^{n}x_i 分散 \sigma_{n}^2 = \frac{1}{n}\sum_{i=1}^{n} (x_i - m_n)^2 この計算式を愚直にコード(rust)に落とし込むと次のように記述できます。（もしrustを書いたことない方でもプログラミングに馴染みのある方であればなんとなくわかると思います。） // 平均 fn mean(data: &Vec<f64>) -> f64 { let mut sum: f64 = 0.0; for i in 0..data.len() { sum += data[i

griefworker 2023/01/05

algorithm

リンク

テキストエディタで使われがちなデータ構造 Piece Table の概要と実装 - A Memorandum

テキストエディタのデータ構造 Gap method Piece Table method Piece Table の構造 Piece Table の実装 Piece Table のメソッドまとめテキストエディタのデータ構造テキストエディタで採用されているデータ構造にはいろいろあります。こちらの論文 Data Structures for Text Sequences では各種データ構造について比較検討されています。多くは、Gap method や Piece table method をベースにしたものが多いのではないでしょうか(図で言う最下部の中心の丸印に当たります)。最近では Rope なども有名ですね。 Gap method Gap method では、現在のカーソル位置で、テキストバッファを2つに分割し Gap を間に挟み、カーソル位置に対する編集(テキスト追加/削除)を

griefworker 2022/09/15

リンク

レッドコーダーが教える、競プロ・AtCoder上達のガイドライン【上級編：目指せレッドコーダー！】 - Qiita

そのうち、最初の 12 個（表の 1 ～ 3 行目）をマスターする方法は、中級編 2-2-2. 節で解説がされていますので、こちらをご覧ください。本節では、残りの 11 個を理解できる記事たちを紹介したいと思います。座標圧縮まとまった解説記事が見つからないので、こちらで簡潔に解説しておきます。座標圧縮とは、とても大きい座標があって現実的に扱えないサイズである場合に、圧縮して計算量を抑えるというテクニックです。以下の画像のように、相対的な位置関係が崩れないように圧縮します。（一次元の場合でも、二次元の場合でも通用します。）実装などを含めた詳しい部分は、以下の記事に書かれています。座標圧縮について勉強した (java)| バイトの競プロメモ座標圧縮| 個人的な競プロメモ半分全列挙 $N$ 通りの全列挙を $O(\sqrt{N})$ 程度の計算回数で効率的に計算する手法です。以下の

griefworker 2022/08/16

リンク

レッドコーダーが教える、競プロ・AtCoder上達のガイドライン【中級編：目指せ水色コーダー！】 - Qiita

※ ダイクストラ法・ワーシャルフロイド法は最短経路問題を解くアルゴリズムです。 ※ クラスカル法は最小全域木問題を解くアルゴリズムです。それらのアルゴリズムが学習できる記事たちなどを紹介します。全探索全探索には、「全列挙」「ビット全探索」「順列全探索」「再帰関数を用いた全探索」など多くの種類に分かれます。しかし、基本的に以下の記事を読めば全部理解できます。全列挙　たのしい探索アルゴリズムの世界【前編：全探索、bit全探索から半分全列挙まで】の 2 章その他の全探索　たのしい探索アルゴリズムの世界【前編：全探索、bit全探索から半分全列挙まで】の 3 章二分探索アルゴリズムの代表例ともいわれる二分探索は、以下の 2 記事で解説されています。二分探索とは：アルゴリズムを勉強するなら二分探索から始めよう！『なっとく！アルゴリズム』より競プロで使える二分探索：二分探索アルゴ

griefworker 2022/08/08

リンク

レッドコーダーが教える、競プロ・AtCoder上達のガイドライン【初級編：競プロを始めよう】 - Qiita

このように、競技プログラミングはコーディングの正確性が問われるコンテストです。どんな問題が出されるか（２）競プロは正確性だけではありません。例えば、以下の問題を考えてみてください。 $N$ 枚のカードが一列に並べられています。左から $i$ 番目のカードには、整数 $A_i$ が書かれています。あなたは $N$ 枚のカードの中から $2$ 枚同時に選び、取ることができます。取った $2$ 枚に書かれた整数の合計がちょうど $101$ となるような、カードの選び方の通り数を求めてください。テストデータの制約：$1 \leq N \leq 10^{6}, 1 \leq A_i \leq 10^{9}$ 一番最初に考えられる解法は、以下のように「何枚目と何枚目を選ぶか全探索する」という方法だと思います。つまり、$1 \leq i < j \leq N$ を満たすすべての $(i, j)

griefworker 2022/08/01

リンク

30 分でわかる！アルゴリズムの基本

このスライドは、2022/4/14 に実施されたイベント『問題解決のための「アルゴリズム × 数学」- Forkwell Library #1』の基調講演を加筆修正したものです。実際の講演（35 分）を見たい方は、以下の URL をご覧ください。 https://www.youtube.com/watch?v=2OrsR37_GdM 【目次】第一章　アルゴリズムとは（pp. 1～19）第二章　アルゴリズムの例 A：迷路の探索（pp. 20～79）第三章　アルゴリズムの例 B：プログラムのデバッグ（pp. 80～126）第四章　アルゴリズムの例 C：映画鑑賞の最適化（pp. 127～154）第五章　講演のまとめ（pp. 155～162）

griefworker 2022/06/01

リンク

APIに利用制限をかけるとしたらどういうやりかたがあるのか - おもしろwebサービス開発日記

この記事はSmartHR Advent Calendar 2020 11日目の記事です。僕のお手伝いしているSmartHRでは、毎週バックエンドエンジニアが集まり、技術的なトピックについて共有、相談しあうミーティングを開催しています。そのミーティングでは僕がTipsなどを共有するコーナーが常設されています*1。このエントリでは、そのコーナーで共有した内容をひとつ紹介します。 APIに制限をかける方法について APIを外部に提供するとき、一定の制限をかけてユーザがAPIを乱用するのを防ぐことはよくあることではないでしょうか。素直に考えると「1時間に5000回までAPIを実行できる」のようなやり方を思いつきますね。GitHubのAPIもそのやり方ですし、SmartHRのAPIも同様です。じゃあそれでいいのでは。となるかもしれませんが少し待ってください。いろんなクライアントがAPIを大量に

griefworker 2020/12/16

リンク

Rustで古典的なDisk-Oriented DBMSを実装した話 - Write and Run

KOBA789 です。みなさん DBMS は好きですか。私は好きです。最近、自作 DBMS をずっと作っていて、ようやく最低限の機能ができたので公開をしました。 (とはいえコードを書いていたのは正味2日ほど。設計と勉強に2週間かかった) github.com この記事ではこれを作った目的と、そのちょっとした詳細についてご紹介します。目的 Disk-Oriented DBMS の学習に適している Rust で書かれた実装が欲しかった、というのが理由です。 DBMS の勉強に適している実装というのは意外と多くありません。 MySQL や PostgreSQL といった有名な実装は実用的である一方でコード量は非常に多く、また細かな最適化によって教科書的なアルゴリズムと実際のコードの差が大きくなっているため、初学者にとっては構造を把握しづらくなっています。教科書的な実装の Disk-Orie

griefworker 2020/11/18

リンク

BFS (幅優先探索) 超入門！〜キューを鮮やかに使いこなす〜 - Qiita

0. はじめにメジャーなグラフ探索手法には深さ優先探索 (depth-first search, DFS) と幅優先探索 (breadth-first search, BFS) とがあります1。このうち DFS については DFS (深さ優先探索) 超入門！〜グラフ理論の世界へ〜【前編】 DFS (深さ優先探索) 超入門！〜グラフ理論の世界へ〜【後編】にて詳しく特集しました。これらの記事中で幅優先探索 (BFS) についても簡単に触れているのですが、今回改めて特集します。特に、後編で紹介したグラフの二点間の到達可能性グラフの連結成分の個数二部グラフ判定トポロジカルソートサイクル検出といった問題たちが BFS によっても解くことができることを示します。一つの問題を DFS・BFS と様々な探索手法で解くことで、グラフの様々な性質をより深く親しむことを狙います。

griefworker 2020/09/25

リンク

DFS (深さ優先探索) 超入門！〜グラフ・アルゴリズムの世界への入口〜【後編】 - Qiita

目次 DFS (深さ優先探索) 超入門！〜グラフ理論の世界へ〜【前編】からの続きです！！前編 0 章: はじめに 1 章: グラフとは 2 章: 計算機上でのグラフの表し方 3 章: 深さ優先探索 (DFS) と幅優先探索 (BFS) 後編 (いまここ) 4 章: グラフの様々な例題 5 章: 発展的話題 6 章: おわりに 7 章: 参考文献 4. グラフ上の様々な例題いよいよ、深さ優先探索 (DFS) を用いて、グラフに関する様々な問題を解いてみましょう。グラフの連結性に関する問題の多くが、単純な探索によって解決できることがわかります。そしてグラフ探索はとにかく「習うより慣れろ」の精神が重要なテーマでもあります。本記事では、グラフの連結性に関する諸概念に親しみながら、探索にも慣れるという一石二鳥を狙います。なお、ここで取り上げる問題のほとんどは DFS だけでなく BF

griefworker 2020/09/25

リンク

DFS (深さ優先探索) 超入門！〜グラフ・アルゴリズムの世界への入口〜【前編】 - Qiita

0. はじめに --- グラフ探索の動機現代ではコンピュータはとても身近なものになりました。コンピュータの用途としてはシミュレーションなどの大規模計算を行う人工知能をつくるアプリを開発するなどなど多様なものが考えられますが、「探索」もまた、コンピュータを用いるモチベーションとして、最も基本的かつ重要なものの一つだと思います。探索とは、与えられた対象の中から、目的に合うものを見つけ出したり、最良のものを見つけ出したり、条件を満たすものを列挙したりする営みです。世の中における様々な問題は、探索によって、考えられる場合を調べ尽くすことによって原理的には解決できるものが多いです。例えば、現在地から目的地まで最速でたどり着く方法を求める問題は、原理的には、現在地から目的地へ到達する経路をすべて列挙することで解決できます1。将棋やオセロの必勝法を求める問題は、原理的には、考えられる局面と

griefworker 2020/09/25

algorithm

リンク

AtCoder 版！蟻本 (初級編) - Qiita

0 はじめにプログラミングコンテストチャレンジブック (通称、蟻本) は日本の競技プログラミングの普及に多大な貢献を果たしています。多くの競技プログラマたちが蟻本を手に取りながらコンテストの世界に没入して行きます。しかしながら発売から 6 年以上経過する間に競技プログラミング界隈には大きな変化がありました。蟻本的に影響が大きいのは以下の点です: POJ が国内ではあまり使用されなくなった (計算速度が遅いなど) AtCoder 上で問題を解くことが盛んになった今回はこの完全解決を試みます。具体的には、蟻本に載っている例題たち (ほとんどすべて POJ 上の問題です) を AtCoder 上でジャッジできる問題に対応付けようという試みです。今回は初級編を扱い、中級編、上級編は別記事に続きます。AtCoder 上で見つからなかったものは AOJ, yukicoder 上の問題も載せています

griefworker 2020/01/29

リンク

Evernote Synchronization via EDAMを読みました - soutaroブログ

Documentation - Evernote Developersの「Synchronization spec」の文書です。こういうWebサービスとクライアントアプリがいて、データ同期をとるようなアルゴリズムって、別に難しいことはないような気もしますが、一方で綺麗に書くためのベストプラクティスってなかなか見つからないような気がします。まあ力技でなんとかなるとも思いますが、それはそれとして上手くやる方法をずっと探していました。例えばgitとかちょっと機能が豊富すぎるし、Unisonとかそれはまたちょっと違うし。こないだ気づいたのですが、Evernoteってローカルなキャッシュが存在することがかなり前提のサービスですよね。で、APIのドキュメントを見てみたらそんな感じのドキュメントがありました、という話。今となってみれば、けっこう当たり前の話ですよねーという感じだったので、一年くらい読む

griefworker 2020/01/06

Evernoteの同期アルゴリズムの解説みたいなもの。

リンク

https://github.com/ninjinkun/EDAMSync/blob/master/EDAM-Japanese.md

griefworker 2020/01/06

Evernoteの同期スキームとそのアルゴリズム。

リンク

簡潔ビットベクトルでRubyをlog N倍速くした - クックパッド開発者ブログ

技術部のフルタイムRubyコミッタの遠藤（@mametter）です。昨日の Hackarade #04 の開催報告に続き、2日連続で記事を投稿します。今回は、ある条件下でのRubyの実行速度を高速化した話を紹介します。この改善はすでにMRIの先端にコミットされていて*1、年末リリース予定のRuby 2.6に含まれる予定です。ひとことで言うと、「簡潔ビットベクトルを索引に使うことで、プログラムカウンタから行番号を計算するアルゴリズムをO(log N)からO(1)に改善した。これにより、TracePoint有効時やコードカバレッジ測定下で、長さ N のメソッドの実行が O(N log N) から O(N) に高速化される」ということです。順に説明します。背景：Rubyのバイトコードの構造この最適化を理解するにはまず、Rubyのバイトコードのある特徴を知る必要があります。たとえば x

griefworker 2018/10/22

リンク

ざっくりわかった気になるモダンGC入門 - Cybozu Inside Out | サイボウズエンジニアのブログ

どうも！@yokotaso です！ 2018/05/26のJJUG CCC 2018で「ざっくりわかった気になるモダンGC入門」というタイトルで登壇させていただきました。現在開発中の新しいGCアルゴリズムをざっくり理解することをテーマに発表しました。発表練習用に作ったカンペの内容を公開します。ブックマークコメントでもツイートでも感想を書いていただけると喜びます！発表資料は、speakerdeck にあります。はじまり〜はじまり〜はじめに今日はざっくりわかった気になるモダンGC入門というお話をさせていただきます。現在開発中のGCアルゴリズムの全体像を理解してもらうことを目的としたセッションです。よろしくおねがいします。さて今日のアジェンダですが、まず簡単にこれまでのGCを復習した後に新しいGCが必要になってきた背景について少し話します。次にShenandoahGC、ZGC、E

griefworker 2018/06/01

リンク

アルゴリズムとは何か！？～文系理系問わず楽しめる精選 6 問～ - Qiita

今の場合は A さんが 31 歳の場合のストーリーでしたが、A さんが 20 歳～ 35 歳のうちのどの年齢であったとしても、似たようなストーリーで必ず 4 回の質問で当てることができます！(他の例も是非考えてみてください。) ちなみに、このような「真ん中で切ってどちらかに絞って行く」タイプのアルゴリズムには二分探索法という名前がついています。応用情報技術者試験でも頻出のテーマですので馴染みのある方も多いと思います。 1-2. つまり、アルゴリズムとは上の年齢当てゲームという問題では、相手の年齢を当てる「方法・手順」を二分探索法に基づいて導きました。このようにアルゴリズムとは、問題を解くための方法・手順のことです。さて、アルゴリズムと聞くと「コンピュータ上で実装されたプログラム」のことを思い浮かべる方も多いと思いますが、必ずしもコンピュータと関係がある必要はなく、日常生活でも多々登場

griefworker 2018/05/23

リンク

計算量オーダーの求め方を総整理！〜どこから log が出て来るか〜 - Qiita

NTT データ数理システムでリサーチャーをしている大槻 (通称、けんちょん) です。今回は計算量オーダーの求め方について書きます。 0. はじめに世の中の様々なシステムやソフトウェアはアルゴリズムによって支えられています。Qiita Contribution ランキング作成のために用いるソートアルゴリズムのような単純なものから、カーナビに使われている Dijkstra 法、流行中のディープラーニングに用いられている確率的勾配降下法など、様々な場面でアルゴリズムが活躍しています。アルゴリズムとはどんなものかについて具体的に知りたい方には以下の記事が参考になると思います: アルゴリズムとは何か～文系理系問わず楽しめる精選 6 問～アルゴリズムを学ぶと $O(n^2)$ や $O(n\log{n})$ や $O(2^n)$ といった計算量オーダーの概念が登場します。こうした記法を見ると

griefworker 2018/05/17

リンク

分散ロックという名の過ち - Software Transactional Memo

TL;DR; 「分散ロック」が分散システムの設計図に登場した時だいたいその設計は間違っていて本当に必要なものはトランザクションだ並行システムを実装する際にロックを用いるのはとても自然なことだ。僕も普段はロックフリー系のアルゴリズムに詳しいと言われがちだが知識量でいったら実はロック系の方が多く蓄えているかも知れない。分散システムは並行システムであることが多いので、その中にロックが登場するのはとても自然な発想である。よく「分散」「並行」「並列」の言葉の定義がごっちゃになっているケースがあり、この記事の主題にしたいわけではないので深くは言及しないが、分散システムは環境などの要因で突如として参加者が音信不通になったり復活したりする点で並行システムと大きく異なる。並行システムと同じノリで分散システムを設計しようとした際に陥る頻出の過ちが「分散ロック」である。そのアイデアはとても簡単で

griefworker 2018/03/27

“冪等リトライのパターンに落としこんでしまうのが一番合理的で単純なのでその方向に知恵を絞って上手く行くことが多い”

リンク

Bing検索の裏側―BitFunnelのアルゴリズム - Hatena Developer Blog

はてなアプリケーションエンジニアの id:takuya-a です。この記事では、Microsoft の検索エンジン Bing で採用された BitFunnel アルゴリズムを紹介します。昨年のエンジニアアドベントカレンダーでは、文字列検索のアルゴリズム全般について紹介しました（文字列アルゴリズムの学びかた - Hatena Developer Blog）。今年はそのなかでも、インデックス（索引）を使った全文検索アルゴリズムについてのお話になります。この記事の前半は全文検索の入門にもなっていますので、検索技術になじみがない方にも楽しんでいただけるのではないでしょうか。逆に、「そんなのもう知ってるよ！」という方は、本題である「BitFunnel アルゴリズムの詳細」から目を通していただければと思います。この記事は、はてなエンジニア Advent Calendar 2017の21日目の

griefworker 2018/01/11

リンク

はてなブックマーク

タグ

関連タグで絞り込む (20)

algorithmに関するgriefworkerのブックマーク (30)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス