[B! algorithm] [2ページ] crafのブックマーク

リアルタイム共同編集のアルゴリズム (Operational Transformation; OT) を理解する試み – RORO

Google Docsのように文書を複数人でリアルタイムに共同編集できるアプリケーションがあります。あのような機能は、多かれ少なかれ、Operational Transf ormation (OT; 操作変換) という考え方を使って実現されているようです。興味があったので、このOTについて調べてみました。 (追記: これからは OT でなく CRDT だという話 → I was wrong. CRDTs are the future) なおGoogle Docsではいわゆる「リッチテキスト」を共同編集できますが、ここでは話を簡単にするために「プレーンテキスト」を共同編集することを想定します。リアルタイム共同編集の流れ共同編集システムの登場人物は次の通りです：サーバ x 1（各クライアントから届く編集操作をもとに、最新の文書を保持します）クライアント x N（文書を編集する側です）そ

craf 2022/06/28

algorithm

リンク

Graydon HoareのCompiler講義資料が面白かった話 - Arantium Maestum

Graydon Hoareが2019年にカナダのブリティッシュ・コロンビア大学でコンパイラ関連のゲスト講義した時の資料21 compilers and 3 orders of magnitude in 60 minutes - a wander through a weird landscape to the heart of compilationを読んだら大変面白かったのでメモ。作者 Graydon HoareはMozillaでRustを開発したことで有名。その後Rustの開発もMozillaも離れて（というかRustの開発からは2013年に離れたようだ）、一時期AppleでSwift開発チームに所属していたらしい。（ソース：Reddit: I wonder, why Graydon Hoare, the author of Rust, stopped contributing in

craf 2022/06/14

algorithm

リンク

中日新聞:自動車工場のガロア体　ＱＲコードはどう動くか

その誕生を地元新聞も経済新聞も記事にしなかった。２年後、『コードの情報を白黒の点の組み合わせに置き換える』と最下段のベタ記事で初めて紹介された時、その形を思い浮かべることができる読者はいなかった。いま、説明の必要すらない。ＱＲコードはなぜ開発され、どう動くのだろうか。ＱＲコードは、自動車生産ラインの切実な要請と非自動車部門の技術者の「世界標準の発明をしたい」という野心の微妙な混交の下、1990年代前半の日本電装（現デンソー）で開発された。トヨタグループの生産現場では、部品名と数量の記された物理的なカンバンが発注書、納品書として行き来することで在庫を管理する。そのデータ入力を自動化するバーコード（ＮＤコード）を開発したのがデンソーだ。バブル全盛の1990年ごろ、空前の生産台数、多様な車種・オプションに応えるため、部品も納入業者も急激に増え、ＮＤコードが限界を迎えていた。63桁の数字しか

craf 2022/05/09

algorithm

リンク

30 分でわかる！アルゴリズムの基本

このスライドは、2022/4/14 に実施されたイベント『問題解決のための「アルゴリズム × 数学」- Forkwell Library #1』の基調講演を加筆修正したものです。実際の講演（35 分）を見たい方は、以下の URL をご覧ください。 https://www.youtube.com/wat…

craf 2022/04/15

algorithm

リンク

8時間を0.01秒に短縮　「アルゴリズムの素晴らしさが2分で分かる動画」が今すぐ勉強したくなる分かりやすさ

※本記事はアフィリエイトプログラムによる収益を得ていますアルゴリズムの素晴らしさを2分で解説した動画が、とても分かりやすくためになると人気です。なるほど、これがアルゴリズムと仕組みかぁ。最短経路をアルゴリズムで算出しようこの動画では、迷路を最短手数で解くアルゴリズムについて解説。迷路はマス目状になっており、全部で8900億個の手順が存在するものとなっています。全ての経路を試せば最短手順を導き出せますが、普通のコンピュータでは約8時間かかってしまう計算になります。全パターンの網羅は非常に時間がかかりますそこで計算の手順を変更。スタートに0を書き、その隣1を、また隣に2……と繰り返していきます。こうして進めていくと最終的にゴールは34となり、この34が最短手数となることが分かります。今度はゴールから34，33，32とたどっていけば、最終手数で進む経路の1つが導き出せました。数字を振

craf 2022/04/15

algorithm

リンク

はじめに - アルゴリズムとデータ構造大全

はじめにこのドキュメントは，主に競技プログラミングで出題される問題を解く際に利用できるアルゴリズムやデータ構造をまとめたものです．特定の問題にはあまりフォーカスしないため，問題を解く際の考察の仕方等の内容はありません．詳しく，正確に，分かりやすく書いていこうと思っています．このドキュメントは執筆途中です．想定する読者 C++を用いたプログラミングに慣れている方を読者として想定しており，C++言語の仕様や，文法にはあまり触れません．また，計算量という用語についても説明しません．ただし，償却計算量など，計算量の見積もりが複雑なものについては必要に応じて説明します．コードについてこのドキュメントで登場するコードは，可読性向上のため，以下のようなコードがファイルの先頭に記述してあることを前提としています．また，適切な問題を用いてコードの検証がなされている場合は，コード周辺にのように，検証

craf 2022/03/21

algorithm

リンク

spliceを使って高速・省メモリでGzipからZIPを作る - knqyf263's blog

良い話を含むので概要の最初だけでも読んでもらえると幸いです。この話が実用的かと言うと多分全然実用的ではないので理解しても仕方ないかなと言う気がします。概要ファイルフォーマット gzip 10-byteのヘッダ拡張ヘッダファイル本体フッタ（trailer） zip ローカルファイルヘッダ Data descriptor セントラルディレクトリエントリセントラルディレクトリの終端レコード gzipからzipへの変換 gzipヘッダの処理 gzipファイル本体の処理 gzip trailerの処理複数gzipファイルの連結 PoC まとめ概要先日Dirty PipeというLinuxカーネルの脆弱性が公表されました。 dirtypipe.cm4all.com この脆弱性の原理自体も面白いのですが、その前に報告者の組織で行っているGzipとZIPの処理で引っかかったのでまず先にそち

craf 2022/03/11

algorithm

リンク

ReDoS 検出の最先端 recheck の紹介 / State of the Art of ReDoS Detection

YAPC::Japan::Online 2022 での発表資料です。 recheck:

craf 2022/03/04

algorithm

リンク

正規表現の脆弱性 (ReDoS) を JavaScript で学ぶ

先日、このようなツイートを書いたところ、かなりの反響がありました。 JavaScript の正規表現の脆弱性の例でいうと、例えば /\s+$/ は脆弱性があると言える console.time(); /\s+$/.test(" ".repeat(65536) + "a"); console.timeEnd(); 結構時間がかかるのがわかる。でも /\s+$/ を見て「これは危険だな」と理解出来る人はそんなにいない。JavaScript に限らないけれど。 — Takuo Kihira (@tkihira) February 17, 2022 これは一般に ReDoS (Regular expression Denial of Service) と呼ばれる脆弱性です。正確に理解するのが難しい脆弱性なので、少し解説してみたいと思います。結論長い記事になるので、最初に「とりあえずこれだけ知っ

craf 2022/02/18

algorithm

リンク

ハッシュ関数「SHA-256」の計算プロセスをわかりやすく視覚化してくれる「Sha256 Algorithm Explained」

アメリカの国家安全保障局(NSA)によって開発された「SHA-2」は電子署名やブロックチェーンに応用される暗号学的ハッシュ関数の1つです。そのSHA-2の中でも特に使われているSHA-256でハッシュを生成するための計算プロセスがよくわかるサイト「Sha256 Algorithm Explained」を、Domingo Martin氏が公開しています。 Sha256 Algorithm Explained https://sha256algorithm.com/ Sha256 Algorithm Explainedにアクセスするとこんな感じ。上部にある入力欄に、好きな文字列を入力します。今回はGIGAZINEのURLである「https://gigazine.net/」を入力してみました。すると、入力したURLをバイナリに変換したメッセージブロックが表示されます。メッセージブロックは32b

craf 2022/02/10

algorithm

リンク

【C】srand(time(NULL))をしても同じ乱数が生成される

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

craf 2022/01/07

algorithm

リンク

The Grammar of Graphics を読み終わっての感想

craf 2021/12/29

algorithm

リンク

20日目: 正規表現が ReDoS 脆弱になる 3 つの経験則

はじめに皆さんこんにちは．3回生のらん（@hoshina350）です．文字列マッチングに便利な正規表現ですが，テキトーに書くと脆弱になり得るという情報を耳にしてから色々と原因や対策を調べていました．しかし，多くの記事で紹介されていた対策方法は，「独自の正規表現を使用しないー」とか「 * や + などの繰り返し表現はなるべく使わないー」とかいうなんともふわっとしたものでした．これでは「いやぁ確かにそうなんかもしれんけど…そうゆう訳にはいかんやんか…」と納得できません．つまり，「本質的に何が問題」で，「具体的にどんな特徴のある正規表現が脆弱になり得るのか」を知りたい訳です．そこで，様々な文献を調査してみました．本記事では調査して溜まった知見を紹介していきます．本記事は， Purdue大学のJames Davis教授による “The Regular Expression Denia

craf 2021/12/21

リンク

Goの正規表現が遅いって言う人がいたから、（速い）正規表現エンジンを作ったよ

はじめに「Goの正規表現は遅い」そんなふうによく言われていました。（最近はあまり聞かなくなりましたが）たとえば、↓の記事ではPythonの正規表現と比較して1.5倍くらい遅いという結果になっています：この話には「Goの正規表現は最悪時間が短くなるように安定したアルゴリズムを採用しているから」という回答があります： ↑の記事の比較では、GoがPerlに対して約10倍以上高速という結果が出ているので、「Goの正規表現は遅くない！はい、論破ー！」というわけですね。なんでこうなるのかも↑の記事で説明されているとおりですが、Perl（などのバックトラック型エンジン）が入力長に対して指数関数的に実行時間が伸びていくのに対し、Goの正規表現エンジンは入力長に対して線形時間で実行時間が伸びていくアルゴリズムを採用しているため、入力が長くなると急激にGoのほうが有利になるからです：一方で、入力が

craf 2021/12/21

リンク

Regular Expression Matching with a Trigram Index or How Google Code Search Worked

Regular Expression Matching with a Trigram Index or How Google Code Search Worked Russ Cox rsc@swtch.com January 2012 Introduction In the summer of 2006, I was lucky enough to be an intern at Google. At the time, Google had an internal tool called gsearch that acted as if it ran grep over all the files in the Google source tree and printed the results. Of course, that implementation would be fairl

craf 2021/12/16

algorithm

リンク

Firefox's Optimized Zip Format: Reading Zip Files Really Quickly

Firefox's Optimized Zip Format: Reading Zip Files Really Quickly This post is about minimizing amount of disk IO and CPU overhead when reading Zip files. I recently saw an article about a new format that was faster than zip. This is quite surprising as to my mind, zip is one of the most flexible and low-overhead formats I’ve encountered. Some googling showed me that over past 11 years people have

craf 2021/12/03

algorithm

リンク

d.y.d.

22:43 21/11/09 ヒープソートが好きである ranha さんが、 Approaching Heapsort via Lazy Mergesort という記事を公開していらして、遅延評価の言語で書くマージソートの計算過程で何が起きているかを見ていくと、だんだんヒープソートが見えてきた…！という大変面白い記事なのですが、その話の枕に「稲葉さんというヒープソート大好き人間がいるがいったいどこが良いのか」という形で私が登場していたので、思わず何故私がヒープソートが好きであるかをしたためた長文をTwitterのDMで ranhaさんに送りつけてしまいましたという経緯があります。元ネタの @pi8027 さんの発表が公になったのに合わせてranhaさんの記事も公開されたみたいなので、自分の脳内出力もついでにここに書き留めておこうかと思いました。お二方のように技術的にしっか

craf 2021/11/09

algorithm

リンク

CPUのアーキテクチャをトイレに例えると | Hinemosu

おもろい。たとえ方がうまいなぁ。消え気味なのでコピペ。 155 ：・良く分かるパイプライン：04/04/26 17:20 ID:B6tZVOSS 「おしっこをして手をあらってでてくる」。トイレが一室しかないと混雑時は長蛇の列ができます。 1.おしっこをする 2.手を洗う。二段のパイプにすると、手を洗ってる間に別の人が用を足せるようになります。トイレ一室で二人が気持ちよくなれて、効率が倍になります。もうすこし深くしてみましょう。 1.ジッパーを下げる 2.ちんちんとりだす 3.放尿する 4.しずくを切ってちんちんしまう。 5.ジッパーをあげる 6.手を洗う 7.紙を使って手をふく 7ステージに分解すると、なんと 7人が同時に処理できます。これがパイプラインです。 156 ：・良く分かるスーパスケーラ：04/04/26 17:21 ID:B6tZVOSS トイレの利用はおしっこ

craf 2021/08/28

algorithm

リンク

ある範囲に収まる乱数を得るために剰余（モジュロ）演算を書くとき、レビューするときに意識すること

はじめにある乱数生成器が N 個のセットのなかからランダムに一つを返すとき、その返り値をそれよりも小さな範囲に収まるようにしてから利用したい、という要件にたまに出会います。例えば、[0, 2^32) の範囲内の乱数を生成する乱数生成器を利用できる環境で、サイコロの目をランダムに計算するには、何らかの方法を使って [0, 6) の範囲の乱数に収める必要があります。このような getrandom(2) や /dev/urandom を使った乱数生成器の例以外にも、例えば Int64 のユーザー属性値を入力にしてユーザーを 10 種類に均等に分類したいという類の要件を過去にレビューしたこともあります。ある値域をより小さい値域にマップするために、よく利用されるのは剰余（モジュロ）演算です。乱数生成器の例でいえば、その返り値を X とすると、 X % 6 を計算すれば結果は [0, 6) に収ま