[B! CSV][DB] raimon49のブックマーク

raimon49 id:raimon49

CSVとDBに関するraimon49のブックマーク (2)

なぜRDBからCSV + COBOLに変更する事でコスト削減と高速化を同時に実現出来たかの考察 - ブログなんだよもん
そもそも既存はどんなロジック？ RDBなんだからWhere句使ったら？なぜファイルにすると速くなるのか？並列化と分散処理による高速化の可能性 COBOL使う必要あったの？ Javaとかじゃダメだったの？まとめ TLを見てると以下の記事が少し話題になってました。 tech.nikkeibp.co.jp tech.nikkeibp.co.jp 対象の記事は有料会員じゃないと見れないのだけど事例としては以下みたい。リソース - ユーザー事例 - COBOL製品ユーザー事例 : マイクロフォーカスさて、この記事の驚きポイントは「１億レコードくらいのDB処理をRDBからCOBOL + CSVに変更してUnixサーバからWindowsサーバに変える事で性能を維持しつつコストを1/5くらいにした」という事でしょう。「せっかく7割もあったSQLを全部COBOLに変えるとか時代に逆行しすぎ！」
raimon49 2019/06/18
真面目な考察。ためになる。

COBOL

CSV

DB

Java

SQL

performance
リンク
データのためのGit（およびGithub） | オープンデータとオープンガバメントを推進する Open Knowledge Japan
（訳注：この記事は本家OKFn.org記事の日本語訳です）データのために「バージョン管理」を行う能力は重要な関心事です。様々な選択肢がありますが、最も魅力的なもののひとつは、Git やMercurial のように、コード用の既存ツールを再利用することです。この投稿では、私たちが暫くの間使用してとても効果的だということが分かったツールを利用する、データの格納とバージョン管理のための単純な「データ・パターン」について記述しています。序章行われた変更を格納し、それを他の人と共有する、データのバージョンとリビジョンを管理する能力、とりわけ分散的な手法は（オープン）データ・コミュニティにとって大きな便益となるでしょう。私はその理由を以前（こちらの初期の記事を参照）議論しましたが要約すると：効率的な分散型の共同作業が可能です。私のデータセットを取り出し、変更し、それを再び私と（同時に他の人とも
raimon49 2014/05/13
小規模データの管理に適したテキストベースの行指向データパッケージ　メタデータはJSONで記述　CSV/TSVフォーマットのファイルはGitHubなら優れたUIで閲覧可能

CSV

DB

Git

GitHub

JSON

Mercurial

Python

accessibility

design

pattern
リンク
1