[B! database] teddy-gのブックマーク

teddy-g id:teddy-g

databaseに関するteddy-gのブックマーク (32)

[DataBase]で行う正規化の手順についてわかりやすく解説します！ - リクロガー
teddy-g 2022/02/28
初心者にデータベースの正規化を教えるときの参考に。まあ、一般のビジネスマンがどこまで知っておく必要があるのかという話はあるけど。備忘。

database

basic

beginner
リンク
Consumer Complaint Database | Consumer Financial Protection Bureau
teddy-g 2018/02/18
Consumer Complaint Databaseなんてものがアメリカでは公開されてる

data

database
リンク
BBC Datasets - Machine Learning Group (UCD)
Two news article datasets, originating from BBC News, provided for use as benchmarks for machine learning research. These datasets are made available for non-commercial and research purposes only. If you make use of these datasets please consider citing the publication: D. Greene and P. Cunningham. "Practical Solutions to the Probl em of Diagonal Dominance in Kernel Document Clustering", Proc. ICML
teddy-g 2016/02/25
BBCのニュース記事とか無償で提供してるやつ。サンプル制作用に。

bigdata

database

opendata
リンク
Treasure Dataのサービスはクラウド上でどう構築されているのか（後編）～July Tech Festa 2013
Treasure Dataのサービスはクラウド上でどう構築されているのか（後編）～July Tech Festa 2013 Treasure Dataといえば、日本人がシリコンバレーで創業したベンチャーとして知られている企業。そのシニアソフトウェアエンジニア中川真宏氏が、7月14日に行われたJuly Tech Festa 2013の基調講演で、同社がクラウド上で構築したサービスについてそのアーキテクチャを中心に解説を行っています。この記事は「Treasure Dataのサービスはクラウド上でどう構築されているのか（前編）～Japan Tech Festa 2013」の続きです。データを解析する「Plazma」の仕組みデータを解析するところでは「Plazma」と呼ぶ、Hadoopのエコシステムとカラムストアなどを組み合わせたものを用いています。
teddy-g 2016/01/06
Treasure Dataのデータベース側、Plazmaのかるーい説明。

database

hadoop

cloud

storage
リンク
Plazma - Treasure Data’s distributed analytical database -
This document summarizes Plazma, Treasure Data's distributed analytical database that can import 40 billion records per day. It discusses how Plazma reliably imports and processes large volumes of data through its scala ble architecture with real-time and archive storage. Data is imported using Fluentd and processed using its column-oriented, schema-on-read design to enable fast queries. The docume
teddy-g 2015/12/31
Treasure DataのデータベースであるPlazmaの解説。PostgreSQLがMySQLより速いとかそうなんだ。

database

fluentd

hadoop
リンク
日付・時刻関数｜MySQL内部関数｜MySQL｜PHP & JavaScript Room
日付形式または日付時刻形式で指定した日付dateの曜日インデックス（1=日、2=月、3=火、4=水、5=木、6=金、7=土）を返します。存在しない日付や日付時刻を指定した場合は、NULLが返ります。 mysql> SELECT DAYOFWEEK('2006-12-25'); Enter +-------------------------+ | dayofweek('2006-12-25') | +-------------------------+ | 2 | +-------------------------+ 1 row in set (0.00 sec) mysql> SELECT DAYOFWEEK('2006-12-25 23:50:00'); Enter +----------------------------------+ | dayofweek('2006-12-
teddy-g 2015/12/03
WEEKDAYとかHOURとかMySQLの日付・時刻関数一覧。結構色々ある。

mysql

database

sql
リンク
CASE式のススメ / リレーショナル・データベースの世界
サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
teddy-g 2015/12/02
case select使うとsqlで結構処理が完了する。マエショリストには必須。

database

sql

mysql
リンク
13.1. csv — CSV File Reading and Writing — Python 2.7.18 documentation
This document is for an old version of Python that is no longer supported. You should upgrade and read the Python documentation for the current stable release. The so-called CSV (Comma Separated Values) format is the most common import and export format for spreadsheets and databases. There is no “CSV standard”, so the format is operationally defined by the many applications which read and write i
teddy-g 2015/09/25
PythonでCSVファイルをいじるときはcsvモジュール。超基本。そして便利。

python

programming

tips

hacks

database

data
リンク
もう1つの、DBのかたち、分散Key-Valueストアとは
分散KVSが苦手なトランザクションの「ACID特性」 RDBのように、テーブルとテーブルを結合（SQLでいうJOIN文）して複雑な条件検索や集計処理を一発でこなすような芸当はできません。また、トランザクションによる「ACID特性」の確保も分散KVSが苦手な分野です。 RDBが不得意な分散／拡張そのため、これらの不足をアプリケーション側で補うためのさまざまな工夫やフォローが必要となります。その一方で、分散KVSはデータストア全体をいくらでも多くのサーバに分散（スケールアウト）できるのが最大の特徴です。一方でこれは、RDBが最も不得意とするところです。RDBでは、その長所であるテーブル結合やACIDの確保がボトルネックとなり、複数のサーバにスケールアウトさせることが「原理的」に容易ではありません。そのため、負荷分散や高可用性を低コストで実現することが困難です。 RDBで負荷分散させようとす
teddy-g 2015/07/06
RDBは分散が苦手と。KVS、最初はいいなと思ったが、クエリを考えるとやっぱりRDB…という気分になってしまう。

bigdata

database

rdb

kvs
リンク
Wavelet Tree - naoyaのはてなダイアリー
圧縮全文索引の実装などでしばしば利用される Rank/Select 辞書と呼ばれるデータ構造があります。詳しくは参考文献を参照していただくとして、今回は一般の文字列に対して効率的に Rank/Select を可能とするデータ構造である Wavelet Tree (ウェーブレット木) のライブラリを作りました。 http://github.com/naoya/perl-algorithm-wavelettree/tree/master my $wt = Algorithm::WaveletTree->new("abccbbabca"); is $wt->rank(6, 'a'), 2; is $wt->rank(6, 'b'), 3; is $wt->rank(9, 'b'), 4; is $wt->select(0, 'a'), 0; is $wt->select(1, 'a'), 6;
teddy-g 2014/12/15
ウェーブレット木のPERL実装

bigdata

bitvector

data

database
リンク
高速かつ省メモリで文字列を扱うデータ構造「wavelet tree」
はじめに大規模なデータを扱うアプリケーションでは、速度とともに作業領域量も大きな問題となります。作業領域がメインメモリに収まらない場合、スワッピングが発生し、大幅な速度低下につながります。そのため近年、データ構造は高速なだけでなく、作業領域量が小さいことも求められています。今回紹介するのは2003年に提案されたデータ構造、wavelet tree（以下「WT」と表記）です。WTは圧縮索引やSuccinct Data Structureなど、データをコンパクトに表現する際に重要なデータ構造です。WTは文字列T[0...n-1]が与えられた時、次の2つの操作を定数時間でサポートします。 rank(p, c)――T[0...p]中のcの出現回数を返す select(i, c)――(i+1)番目のcの位置を返す WTの作業領域量は、文字列をそのまま保存した時の約2倍程度です。対象読者 C++の
teddy-g 2014/12/15
ウェーブレット木の実装方法

bigdata

bitvector

data

database
リンク
簡潔データ構造 LOUDS の解説（全12回、練習問題付き）
「日本語入力を支える技術」（通称「徳永本」）や「高速文字列解析の世界」（通称「岡野原本」）で紹介されている LOUDS というデータ構造を、12回に分けて解説しました。友達に教える時に使ったもので、練習問題付きです。実際に紙に書いてやってみるとわかりやすいと思います。詳解 LOUDS (1) LOUDS とは詳解 LOUDS (2) ビット列を作ってみる詳解 LOUDS (3) 0番ノード詳解 LOUDS (4) ビットの意味詳解 LOUDS (5) 木構造の復元詳解 LOUDS (6) インデックスでノードを表す詳解 LOUDS (7) ノード番号からインデックスを得る詳解 LOUDS (8) インデックスからノード番号を得る詳解 LOUDS (9) 子ノードから親ノード詳解 LOUDS (10) 親ノードから子ノード詳解 LOUDS (11) 木の検索詳解
teddy-g 2014/12/15
SuccinctなData構造のLOUDS解説。とてもわかりやすい。

bigdata

bitvector

data

database
リンク
中学生にもわかるウェーブレット行列 - アスペ日記
id:echizen_tm さんの記事「ウェーブレット木の効率的で簡単な実装 "The Wavelet Matrix"」から始まったウェーブレット行列ブームから半年以上が過ぎ、すでに枯れた技術として確立されつつある感があります。 …嘘です。日本以外ではあんまり来ていません。理由としては、やはりアルファベット圏では単語境界が明確であるため、こちらの記事で書かれているような「キーワード分割の難易度」といったことがあまり問題にならないということがあるかもしれません。まあ、そういうわけで局所的に来ているウェーブレット行列ですが、日本語をはじめとする単語境界のない言語圏にとっては重要なネタであると思うため、解説記事を書き直して*1みようと思います。ウェーブレット行列でできること主となる操作は、文字列に対する定数時間の rank() と select()*2 です。 rank() は、「文
teddy-g 2014/12/15
ウェーブレット行列について。ちゃんと読んでみないといけない。

bigdata

bitvector

data

database
リンク
完備辞書（簡潔ビットベクトル）の解説 - アスペ日記
以前、「簡潔データ構造 LOUDS の解説」というシリーズの記事を書いたことがあります。 LOUDS というのは木構造やtrieを簡潔に表すことができるデータ構造なのですが、この中で「簡潔ビットベクトル」というものについてはブラックボックスとして扱っていました。また、中学生にもわかるウェーブレット行列を書いたときも、その中で出てきた「完備辞書」の実装には触れませんでした。この「簡潔ビットベクトル」「完備辞書」は、同じものを指しています*1。今回は、このデータ構造*2について書いてみます。完備辞書でできることビット列に対する定数時間の rank と selectです*3。 rank()は、「ビット列の先頭から位置 k までに、1 のビットがいくつあるか」*4。 select()は、「ビット列の先頭から見て、n 個目の 1 のビットの次の位置はどこか」*5。それぞれ例を挙げます。
teddy-g 2014/12/15
Succinct Bit Vectorの説明。ちゃんとひとつひとつ確認しながら読みたいと思う。

bitvector

database

bigdata
リンク
［速報］Amazon Aurora発表。MySQL互換で性能5倍、商用リレーショナルデータベースと同等の機能を提供するマネージドなデータベースサービス。AWS re:Invent 2014
［速報］Amazon Aurora発表。MySQL互換で性能5倍、商用リレーショナルデータベースと同等の機能を提供するマネージドなデータベースサービス。AWS re:Invent 2014 Amazonクラウドを提供するAmazon Web Servicesは、同社の年次イベント「AWS re:Invent」を米ラスベガスで開催しています。初日の基調講演では、クラウドがエンタープライズITにおけるニューノーマル（新しい普通）であることを強調。新サービスとして、MySQL互換でありつつ商用リレーショナルデータベース並の性能と機能を実現したという「Amazon Aurora」を発表しました。 MySQLとフル互換でありながら5倍の性能 Amazon Web Servicesシニアバイスプレジデント Andy Jassy氏。既存のリレーショナルデータベースというのは高価で、プロプライエタリで
teddy-g 2014/11/16
通常のMySQLの3倍どころか5倍だと。このウェーブ、乗るしかない

aws

amazon

database

mysql

aurora
リンク
HTML5 - Web SQLデータベース - とほほのWWW入門
サンプルはこちら。データベース(testDB)の中にテーブル(test)を作成し、2件のデータを INSERT し、そのデータを SELECT で読み出して表示しています。 Web SQL Database Sample <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>Web SQL Database Sample</title> <style> #message { margin:1em; width:500px; border:1px solid gray; padding:1em; } </style> <script> function print(msg) { document.getElementById("message").innerHTML += msg + "<br>"; } function te
teddy-g 2014/09/08
Web SQLの解説。SQLiteは標準じゃなくなったんだな。

html5

websql

database

web

sql
リンク
IndexedDB | Can I use... Support tables for HTML5, CSS3, etc
Method of storing data client-side, allows indexed database queries. ❌ 4 - 9: Not supported (but has polyfill available)❌ 10: Not supported◐ 11 - 22: Partial support✅ 23: Supported✅ 24 - 128: Supported✅ 129: Supported✅ 130 - 132: Supported
teddy-g 2014/08/18
indexedDBのサポート状況。まだまだだね。

javascript

html5

database

localstorage

webstorage

jquery.js

indexedDB
リンク
TECH PROjin
セキュリティソリューション事業部からのお知らせセキュリティソリューション事業部のブログサイトを新たに開設いたしました。 https://blog.sie-security.com/ 今後のセキュリティニュースの投稿は上記URLのサイトからとなります。よろしくお願いいたします。担当：TY …More Read
teddy-g 2014/08/18
ｊQueryを使ったindexedDBのサンプル。

javascript

html5

database

localstorage

webstorage

jquery.js

indexedDB
リンク
TECH PROjin
セキュリティソリューション事業部からのお知らせセキュリティソリューション事業部のブログサイトを新たに開設いたしました。 https://blog.sie-security.com/ 今後のセキュリティニュースの投稿は上記URLのサイトからとなります。よろしくお願いいたします。担当：TY …More Read
teddy-g 2014/08/18
indexedDBのサンプル。localStorageは検索が弱そうなんでindexedDBで考えたいところだけど

javascript

html5

database

localstorage

webstorage

jquery.js

indexedDB
リンク
TECH PROjin
セキュリティソリューション事業部からのお知らせセキュリティソリューション事業部のブログサイトを新たに開設いたしました。 https://blog.sie-security.com/ 今後のセキュリティニュースの投稿は上記URLのサイトからとなります。よろしくお願いいたします。担当：TY …More Read
teddy-g 2014/08/18
jQueryを用いたlocalStorageの説明

javascript

html5

database

localstorage

webstorage

jquery.js
リンク
1 2 次のページ