[B! MySQL] uemuのブックマーク

Twitterにおける大規模システム構築、3つの原則

4月に米サンタクララで行われたMySQL Confernce & Expo 211では、TwitterのJeremy Cole氏が「Big and Small Data at @Twitter」と題して、同社のシステムにおける原則とシステム構成について紹介したプレゼンテーションが行われました。 1日に1億5000万以上のツイートが行われているTwitterのシステムはどのように構築されているのか、その内容を紹介しましょう。 Twitterにおける原則 TwitterのJeremy Cole氏。

uemu 2011/05/24

リンク

[ 2728 ] [MySQL]エラーコード：1449 ::: Serendipity 2 future lies'n sundome. (´・ω・)

作業中に突然出始めたエラーでした。接続はできるけれど、一切アクセス権限がなかったり、一部のアカウントのみ参照できたりと異常事態が起きていました。作業はいつもどおりに、つつがなく MySQLを使ったアプリは結構な数作っていますので、弊社の中のサーバにもいくつかMySQLのインスタンスが現役稼動しております。検証環境を含めても、Oracleのインスタンスと同じくらいいます。私が検証や試験で使う場合は、いつもだと自分専用のインスタンスにしているんですが、今回は本番リリース予定のアプリだったので、規模は小さいながらも念のためテスト用のインスタンスも用意しておきました（ω・そのアプリは、ほとんどが検索処理で、更新処理はバッチが99%以上を占めるものでしたので、結構穏やかな機能のものでした。通常のSELECT文を発行していて、いくつか動作テストをしていましたが、特に問題はありませんで

uemu 2011/02/10

dumpで注意すること

mysql

リンク

NoSQLとしてMySQLを使うDeNAが、memcachedよりも高速な75万クエリ／秒を実現

モバゲーで知られるDeNAは、バックエンドデータベースにNoSQLを使っていません。なぜか？それはMySQL/InnoDB 5.1の環境で秒間75万クエリという、多くのNoSQLでも実現できないような高性能を実現しているから。DeNAの松信嘉範（まつのぶよしのり）氏は、自身のブログにこんな内容のエントリ「Using MySQL as a NoSQL - A story for exceeding 750,000 qps on a commodity server」（英語）をボストしています。 Yoshinori Matsunobu's blog: Using MySQL as a NoSQL - A story for exceeding 750,000 qps on a commodity server 松信氏が指摘するように、大規模なネットサービスを提供している企業の多くは分散環境で

uemu 2010/10/27

興味深いアプローチ

mysql

リンク

Spider DeNA Technology Seminar #2

MariaDB/MySQLでデータベースシャーディングの機能を提供するストレージエンジン、Spiderの紹介です。

uemu 2010/10/21

spiderのプレゼン資料 YAPC::ASIA 2010

mysql
spider

リンク

HA化機能を手に入れたSPIDERストレージエンジンにはもはや死角はなかった。

本ブログでも何度か取り上げたことのあるあのSPIDERストレージエンジンがさらにパワーアップして便利になった！８月にリリースされたバージョン2.22では次の２つの強化が行われている。 HA機能の追加（データノードの冗長化） LinuxおよびWindows用ビルド済みMySQLパッケージの配布インストールが簡単になった！前回SPIDERストレージエンジンを紹介したときには、ソースコードからコンパイルする必要があり、なおかつMySQL 本体にパッチを適用しなければならず、利用するまでの敷居が高かったように思う。しかし、バージョン2.22よりSPIDERを含んだビルド済みバイナリが提供されたことにより、SPIDERを利用する手間はぐっと少なくなった。しかもこのビルド済みのバイナリにはSPIDERだけでなく各種パッチと、さらにはVPストレージエンジンまで含まれているという気の利きようだ。コンパイル

uemu 2010/10/18

調べる

mysql

リンク

[Python] OSX 10.6でMySQLdbのインストールに手間取った話 – taichino.com

表題の件ですが、何も考えずにeasy_install MySQL-pythonとすると、インストールは成功するものの、importしようとすると以下のようなエラーが出て使用できませんでした。 ImportError: dlopen(/path/to/_mysql.so, 2): no suitable image found. Did find: /path/to/_mysql.so: mach-o, but wrong architecture Terminalからmysqlコマンドを叩くと普通に動作していましたが、エラーメッセージ的にはarchitectureが間違っているよと言っているようです。そこでMySQL dbのソースコードをarchitectureを指定してコンパイルしてみたのですが、やはり同様のエラーが出て解決できませんでした。さらに調べてみると、Pythonの動作モードを

uemu 2010/09/07

OS Xはしばらく使わないが、これははまりそうだ

python
mysql

リンク

HandlerSocketソースコード公開しました | BLOG - DeNA Engineering

はじめまして、樋口と申します。先日のDeNA Techno logy Seminar #2でお話させていただきました HandlerSocket Plugin for MySQL のソースコードを公開しました。 HandlerSocketとは？簡単に言うと、MySQLデータベースへのアクセスを高速化するためのプラグインです。MySQLのSQLパーザをすっ飛ばし、ネットワーク通信とマルチスレッド処理周辺を置き換えることによって、InnoDB等のデータベースエンジンの性能を限界まで引き出します。このHandlerSocketですが、すでにモバゲータウンにて実際に運用しています。従来MySQLとmemcachedの構成で運用していた箇所を、HanderSocketを組み込んだMySQLだけの構成に置き換えました。その結果、MySQLサーバの負荷軽減、memcachedの負荷軽減、ネットワーク

uemu 2010/08/26

mysql

リンク

MySQLでサービス停止のないALTER TABLEの検討 - SH2の日記

MySQLでテーブルへのカラム追加、インデックス追加やテーブルの再編成などを行うと、その間テーブルに共有ロックがかかってしまいます。そのためこれらのメンテナンス処理は、通常利用者の少ない深夜早朝帯にサービスを止めて実施する必要があります。本日はそれを無停止、オンラインのままでできないかという話題です。基本的なアイデアメンテナンス対象の元テーブルをコピーして、作業用の仮テーブルを作ります仮テーブルに対して、カラム追加などの変更を加えますその間、元テーブルに対して行われる更新処理について差分を記録しておきます仮テーブルの変更が終わったら、記録しておいた差分データを仮テーブルに反映します差分データの反映が終わったら、元テーブルと仮テーブルを入れ替えますこれと似たようなことを考えた方は結構いらっしゃるのではないでしょうか。ただ、言うは易し、行うは難しです。整合性がきちんと取れるかどう

uemu 2010/07/04

mysql

リンク

最強のMySQL HA化手法 - Semi-Synchronous Replication

MySQL 6.0で搭載される予定の機能の一つに、Semi-Synchronous Replicationというものがある。コイツを使うととんでもなく凄いHA化ができるので、今日はその方法を紹介しよう。まずはSemi-Synchronous Replicationの機能説明から。そもそもSemi-Synchrounousってナニ？どうして完全な同期でもなく非同期でもなくSemi-Synchronousなの？という疑問をまずは解消したいと思う。さっそく次の図を見て欲しい。これはSemi-Synchronous Replicationの動作を図で表したものである。図だけではなんだかよく分からないと思うので、以下に各ステップの詳細を説明する。アプリケーション（クライアント）からトランザクションをCOMMIT要求を出す。バイナリログを更新する。ストレージエンジン（テーブル）を更新する。

uemu 2010/04/19

通常のHAでは稼働系のクラッシュが発生すると次のような手順でフェイルオーバーが実行される。スレーブがファイルシステムをマウントする。 MySQLサーバを起動する。 InnoDBのログを調べてクラッシュリカバリ（Redo/Undo）

mysql

リンク

MySQLコミュニティ騒然！MySQL 5.5.4が与えるインパクト。

先週、MySQL Conference & Expo 2010が開催され、盛況のうちに終了した。カンファレンスに合わせる形で、MySQL 5.5.3および5.5.4がリリースされたのだが、これが目を見張るような進化を遂げている。特に性能面での進化には目を見張るものがある！Jeremy ZawodnyやMark Calleghanといったコミュニティの重鎮たちも「非常にエキサイティングなリリースだ！」などと表して歓迎の意を表している。というわけで、本日はMySQL 5.5.3/5.5.4の新機能および変更点についてレビューしてみよう！おさらい。〜 MySQL 5.5の既存の機能〜MySQL 5.5が登場したとき、その新機能については以前にもエントリで紹介したが、ここで改めておさらいしてみよう。MySQL 5.5は、正確にいうと現在最新バージョンであるMySQL 5.1の「次の次」のバ

uemu 2010/04/19

オラクルが買った後もちゃんと成長するようだ

mysql

リンク

大規模データ処理に便利そうなコマンドを覚えたよ！

head(USArrests) こうなる Murder Assault UrbanPop Rape Alabama 13.2 236 58 21.2 Alaska 10.0 263 48 44.5 Arizona 8.1 294 80 31.0 Arkansas 8.8 190 50 19.5 California 9.0 276 91 40.6 Colorado 7.9 204 78 38.7

uemu 2010/01/07

R
MySQL

リンク

Kazuho@Cybozu Labs

多数のユーザーの行動記録からアテンション情報（注目されているデータが何か）をデータマイニングしたいというのは、大量のデータを扱っているウェブサイトにおいては自然と出てくる要求です。そこで、先月末にサービスを終了したサービス「パストラック」において使用していた、アクセスログから注目度（人気度）の高いウェブページや人名等のキーワードを抽出するためのアルゴリズムを紹介しておきたいと思います。たとえばはてなブックマークのような、ユーザーの能動的な行為（「ブックマークする」という作業）から注目情報を抽出するのは決して難しいことではありません。それは、直近の一定期間内のブックマーク数＝注目度、という前提が上手に機能するからです。現に、はてなブックマークの人気エントリーは、最近24時間程度の期間内にブックマークしたユーザー数の多い URL を降順で並べているように見受けられます。しかし、アクセスログ

uemu 2009/09/30

非常に面白かったので必見

mysql

リンク

HowFriendFeedUsesMySqlToStoreSchemaLessData - FriendFeed では MySQL を使いどのようにスキーマレスのデータを保存しているのか

HowFriendFeedUses MySqlToStoreSchemaLessData - FriendFeed では MySQL を使いどのようにスキーマレスのデータを保存しているのか目次この記事について FriendFeed? では MySQL を使いどのようにスキーマレスのデータを保存しているのか背景概観詳細一貫性と原子性性能 FriendFeed? では MySQL を使いどのようにスキーマレスのデータを保存しているのかこの記事について "How FriendFeed? uses MySQL to store schema-less data" の日本語訳です http://bret.appspot.com/entry/how-friendfeed-uses-mysql CC 2.5 でライセンスされています: http://creativecommons.org/

uemu 2009/03/02

python
mysql

リンク

MySQL の filesort プチテクニック - kazuhoのメモ置き場

MySQL のチューニング関連のドキュメントを読んでいると「ORDER BY を避けろ」と書いてあるけど、できない (or したくない) 場合もあるわけで。そういう時はソート用の表と表示用の表を分割し自己結合することで、高速化できることもあります。適当な例ですが、 mysql> SHOW CREATE TABLE testt\G *************************** 1. row *************************** Table: testt Create Table: CREATE TABLE `testt` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `priority` int(10) unsigned NOT NULL, `data` varchar(255) NOT NULL, PRIMAR

uemu 2008/12/08

order byを早くするプチテク

mysql

リンク

MySQL :: MySQL 8.0 リファレンスマニュアル :: 4.6.4.3 myisamchk の修復オプション

myisamchk は、テーブルの修復操作 (--recover オプションまたは --safe-recover オプションなどのオプションが指定された場合に実行される操作) のために次のオプションをサポートします。 --backup, -B .MYD ファイルのバックアップを file_name-time.BAK として作成します。 --character-sets-dir=dir_name 文字セットがインストールされているディレクトリ。セクション10.15「文字セットの構成」を参照してください。 --correct-checksum テーブルのチェックサム情報を修正します。 --data-file-length=len, -D len データファイルの最大長 (データファイルが「いっぱい」になったとき再作成する場合)。 --extend-check, -e データファイルからできる

uemu 2008/11/04

mysql

リンク

MySQL Conference & Expo 2007 - とあるはてな社員の日記

一昨日から今日まで3日間の日程で開催されていた、MySQL Conference & Expo 2007に行ってきました。日帰り圏内どころか、自転車圏内で、こういうカンファレンスがあるのは、素晴しいです。詳細は、随時アップされるであろうプレゼン資料と、Planet MySQLに大量の報告があります(全部英語ですけど)。個人的に注目していたのは、Digg.com、Flickr.comとYoutube.comのDB周りアーキテクチャのセッションでした。あとは、http://www.mysqlperformaceblog.com/の人のセッションは、細かいTipsが多く、具体的にだいぶ役に立ちそうです。というわけで、簡単に注目したセッションの内容を紹介してみます。ちなみに、内容の正確さは無保証です:P 気が向けば、もっといろいろ考察してみるかもしれません。 Techno logy at Di