mogwaingのブックマーク / 2009年9月16日

mogwaing id:mogwaing

2009年9月16日のブックマーク (9件)

内積空間 [物理のかぎしっぽ]
この記事の内容は，ここまで考えてきた双対基底や，共変ベクトル，反変ベクトルといった話題とは直接関係ありません．しかし，せっかくベクトル空間や双対空間など，抽象的な概念を紹介しましたので，ついでにもう一つ，内積空間について勉強してしまおうと思います．今すぐに大事なのは『ベクトルの長さはと定義する』という式だけです．その他の部分は，内積，角度，図形の長さといった概念に関する数学的背景ですので，興味の無い人は読まないで先へ進んでも大丈夫です．長さとは？復習になりますが，ベクトル空間とは，ベクトルの満たす加法とスカラー積の演算法則を抽象化し，一般化した概念でした．しかし，まだこれだけでは幾何学を始めるのに十分ではありません．（普通の）幾何学をするには，さらに『長さの概念』を導入しなければなりません．元の間に長さが定義されている集合を距離空間と呼びます．私たちの日常の感覚から言うと
mogwaing 2009/09/16
math

dot product
リンク
Interpolative coding - tsubosakaの日記
今日のInterpolative codingの話が面白かったのと復号の部分のコードが必ずしも自明ではないかと思ったのでメモ。 Interpolative codingは長さと出てくる値の最小値、最大値が分かっている狭義単調増加な自然数のリストを圧縮する方法である。ここで最大値とはリストの最大値ではなく、たとえば転置リストであれば最大の文書IDなど圧縮を行う際に出てきうる値の最大値である。 Interpolative codingの基本的な考え方としてはたとえば1から20までの数が表れるとわかっておりかつリストの長さが20であるということが分かっていれば、なにもデータがなくてもリストが[1..20]であるとわかるということに基づいている。ここでは例で説明する。長さ7のリスト<7;3,8,9,11,12,13,17>を圧縮することを考える。またここで出てくる数の最大値は20であることが分
mogwaing 2009/09/16
inverted index

compression

interpolative coding
リンク
Kazuho@Cybozu Labs: Pacific という名前の分散ストレージを作り始めた件
大規模なウェブアプリケーションのボトルネックがデータベースであるという点については、多くの同意が得られるところだと思います。解決策としては、同じ種類のデータを複数の RDBMS に保存する「sharding」 (別名：アプリケーションレベルパーティショニング／レベル２分散注1) が一般的ですが、最近では、分散キーバリューストア (分散 KVS) を使おうとする試みもみられるようになってきています。分散 KVS が RDBMS sharding に対して優れている要素としては、事前の分割設計が不要で、動的なノード追加（とそれにともなう負荷の再分散）が容易、といった点が挙げられると思います。一方で、Kai や Kumofs のような最近の実装では eventually consistent でこそ無くなってきているものの、ハッシュベースの分散 KVS は、レンジクエリができなかったり (例:
mogwaing 2009/09/16
database

storage
リンク
Compressing Integer Sequences and Sets
mogwaing 2009/09/16
compression

moffat
リンク
Alistair Moffat
Research interests Text and index compression Text indexing methods, index construction Information retrieval heuristics Current Research and List of Papers Books Programming, Probl em Solving, and Abstraction with C, 2003 Compression and Coding Algorithms, 2002 Managing Gigabytes: Compressing and Indexing Documents and Images, 1999 Postgraduate students Sri Devi Ravana Stefan Pohl William Webber Y
mogwaing 2009/09/16
researcher
リンク
Registration: Machine learning & data conference | O'Reilly Strata
We’ve made the very difficult decision to cancel all future O’Reilly in-person conferences. Instead, we’ll continue to invest in and grow O’Reilly online learning, supporting the 5,000 companies and 2.5 million people who count on our experts to help them stay ahead in all facets of business and techno logy. Come join them and learn what they already know. Become an O’Reilly online learning member
mogwaing 2009/09/16
sessions

mysql

storage engine
リンク
ウノウラボ Unoh Labs: 国産MySQLストレージエンジン「Spider」の作者、斯波健徳氏に聞く
こんにちは。中村です。 MySQLにはMyISAM、InnoDB、CSVなどのいくつかストレージエンジンがありますが、皆さんはSpiderというストレージエンジンを聞いたことはありますでしょうか。Spider Storage Engineは斯波健徳さんにより作成されたDatabase Shardingを可能にするストレージエンジンでMySQL 5.1で利用可能です。先日、某集まりで斯波さんとお会いしたときにSpiderを作っているということを教えてもらったので、早速詳しい内容を教えてもらうことにしました。 ※Spiderについての説明資料はMySQLカンファレンス 2009にて斯波さんが発表されたときのスライドがあります。スライドの直リンク（zip） Spider Storage Engine について posted by (C)フォト蔵 Spider Storage Engineとは？
mogwaing 2009/09/16
mysql

spider
リンク
The Claremont Report on Database Research
The Claremont Database Research Self-Assessment Meeting Claremont Resort Berkeley, CA May 29-30, 2008 Abstract: In late May, 2008, a group of database researchers, architects, users and pundits met at the Claremont Resort in Berkeley, California to discuss the state of the research field and its impacts on practice. This was the seventh meeting of this sort in twenty years, and was distinguished b
mogwaing 2009/09/16
database

research

must
リンク
世界のトップ研究者がデータベースの未来を語る - Claremont Report on Database Research
５年に一度、データベースのトップ研究者が一か所に集まって、データベースの未来について語るThe Clearemont Report on Database Research 2008の記事がCACMに紹介されていました。 The Claremont Report on Database Research （各研究者のプレゼンテーションスライドはこちらから）大規模データ処理、RDBMSエンジンの見直しの必要性、クラウド、MapReduce、開発者にとってのデータベースの使いやすさ、新しい言語は？、Uncertain data, プライバシーの管理などなど、DBの将来を見据えた意見が盛りだくさんです。どの研究者がどの方向性を打ち出しているのかを記事から読み取れれば、もう立派なデータベース通。そして、錚々たるメンバーのなかになぜかTim O'Reillyが混じっている。。。とにもかくにも、
mogwaing 2009/09/16
database

research
リンク
- 2009年9月18日
- 2009年9月16日
- 2009年9月15日