タグ

2009年9月16日のブックマーク (9件)

  • 内積空間 [物理のかぎしっぽ]

    この記事の内容は,ここまで考えてきた双対基底や,共変ベクトル,反変ベクトルといった話題とは直接関係ありません.しかし,せっかくベクトル空間や双対空間など,抽象的な概念を紹介しましたので,ついでにもう一つ,内積空間について勉強してしまおうと思います. 今すぐに大事なのは『ベクトル の長さは と定義する』という式だけです.その他の部分は,内積,角度,図形の長さといった概念に関する数学的背景ですので,興味の無い人は読まないで先へ進んでも大丈夫です. 長さとは? 復習になりますが,ベクトル空間とは,ベクトルの満たす加法とスカラー積の演算法則を抽象化し,一般化した概念でした. しかし,まだこれだけでは幾何学を始めるのに十分ではありません.(普通の)幾何学をするには,さらに『長さの概念』を導入しなければなりません.元の間に長さが定義されている集合を 距離空間 と呼びます. 私たちの日常の感覚から言うと

  • Interpolative coding - tsubosakaの日記

    今日のInterpolative codingの話が面白かったのと復号の部分のコードが必ずしも自明ではないかと思ったのでメモ。 Interpolative codingは長さと出てくる値の最小値、最大値が分かっている狭義単調増加な自然数のリストを圧縮する方法である。 ここで最大値とはリストの最大値ではなく、たとえば転置リストであれば最大の文書IDなど圧縮を行う際に出てきうる値の最大値である。 Interpolative codingの基的な考え方としてはたとえば1から20までの数が表れるとわかっておりかつリストの長さが20であるということが分かっていれば、なにもデータがなくてもリストが[1..20]であるとわかるということに基づいている。 ここでは例で説明する。長さ7のリスト<7;3,8,9,11,12,13,17>を圧縮することを考える。またここで出てくる数の最大値は20であることが分

    Interpolative coding - tsubosakaの日記
  • Kazuho@Cybozu Labs: Pacific という名前の分散ストレージを作り始めた件

    大規模なウェブアプリケーションのボトルネックがデータベースであるという点については、多くの同意が得られるところだと思います。解決策としては、同じ種類のデータを複数の RDBMS に保存する「sharding」 (別名:アプリケーションレベルパーティショニング/レベル2分散注1) が一般的ですが、最近では、分散キーバリューストア (分散 KVS) を使おうとする試みもみられるようになってきています。 分散 KVS が RDBMS sharding に対して優れている要素としては、事前の分割設計が不要で、動的なノード追加(とそれにともなう負荷の再分散)が容易、といった点が挙げられると思います。一方で、Kai や Kumofs のような最近の実装では eventually consistent でこそ無くなってきているものの、ハッシュベースの分散 KVS は、レンジクエリができなかったり (例:

  • Compressing Integer Sequences and Sets

  • Alistair Moffat

    Research interests Text and index compression Text indexing methods, index construction Information retrieval heuristics Current Research and List of Papers Books Programming, Problem Solving, and Abstraction with C, 2003 Compression and Coding Algorithms, 2002 Managing Gigabytes: Compressing and Indexing Documents and Images, 1999 Postgraduate students Sri Devi Ravana Stefan Pohl William Webber Y

  • Registration: Machine learning & data conference | O'Reilly Strata

    We’ve made the very difficult decision to cancel all future O’Reilly in-person conferences. Instead, we’ll continue to invest in and grow O’Reilly online learning, supporting the 5,000 companies and 2.5 million people who count on our experts to help them stay ahead in all facets of business and technology. Come join them and learn what they already know. Become an O’Reilly online learning member

    Registration: Machine learning & data conference | O'Reilly Strata
  • ウノウラボ Unoh Labs: 国産MySQLストレージエンジン「Spider」の作者、斯波健徳氏に聞く

    こんにちは。中村です。 MySQLにはMyISAM、InnoDBCSVなどのいくつかストレージエンジンがありますが、皆さんはSpiderというストレージエンジンを聞いたことはありますでしょうか。Spider Storage Engineは斯波健徳さんにより作成されたDatabase Shardingを可能にするストレージエンジンでMySQL 5.1で利用可能です。 先日、某集まりで斯波さんとお会いしたときにSpiderを作っているということを教えてもらったので、早速詳しい内容を教えてもらうことにしました。 ※Spiderについての説明資料はMySQLカンファレンス 2009にて斯波さんが発表されたときのスライドがあります。スライドの直リンク(zip) Spider Storage Engine について posted by (C)フォト蔵 Spider Storage Engineとは?

  • The Claremont Report on Database Research

    The Claremont Database Research Self-Assessment Meeting Claremont Resort Berkeley, CA May 29-30, 2008 Abstract: In late May, 2008, a group of database researchers, architects, users and pundits met at the Claremont Resort in Berkeley, California to discuss the state of the research field and its impacts on practice. This was the seventh meeting of this sort in twenty years, and was distinguished b

  • 世界のトップ研究者がデータベースの未来を語る - Claremont Report on Database Research

    5年に一度、データベースのトップ研究者が一か所に集まって、データベースの未来について語るThe Clearemont Report on Database Research 2008の記事がCACMに紹介されていました。 The Claremont Report on Database Research (各研究者のプレゼンテーションスライドはこちらから) 大規模データ処理、RDBMSエンジンの見直しの必要性、クラウド、MapReduce、開発者にとってのデータベースの使いやすさ、新しい言語は?、Uncertain data, プライバシーの管理などなど、DBの将来を見据えた意見が盛りだくさんです。 どの研究者がどの方向性を打ち出しているのかを記事から読み取れれば、もう立派なデータベース通。そして、錚々たるメンバーのなかになぜかTim O'Reillyが混じっている。。。 とにもかくにも、