This Page has moved to a new address: kunishi’s blog: XML DBや半構造データについて思うこと Sorry for the inconvenience… Redirection provided by Blogger to WordPress Migration Service
先日、ACM SIGMODの日本支部大会に招いていただいて、「Relational-Style XML Query (ACM Portal http://doi.acm.org/10.1145/1376616.1376650)」について講演をしてきました。Relational-Style XML Queryは、XMLという複雑な構造をもったデータに対して、SQLのようなテーブルデータへの検索に使われる言語で問い合わせする手法です。 この研究の肝は、木構造データといわれるXMLでも、実はそのほとんどがリレーション(Microsoft Excelのようなテーブル形式のデータ)の組み合わせと考えることができ、そのテーブル構造の情報(スキーマ)を使うと、検索が非常に簡単に書けるという点です。
はじめに W3C XML Schema は学ぶのも使うのも簡単だ … 落とし穴をよける方法を知っていればね。「やるべきこと」はこれだ。最低これだけおぼえておけばいい。 これを使え!: 要素宣言、属性グループ、モデルグループ、単純型 可能な限り XML 名前空間を使え! そしてその正しい使い方を学ぶべし。 そして「やってはいけないこと」がこれだ。 XML Schema の名人になろうとするな! それには何ヵ月もかかるだろう。 こんなものは使うな!: 複合型(その理由)、 属性宣言(その理由)、 記法(その理由) ローカル宣言は使うな!(その理由) 置換グループは使うな! (その理由) targetNamespace 属性のないスキーマ(いわゆるカメレオンスキーマ)を使うな!(その理由) 後で説明するが、実際これらの「やってはいけない」ことをやらないことで失うものは何もない。 長くておぼえられ
「ボヘミアン」と「貴族」という名称が使われるきっかけとなったのは、2002年12月にADTmag.comに掲載されたUche Ogbuji氏執筆の記事「XML class warfare」(XML階級闘争)だ。この記事では、XMLにおける型情報の扱いなどに関するこれまでの議論の経緯や整理が行われている。その内容を要約すると、以下のようになる。 W3CのXML SchemaによるXMLデータ型の標準化は、「貴族」の登場を確立するきっかけになった。貴族はXMLのデータにおいても、C++やJavaやSQLにおけるデータと同様に常にデータと型情報を関連付けるのを好む人たちである。一方で従来のようにXML内のデータと型情報との対応は最小限のものにとどめ、記述されたテキストのまま処理できることが重要と考える一派が「ボヘミアン」となった。私(Ogbuji氏)自身はボヘミアンである。 両派は、XPathと
(html (head (title "sxml")) (body (@ (bgcolor "blue") (text "white")) (center (b "Hello.")))) <html> <head><title>sxml</title></head> <body bgcolor="blue" text="white"> <center><b> Hello.</b></center> </body> </html> 左の SXML を変換すると 右の XML になるということです. 要素は list の car, 内容は cdr, 属性は @ に続く cdr, という感じです. 閉じタグが無い分だけ, コード量も削減できますね. SXML から XML を生成するコードも Oleg さんの site にありますけど, 結構いろいろ複 雑なことやっている上に, 単純に変換
W3C Recommendation 28 October 2004 This version: http://www.w3.org/TR/2004/REC-xmlschema-2-20041028/ Latest version: http://www.w3.org/TR/xmlschema-2/ Previous version: http://www.w3.org/TR/2004/PER-xmlschema-2-20040318/ Editors: Paul V. Biron, Kaiser Permanente, for Health Level Seven <Paul.V.Biron@kp.org> Ashok Malhotra, Microsoft (formerly of IBM) <ashokma@microsoft.com> Please refer to the err
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く