タグ

by-kanzakiに関するnak2kのブックマーク (26)

  • XHTMLからメタデータを自動抽出する

    セマンティック・ウェブを実現する上で大きな鍵になるのが、どうやってメタデータを余計な負荷なしに提供してもらうかという方法論です。XHTMLで構造的な要素タイプ、class属性、id属性を適切に使用していれば、XSLTでここからメタデータを変換・抽出することが可能です。これを共通オントロジーと結びつければ、わざわざコンテンツと別にメタデータを用意しなくても、通常のコンテンツ制作がそのままセマンティック・ウェブの基礎になってくれるのです。 セマンティック・ウェブの関門:メタデータの収集 XSLTとXHTMLのclass属性を活用する a要素を使ったリソースとしての目的語 メタデータ用XSLTの存在を知らせる より汎用的なアプローチ テーブルデータの変換:th要素の内容を使う テーブルでもclass属性を使ってみる head要素からのメタデータ抽出 XHTMLの拡張によるメタデータ埋め込み メタ

  • ちょっとしたメモ - W3Cの新しいXSLTサービスとGRDDL

    W3CのオンラインXSLTサービスが新しくなって、文字コードの扱いが改善された。以前はUTF-8以外の文字コードは即座にJavaの例外を引き起こしていたのだが、今回はShift_JISでもEUC-JPでもちゃんと処理できている。これによって、日語XHTMLページからGRDDLでRDFを容易に抽出できるようになる、はずだ。 XHTML文書からRDFを抽出するには、たとえば当サイトの汎用XSLT(xh2rdf.xsl)をこのオンラインサービスで適用すればよい。整形式を満たしている文書なら、タイトルや見出しがメタデータとして取り出され、要約やキーワード、作者の連絡先があればそれも含めたRDFが得られる。 XHTML: さらに、head要素のプロファイルとしてhttp://purl.org/net/ns/metaprofを記述していれば、W3CのGRDDL demoページから直接RDF抽出を行う

  • ちょっとしたメモ - SPARQLがW3C勧告に

    ウェブ上でRDFデータの照会を行うSPARQLが15日付でW3C勧告となった。仕様は、問い合わせ言語SPARQL Query Language for RDF、プロトコルSPARQL Protocol for RDF、クエリ結果のXMLフォーマットSPARQL Query Results XML Formatの3つ。バーナーズ=リーのことばを借りれば、ようやくデータベースとしてのウェブのためのSQLが標準化されたわけで、分散する多様なデータへの一貫したアクセスが可能になる。 SPARQLはすでに多くの言語で実装されていて、JavaのJenaライブラリ、PerlのRDF::Query、PHPのARC、PythonのRDFLib、さらにいろんな言語から使えるRasqal RDF Query Libraryなどが揃っている(サポート具合は差があるので、実装状況調査を参照)。 SPARQLクエリを

  • ちょっとしたメモ - Dublin Coreの改訂定義

    Dublin Core語彙の定義が、これまで検討されてきた内容を踏まえてかなり改訂され、新DCMI Metadata Termsとして勧告された。定義域、値域は別途Domains and Ranges for DCMI Propertiesという文書にもまとめられ、さらに改訂の概要を説明するRevisions to DCMI Metadata Termsも公開されている。 改訂概要では定義域、値域を「提案している」となっているが、語彙定義に含まれているので、正式なものと考えてよいのだろう。見やすいように「DCプロパティと定義域、値域一覧」としてまとめておく。 今回の改訂では、過去から引きずっていたいろんな経緯を振り切って、できるだけDCMI抽象モデルに忠実になるような整理が行われた。スキーム要素と呼ばれていたものが「語彙符号化スキーム」と「構文符号化スキーム」に分けて定義しなおされたり、プ

  • masakaのページ - 今をメモするTimelog

    masaka良くも悪くも昔のものをほぼそのまま使っているようで、10年経っても同じデザインなのは和むが、Shift_JISとか、RSSアイコンは残っているが中身なしとか、残念なところも

  • ちょっとしたメモ - SKOSの新草案

    旧SWBPのプロジェクトという位置づけで草案が公開されていたSKOSが、W3Cの標準化トラックに乗って、改めて最初の草案 SKOS Simple Knowledge Organization System Reference が公開された。シソーラスや分類表などの図書館系の知識体系を、できるだけそのままRDFで表現できるようにする語彙+モデルで、個人的なカテゴリや分類方法を体系化するのにも使える。さまざまな領域において、すでに多くのシソーラスや用語集が構築されているわけだが、これらは必ずしもOWLなどでそのままクラス体系として記述できるとは限らない。こうした知識や情報を、無理なく「セマンティック・ウェブ」に組み込むモデルとして、SKOSの果たす役割はかなり大きいのではないかと期待される。 SKOSでは、シソーラスや分類で扱う「術語」を、OWLのクラスではなく、概念リソース(Conceptu

    nak2k
    nak2k 2008/02/07
    自分でも考えてたのとぴったりあいそうなものはっけーん。概念リソースに、概念スキームか。OWLだけじゃ多分無理だろうな、と自作するところだった。。。
  • ちょっとしたメモ - Atomのcategory要素とURI参照

    Last Callといいつつ6月7日にはまたID-9が出ていたりするAtomのシンジケーション書式仕様だが、ID-04から取り入れられていたcategory要素について、少し補足説明しておこう。 Atomでは、feed要素、entry要素ともにその「カテゴリー」を示すcategory要素を任意の数、持つことができる。これは、カテゴリーを示す分類名をterm属性(必須)で記述したうえで、必要に応じてそのスキーム(名前空間)のIRIをscheme属性で加えてもよいというもの(さらにlabel属性も使える)。たとえば、あるウェブログ・エントリーが音楽について書かれていることを示すなら、次のような具合だ: (例) <category term="Music" scheme="http://xmlns.com/wordnet/1.6/" label="音楽"/> これはなかなか面白い仕掛けになってい

    nak2k
    nak2k 2008/02/07
    taxonomy設計の別解として。
  • ちょっとしたメモ - RSSのtaxonomyモジュール

    巷で話題の朝日新聞のRSSを見ると、taxonomyモジュールの名前空間が宣言してある。この、名前は比較的知られている(かな?)のに使用例がほとんど無い珍しいモジュールは、チャンネルのアイテムを分類するために使うものだ。dc:subjectと似ているが、taxonomyではキーワードを文字列ではなくURIで示す。Asahi.comでは宣言だけでまだ実際に使われているわけではないけれど、「総合」「国際」などのジャンル目次ページのURIをRSSで提供する計画だったりして? taxonomyモジュールでは、taxo:topicsという要素を使って、item(あるいはchannelでもいい)のトピックを列挙する。 (例) <rdf:RDF xmlns="http://purl.org/rss/1.0/" xmlns:dc="http://purl.org/dc/elements/1.1/" xml

  • ちょっとしたメモ - HTML5はモジュール化しないの?

    HML5の最初の草案が公開されたが、まともに印刷すると400ページ以上になる分量を読むのはなかなか大変。それなのに仕様は、First, it should be read cover-to-cover, multiple times. Then, it should be read backwards at least once. Then it should be read by picking random sections ...なんてことを要求している。まぁそれはともかく、こんな巨大な仕様は、モジュール化するのが吉というのが、HTML4実装の教訓だったんじゃないのかな。適切に設計すれば、「HTML5の○○が気に入らない」という相反する意見も、モジュールの組み合わせでうまく行くかもしれないのに。 さまざまな機器でウェブにアクセスするようになり、またその利用目的もオンライン取引からソー

  • RDF/XML構文の簡単な説明

    リソース表現のフレームワークであるRDFのモデルは、一般にXMLとして記述して利用します。この構文では、同じモデルを異なった方法で記述できるので、多少混乱するかも知れません。RDF/XML構文の基ルールと、それから導かれる省略記述方法を説明します。 RDFをXMLで表現する XML構文のモデル生成規則 ノード要素の生成規則 プロパティ要素の生成規則 生成規則を利用したXML構文の短縮例 参照文献 RDFをXMLで表現する RDFは、主語[S]となるリソースを、述語[P]と目的語[O]によって表現します。RDFのモデルは、[S]と[O]をノードとし、[P]をこれらを結ぶアークとする有向ラベル付きグラフとして表されます[RDFMS]。このとき、目的語[O]がリソースである場合は、その目的語を主語にした別の文(Statement)が続くという、連鎖型のモデルをとることができ、グラフとしては、ノ

    nak2k
    nak2k 2007/12/23
    生成規則によるXMLの簡略表記。
  • RDF -- リソース表現のフレームワーク

    ウェブの目標である「マシンに理解可能な情報」の表現のためには、メタデータなどのリソース相互の関係を、特定のアプリケーションに依存しない形で叙述的に示す共通の方法が必要です。RDFは、主語(リソース)と述語(プロパティ)、そしてその目的語(オブジェクト:プロパティの値)の三者関係によって、関係の連鎖を辿ることができるようなデータモデルを記述します。 マシンに理解可能な情報の記述 RDFの基データモデルとXML構文 シンプルなRDFモデルとグラフ 基データモデルを表現するXML構文 コンテナモデル 具体化:文についての文 とりあえずのまとめ 稿で取り上げなかったこと 参照文献 ※体系的な解説『RDF/OWL入門』を上梓しました。 マシンに理解可能な情報の記述 バーナーズ・リーが描いていたウェブの目標は、「コンピュータで読みとれる形の情報の空間が、人々の思考、やり取り、仕事のパターンの状態

  • ごく簡単なHTMLの説明

    HTML来簡単で便利なものです。「30分間HTML入門」で基は十分。まずシンプルに自分の情報を表現してみてください。 You can write a document as simple as you like. In many ways, the simpler the better. -- Tim Berners-Lee 簡単なHTMLの説明 少し詳しいHTMLの説明 XHTMLから次世代ウェブへ 電子テキストで情報発信 簡単なHTMLの説明 だんだん説明の量が増えてきたので、コンパクトな入門ページを用意しました。 基がきちんと分かる30分間(X)HTML入門 HTMLを使った人間・コンピュータ双方にわかりやすい表現 (スライドのHTML版) 何のためのHTMLHTMLは画面をレイアウトするためではなく、文書を環境に依存せずに共有できるように記述するための約束です。そこを正

  • ちょっとしたメモ - Tim Brayのurn:tag:スキーム案

    Tim Brayが2月1日の記事「Tag Scheme?」で、URNのNIDとして"tag"を導入し、urn:tag:というスキームで「タグ」を識別するというアイデアを示した。これを受けて、コメント欄などでちょっとした議論が展開されている。もともとはAtomフィードのcategory要素のscheme属性のために使おうというものだったようだが、タグ文字列がそのままURIに対応することになるので、面白いと同時に危うい面も併せ持つURNだ。 コメント欄に出ている意見は、概ね次のような感じ。 わざわざ新しいURNを登録しなくても、http:で同じことができる、あるいはURNでは参照を辿れないからhttp:の方がよい。 タグあるいはカテゴリを一意に示すには、WikipediaのページURIを利用すればよいではないか。 タグをURIで表すとき、geo:lat=...のような「マシン・タグ」との関係を

  • XHTML 1.1 - モジュール化されたXHTML

    XHTML1.0の勧告に続いて、さまざまな情報機器の表現能力の違いなどに対応するための「モジュール化された」XHTML 1.1が2001年5月31日に勧告されました。概要について説明します。 XHTML1.1とは モジュール化とXHTML1.1の文書型 XHTML Basic 独自の文書型を定義する XHTML1.1とは XHTML 1.0は、HTMLで書かれた既存コンテンツのXHTMLへのスムーズな移行を第一の目的としていました。次の段階では一歩進んで、文書の構成要素を小さな単位に分けて定義し、これらを組み合わせることで多様なデバイスや環境に柔軟に合わせた独自のタグセットを設計できるモジュール化という考え方が取り入れられています。モジュールを組み合わせてつくられるいろいろなタイプのXHTMLを、W3CはXHTMLファミリーと呼んでいます。 XHTML 1.1はXHTMLファミリーの一つで

  • XHTMLの書き方と留意点

    class="abstract" itemprop="http://purl.org/dc/terms/abstract"ひろく普及したHTMLの資産を生かしつつ、より強力で応用範囲の広いXMLの技術をWebに取り込むために、HTML 4.01と互換性を持つ新しいマークアップ言語XHTML 1.0が勧告されました。次の世代に備えるための、いくつかのポイントをご紹介します。 XHTMLとは XHTMLの基HTMLとの互換性について 従来のHTMLをXHTMLに変換するための若干のヒント XHTMLとは 2000年1月26日にW3Cの勧告となったXHTML(Extensible HyperText Markup Language)[XHTML10]は、素朴な文書構造記述言語として発展してきた(あるいは混乱してきた)HTMLに、XML[XML1]の持つ柔軟性、拡張性を取り入れたものです。H

  • Dublin Core(ダブリン・コア): ウェブ資源メタデータの共通語彙

    メタデータをコンピュータが理解して有益な情報とするには、その意味が共通の認識となっている語彙が必要です。Dublin Coreは、ウェブや文書の作者、タイトル、作成日といった書誌的な情報をメタデータとして記述するためのボキャブラリを定めています。15の基要素と、そのRDFによる表現方法、またより精度の高い情報を提供するための拡張語彙について説明します。 DCMES:基となる15のプロパティ DCMIメタデータ語彙 拡張プロパティ 符号化スキーム タイプ要素 ウェブ文書でのDublin Coreプロパティの利用 RDFでDublin Coreを使う RDFでDC拡張語彙を用いる 外部RDFメタデータをHTML文書にリンクする XHTMLにDCメタデータを直接記述する 参照文献 DCMES:基となる15のプロパティ DCMI (Dublin Core Metadata Initiativ

  • ちょっとしたメモ - JSONではじめるRDF/Turtle

    JSONのデータ記法は、RDF/Turtleで主語を明記しない(空白ノードである)トリプルの書き方によく似ている。多くの人やサービスがデータをJSONの形で提供してくれれば、これをTurtleに変換してRDFとして扱うこともできるだろうし、JSONに馴染んだ人なら、案外Turtleを(そしてRDFを)抵抗なく受け入れられるのではなかろうか、などと考えたりしていた。 Turtleは、RDFのグラフを、XML構文ではなくて、主語、目的語、述語をシンプルに列挙する形で記述する。たとえば、ある学生の学籍番号をURIに仕立てて主語を名前付けし、その名前を目的語/述語で表すRDFトリプルがあるとしよう。 グラフのXML構文は次のようになる(http://example.org/ns/はデフォルト名前空間として宣言されているとする)。 [例1] <rdf:Description rdf:about="h

  • ちょっとしたメモ - SPARQL: セマンティック・ウェブとWeb 2.0が出会うところ

    RDBMSとRDFをマップすれば、両者の特徴を生かした「セマンティック・ウェブ的な応用」への道が開ける。しかし、RDFの背後にあるデータベースには、外部から直接SQLで問い合わせを行うことができない。ここをカバーするのがRDFのクエリ言語であるSPARQLだ。これは、"Web 2.0アプリケーション"にとってもキーになる可能性がある。少し古い記事だが、Kendall ClarkによるSPARQL: Web 2.0 Meet the Semantic Web を取り上げてみよう。 これは、SPARQLプロトコルの3回目の草案が出たことを受けて、2005年9月16日に書かれたO'Reilly Developer Weblogsの記事。10月の「Web 2.0 Conference 2005」を前に、"Web 2.0"への関心が一般にも高まっていたタイミングで、かなり注目されたものだ。冒頭で、セ

    nak2k
    nak2k 2006/01/10
    Web全体が一つのRDBになって色々なサイトをJOINしまくる感じ。
  • ちょっとしたメモ - コメントにするならXMLでなくてもいいのでは

    C.C.ライセンスやウェブログページでは、RDFのメタデータをコメント内に埋め込むという手法がしばしば用いられるわけだが、それなら冗長なXML構文ではなく、Turtleなどを使った方が簡単じゃないかな。ちょうど、はてなのAccount Auto-Discoveryの件もあることだし、少し考えてみよう。 Account Auto-Discoveryの7月28日付の仕様では、次のようなRDF/XMLをコメントとして埋め込む例が示されている。 (例) <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <rdf:Description rdf:abou

  • ちょっとしたメモ - 人間のURIとウェブのアーキテクチャ

    昨夜のメモで「人物のURIを記述するなら、ホームページなどのネットワーク上に実際に存在するリソースのURIではなく、何か別のURIを用いる必要がある」と書いたのは、RDFだからどうだということではなく、ウェブのアーキテクチャの基的な問題だ。RDFやセマンティック・ウェブを意識しなければ別にいいでしょ、というものではないので、ここはよく理解しておきたい。 (1) Dublin Coreのcreatorは作者 (An entity primarily responsible for making the content of the resource)を示すものである;(2) link要素は、ウェブ文書がhref属性値URIが示すリソースに対して、rel属性値が示すタイプ(関係)のリンクを持つことを表す;この2つの帰結として、link rel="dc.creator"と書いたら、hrefの値