タグ

XMLとGRDDLに関するsouskのブックマーク (6)

  • Triplr

    RDF format transformations http://triplr.org/output/source-uri output-format is one of html, json, ntriples, rdf or turtle. source-uri is like example.org/foo/bar # Ntriples from RSS http://triplr.org/ntriples/librdf.org/NEWS.rdf # Turtle from RSS http://triplr.org/turtle/cultofmac.com.feedsportal.com/c/33797/f/606249/index.rss # Turtle from HTML via GRDDL http://triplr.org/turtle/www.kanzaki.com/

    sousk
    sousk 2007/11/08
    a service that generates RDF Triples from URIs
  • Semantic Web Data Integration with hCalendar and GRDDL

  • XHTMLからメタデータを自動抽出する

    セマンティック・ウェブを実現する上で大きな鍵になるのが、どうやってメタデータを余計な負荷なしに提供してもらうかという方法論です。XHTMLで構造的な要素タイプ、class属性、id属性を適切に使用していれば、XSLTでここからメタデータを変換・抽出することが可能です。これを共通オントロジーと結びつければ、わざわざコンテンツと別にメタデータを用意しなくても、通常のコンテンツ制作がそのままセマンティック・ウェブの基礎になってくれるのです。 セマンティック・ウェブの関門:メタデータの収集 XSLTとXHTMLのclass属性を活用する a要素を使ったリソースとしての目的語 メタデータ用XSLTの存在を知らせる より汎用的なアプローチ テーブルデータの変換:th要素の内容を使う テーブルでもclass属性を使ってみる head要素からのメタデータ抽出 XHTMLの拡張によるメタデータ埋め込み メタ

  • ちょっとしたメモ - XHTMLからRDFを抽出するGRDDL

    XHTMLからRDFを抽出するのは、XSLTを使えばかなり柔軟に対応できますが、そのためにはエージェントにXSLTの在処を指示する方法が必要です。これを汎用的に行うために、"rdf-in-xml"という「プロファイル」を使って新たなリンクタイプxslt2rdfを定義し、href属性でスタイルシートを指定しようというのがGRDDLです。 使い方を「XHTMLからメタデータを自動抽出する」の1項目に簡単にまとめました。Dublin CoreをXHTMLに埋め込む方法などを使っていれば、それを抽出するためのサンプルXSLTもW3Cのサイトに用意されています。今のところW3CのXSLTサービスを使ったデモでは、文字コードの問題などがあって日語文書はうまく行かないことがしばしばあるようですが、適当なXSLT処理ツールがあればきちんと抽出ができるはず。メタデータを無理なく記述する方法として、注目して

  • ウェブのデータと検索の可能性

    検索の手順:何をコンピュータに任せられるか どこに情報があるか データベース検索 → DB推薦? 一括検索? 文書検索 → 文書からデータを取り出すには 何をどう検索するか 適切な検索語句 → シソーラスや検索候補 適切な検索式 → フリーキーワード v.s. 多項目検索 結果をどう利用するか 検索結果を見る → より分かりやすいプレゼンテーション 結果を評価・判断する → ページランク、適合度、信頼度評価 継続検索 → 検索式の自動補正、絞込み 次のアクション → 別のサービスへの自動接続、結果からの推論 文書の検索と情報の検索 情報を知るためには 情報が記述されている文書(書籍、ウェブページ)を検索して内容を読む 情報を(あらかじめ整備されたデータベースなどで)直接調べる 文書の中の情報が検索できたら? 人間に代わってコンピュータが文書内から情報を取り出してくれたら? 2006年5月の

  • ちょっとしたメモ - Microformatの先へ

    "Web 2.0"やmicroformatに関心がある人は、昨日xml.comで公開されたUche Ogbujiの記事 Microformats in Context をぜひ読んでおこう。ここでは、microformatの可能性と限界、そしてその次のステップが、XMLの質に照らして鮮明に描かれている。microformatは「インフォーマルな文脈における小さな島(コミュニティ)をうまくまとめる方向に目を向けている」が、それらの小さな島をつなぎ、集約するためには、もう少し先に進む必要がある。 Ucheの論点を大まかに列挙すると、次のようになる: microformatは新しい語彙を作るのではなくて、既存のよく普及したフォーマット(XHTML)を利用して情報を表現しようとするものだが、多くの場合、XHTMLの語彙の意味を拡大解釈し過ぎて、混乱を生む。 複数のmicroformatの間で語彙が

    sousk
    sousk 2006/05/01
    microformat はアプリケーション間で相互流通するデータの定義を行う。 GRDDL により XHTML から RDF 抽出を行う際に microformat を考慮する, 標準的な microformat (as RDF) 抽出手段を提供する, そんなところ?
  • 1