タグ

ブックマーク / www.kanzaki.com (72)

  • ちょっとしたメモ - セマンティック・マーク付け本ようやく脱稿

    さて、昨年夏から格闘していたセマンティック・マーク付けに関するの原稿をようやく書き上げ、出版社に送りました。仮タイトルは『セマンティックHTML/XHTML』で、毎日コミュニケーションズから5月下旬に刊行予定です。5年ほど前からの企画はありながら、なかなかまとめられずにいたのですが、昨年とあるプロジェクトが没になったのを機に、集中してこのに取り組み、何とか脱稿にこぎつけました。 セマンティック・マーク付けとは、普通のウェブ文書の中に含まれるイベントや人物などの情報を、ソフトウェア・エージェントでも扱えるように明示することで、人間が読むための文書(文書のウェブ)を、同時にコンピュータにも処理できる情報(データのウェブ)にしようという試みです。何度か取り上げたGRDDLやマイクロフォーマットもその一種ですし、最近ではRDFaという仕様がW3C勧告になり、注目を集めています。このは、そう

    tsupo
    tsupo 2009/04/06
    仮タイトルは『セマンティックHTML/XHTML』で、毎日コミュニケーションズから5月下旬に刊行予定 → 神崎さんの新刊予告。楽しみ
  • セマンティック・マイクロブログ

    ソーシャルメディアとマイクロブログ SNSとソーシャルメディア SNS:個人のプロフィールや関心事などを(範囲を限定して)公開し社会的ネットワークを構成 ソーシャルメディア:社会ネットワークとコンテンツ・メッセージ共有の組み合わせ Ambient Intimacy(何気なくそこにあるような親しみ)の感覚 データの互換性、共有が課題 マイクロブログ(Microblogging) 限られた字数の最小限の=気軽に書けるコンテンツ ゆるやかで手軽なコミュニケーション Why We Twitterの考察では、日常会話+情報探索/共有 フットワークの軽さとモバイルとの相性 携帯端末からも簡単に読み書きできる → 発信する位置という新たなメタデータ マイクロブログのデータモデル コンテンツのモデル ポストの内容(文) ポストのメタデータ(タグ、返信など) サービスによってさまざまな形態 ポスト文中に

    tsupo
    tsupo 2008/06/17
    神崎さんのプレゼン資料 / Swap Skills for the Happy Web Weekend
  • ちょっとしたメモ - FavikiとタグとDBpedia

    先日登場した新しいブックマークサービス Faviki は、ユーザがタグを与えるときに、英語Wikipediaに登録された語句を候補として提供することで、語彙のゆれ(同義語の問題)を解消しようという特徴を持つ。さらに、タグとWikipediaの連動により、多義語の問題(Operaは歌劇かブラウザか)をも解決する可能性を示す。UIも工夫されており、タグを巡る困難へのひとつの答えともいえる。 タグの共有 以前「タグとオントロジー」で検討したように、タグを広く共有するためには、同義語、多義語の問題を処理する必要がある。アプローチとしては、 従来のタグシステムを前提として、ユーザが自由に与えたタグから、統計的な手法を利用して共通項を見出していく方法と、 ユーザがタグを与える時点で、そのタグを共有可能なもの(統制されたもの)にする方法 が考えられた。Favikiの場合は、後者の立場で、与えられるタグ

    tsupo
    tsupo 2008/06/10
    ベストとは言い難いが、タグ自身のURIにDBpediaを導入したことは大きな一歩 / 単なるフィードとしては機能するのだが、これではRDFが生きてこない、というよりも誤った情報を提供してしまう → hAtom の rel-bookmark問題と関連
  • ちょっとしたメモ - alt要素?

    alt要素なんて、もちろん今の仕様には存在しないわけだけれど、それらしきものが検討された様子がある…という話を、何かのページの一部に書いたような気がするのだが、消してしまったみたいなので、思い出しながら書き記しておこう。検討の痕跡が残っているのは、XHTMLモジュール化仕様のDTD実装ページだ。 このページのF.2.5. XHTML Qualified NamesのセクションBは、「XHTMLの全要素型の名前空間修飾名を提供するためのパラメータ実体を宣言する」とされている。つまり、このセクションでxxx.qnameという形の定義があれば、xxxはXHTMLの要素型名として用いられる(と想定されている)ことをあらわす。このセクションの最後には、次のような記述がある。 <!-- Provisional XHTML 2.0 Qualified Names ....................

    tsupo
    tsupo 2008/05/22
    DITAのimage要素にはalt「属性」も定義されているが、こちらは非推奨(deprecated)で、代替テキストはalt要素で示すこととされている。おそらく、XHTMLでもこのような使い方が念頭にあったのだろう → alt「要素」の話
  • ちょっとしたメモ - SKOSの新草案

    旧SWBPのプロジェクトという位置づけで草案が公開されていたSKOSが、W3Cの標準化トラックに乗って、改めて最初の草案 SKOS Simple Knowledge Organization System Reference が公開された。シソーラスや分類表などの図書館系の知識体系を、できるだけそのままRDFで表現できるようにする語彙+モデルで、個人的なカテゴリや分類方法を体系化するのにも使える。さまざまな領域において、すでに多くのシソーラスや用語集が構築されているわけだが、これらは必ずしもOWLなどでそのままクラス体系として記述できるとは限らない。こうした知識や情報を、無理なく「セマンティック・ウェブ」に組み込むモデルとして、SKOSの果たす役割はかなり大きいのではないかと期待される。 SKOSでは、シソーラスや分類で扱う「術語」を、OWLのクラスではなく、概念リソース(Conceptu

    tsupo
    tsupo 2008/02/04
    シソーラスや分類表などの図書館系の知識体系を、できるだけそのままRDFで表現できるようにする語彙+モデルで、個人的なカテゴリや分類方法を体系化するのにも使える
  • ちょっとしたメモ - SPARQLがW3C勧告に

    ウェブ上でRDFデータの照会を行うSPARQLが15日付でW3C勧告となった。仕様は、問い合わせ言語SPARQL Query Language for RDF、プロトコルSPARQL Protocol for RDF、クエリ結果のXMLフォーマットSPARQL Query Results XML Formatの3つ。バーナーズ=リーのことばを借りれば、ようやくデータベースとしてのウェブのためのSQLが標準化されたわけで、分散する多様なデータへの一貫したアクセスが可能になる。 SPARQLはすでに多くの言語で実装されていて、JavaのJenaライブラリ、PerlのRDF::Query、PHPのARC、PythonのRDFLib、さらにいろんな言語から使えるRasqal RDF Query Libraryなどが揃っている(サポート具合は差があるので、実装状況調査を参照)。 SPARQLクエリを

    tsupo
    tsupo 2008/01/22
    バーナーズ=リーのことばを借りれば、ようやくデータベースとしてのウェブのためのSQLが標準化されたわけで、分散する多様なデータへの一貫したアクセスが可能になる。
  • ちょっとしたメモ - Dublin Coreの改訂定義

    Dublin Core語彙の定義が、これまで検討されてきた内容を踏まえてかなり改訂され、新DCMI Metadata Termsとして勧告された。定義域、値域は別途Domains and Ranges for DCMI Propertiesという文書にもまとめられ、さらに改訂の概要を説明するRevisions to DCMI Metadata Termsも公開されている。 改訂概要では定義域、値域を「提案している」となっているが、語彙定義に含まれているので、正式なものと考えてよいのだろう。見やすいように「DCプロパティと定義域、値域一覧」としてまとめておく。 今回の改訂では、過去から引きずっていたいろんな経緯を振り切って、できるだけDCMI抽象モデルに忠実になるような整理が行われた。スキーム要素と呼ばれていたものが「語彙符号化スキーム」と「構文符号化スキーム」に分けて定義しなおされたり、プ

    tsupo
    tsupo 2008/01/22
    Dublin Core語彙の定義が、これまで検討されてきた内容を踏まえてかなり改訂され、新DCMI Metadata Termsとして勧告 / 定義域、値域は別途Domains and Ranges for DCMI Propertiesという文書に / Revisions to DCMI Metadata Termsも公開されている
  • ちょっとしたメモ - OWL 1.1草案

    W3Cのメンバー提案という形で新OWL作業部会で検討されてきたOWL 1.1の3仕様(構造仕様および関数型構文、モデル理論セマンティクス、RDFグラフへのマッピング)の最初の草案が1月8日付でW3Cから公開された。OWL 1.0との後方互換性を維持しつつ、それ以降の記述論理分野の進展を取り込み、かつOWL 1.0の実装経験から得られた改良が盛り込まれており、関係者の期待は高い。 エンティティの型と名前 OWL 1.0と1.1の大きな違いは、前者は構文からエンティティの型(クラス、オブジェクトプロパティなど)を特定できなかったのに対し、後者は型を明示する構文を導入したこと。たとえば、OWL 1.0で「P rdfs:range X」と記述しても、Pがオブジェクトプロパティなのかデータ型プロパティなのか、Xがクラスなのかデータ型なのかは分からなかったわけだが、OWL 1.1では「P owl11:

    tsupo
    tsupo 2008/01/22
    OWL 1.1の3仕様(構造仕様および関数型構文、モデル理論セマンティクス、RDFグラフへのマッピング)の最初の草案が1月8日付でW3Cから公開された
  • ちょっとしたメモ - HTML4の10周年

    HTML4の初版がW3C勧告となって今日でちょうど10年。せっかくだから祝辞でも書こうかなと思ったけれど、もはや水か空気のようなものだし、ことさらに述べるほどのことも思い浮かばない。HTML4/XHTML1では不十分だからより良い新しいHTML/XHTML仕様を作ろうという話については、特に反対はしないものの、ミネラルウォーターでなくても水道水で十分なんですって感じ。当面の目的には、浄水器(@profile/GRDDL)という現実解もあるんだし。 HTML4は、ある種W3C的な理想像にかなり真正面から取り組んでいて、10年前にそこから感じた熱い信念は、今見ても古びていないように思う。もちろん人間がその時の環境の中で編纂した仕様だから、完全というわけには行かないが、最近になってようやく注目され始めたa要素の@rel属性とかhead要素の@profile属性のように、なかなか奥深い部分もある。

    tsupo
    tsupo 2007/12/26
    HTML4/XHTML1では不十分だからより良い新しいHTML/XHTML仕様を作ろうという話については、特に反対はしないものの、ミネラルウォーターでなくても水道水で十分なんですって感じ。当面の目的には、浄水器(@profile/GRDDL)という
  • ちょっとしたメモ - SPARQLと近頃の「セマンティック・ウェブ」

    11月12日に、RDFのクエリ言語SPARQL Query Language for RDFとそのプロトコルSPARQL Protocol for RDF、それにXML結果フォーマットSPARQL Query Results XML Formatが揃ってW3C勧告案となった。評価期間は12月10日までとなっており、これまでの流れからして年内にもW3C勧告となりそうだ。 このところ「セマンティック・ウェブ」の界隈では、(RDF)データをリンクさせようというLinked Dataと、データベースなどに集積した(RDF)データをクエリで自由に取り出せる形で提供するSPARQL Endpointがホットになっている。RIFやOWL 1.1のようなフォーマリズム面も、もちろん進められているのだが、そういう「難しい」ことはさておいて、シンプルでもいいからとにかく(RDF)データを使えるようにしようとい

    tsupo
    tsupo 2007/11/19
    いよいよ SPARQL が W3C勧告になる模様
  • ちょっとしたメモ - GRDDLがW3C勧告に

    XHTMLなどからRDFグラフを抽出するGRDDLがW3C勧告となった。最初の草案が昨年10月下旬に出てから1年未満、GRDDL作業部会が設置された昨年6月から数えても15ヶ月と、最近のW3C規格の中では異例のスピードだ。現在のXHTMLとして完全に妥当な文書にRDF互換データを埋め込むことができ、使い方も分かりやすい。普及することを願うばかりだ。 HTML文書内にRDFメタデータを埋め込むという考えは、最初のRDFが1997年に勧告されたときから話題になっており、さまざまなアイデアが出されてきた。当初はXHTMLの中にRDF/XMLをそのまま記述するにはどうするか、いや、やはり妥当性検証ができないから外部RDF/XML文書にリンクすべきだ、といった議論が続いていたが、「どっちみち人間が読むための文書は作るんだから、そこからマシン用のデータを抽出するのがいいよね」という現実的な考えが出てく

    tsupo
    tsupo 2007/09/13
    GRDDLの考え方は、class属性やrel属性を一貫して用いて、その意味をXSLTなどでRDFに変換しようというもの / XHTMLのprofile属性を指定するだけでOK
  • ちょっとしたメモ - W3Cの新HTML作業部会

    昨年10月のバーナーズ=リーのびっくり発言から約4カ月を経て、W3Cに新しいHTML作業部会が設置された。HTML4とXHTML1をベースに、新しい(X)HTML仕様を2010年を目標に策定していく。従来のHTML作業部会はXHTML2作業部会という扱いになる(HTMLとは違う狙いなので、名前を変えることも検討しているそうだ。そりゃ大いに結構)。 Charter(設立趣意書)によれば、この新作業部会は次のものを策定していく。 HTML4を発展させた、ウェブの文書とアプリケーションのセマンティクスを表現する言語 この言語をXMLによって記述(シリアル化)する拡張可能な形態 既存ブラウザの「クラシックHTML」パーサと互換性のある、XMLではない記述形態 この言語のためのDOMインターフェイス フォームその他のUIで用いるための、プログレッシブバー、メニューなどの共通部品 リンクづけられたメデ

    tsupo
    tsupo 2007/03/10
    新HTMLはXMLを用いるかどうかという記述方法(構文)の前に共通のセマンティクスを定義しておき、それを用途に応じてXMLや非XMLでシリアル化するという形 / XHTML/GRDDLという方向性を捨てているわけでもない?
  • RDFとメタデータの相互運用

    (メタ)データ相互運用の課題 データモデルと名前の相互運用 どんなモデル(データ構造、スキーマ)を採用するか プロパティ(関係記述語彙)はどの程度詳細に設計すべきか、独自語彙か汎用語彙か 人物などの典拠、主題などの語彙(ノードの名前)をどうやって共有するか 記述対象をどのように識別するか(リソースの同一性) (※稿では、最初の2つ、モデルとプロパティについて検討します) 相互運用のスコープ データの共有:統合レポジトリの構築や横断検索の実現 データの交換:AのデータをBが取り込みたいとき データ相互運用とRDF/OWL なぜRDF/OWLか 柔軟性:シンプルで柔軟なグラフ構造でさまざまなモデルを表現できる 意味論:グラフの意味論が定義されており、予備知識のないデータも共通の解釈ができる 語彙の連携:語彙間の関係を記述することができ、その関係を利用した基的な推論ができる 識別と統合:UR

    tsupo
    tsupo 2007/03/09
    神崎氏による「第32回ディジタル図書館ワークショップの講演資料」 // クラスの併合とプロパティの分割
  • ちょっとしたメモ - Dublin Core定義域、値域の案

    昨年の6月頃から動きがあったDublin Coreのモデルを再定義するという話の結果、新DCMI抽象モデル案、DCMI名前空間ポリシー改訂案、そしてDCプロパティの定義域、値域案が公開され、3月5日までが公開コメント期間となっている。注目の定義域、値域は、基15要素には採用せず、その代わりこれらと同じプロパティをdcterms:空間にも定義して、こちらに定義域、値域を持たせるという案だ。 プロパティに定義域、値域を持たせれば、主語、述語のクラスを推論できることに加え、プロパティの使い方に関する約束を示すことにもなる。アプリケーションは、dc:creatorの目的語がリテラルなのかリソースノードなのかについて余計な検証をすることなく、安心して処理できるようになるわけだ。仕様案の言葉でいえば次のようになる。 In practice, this means that the domain in

    tsupo
    tsupo 2007/02/07
    [dcterms:created][RDF][DCMI][Internet][computer]従来の「dc:」プロパティには手を付けず、dcterms:createdなどと同じ名前空間に、基本15要素に対応するプロパティを追加して、dcterms:プロパティは全て定義域、値域を定義するという方法
  • ちょっとしたメモ - Tim Brayのurn:tag:スキーム案

    Tim Brayが2月1日の記事「Tag Scheme?」で、URNのNIDとして"tag"を導入し、urn:tag:というスキームで「タグ」を識別するというアイデアを示した。これを受けて、コメント欄などでちょっとした議論が展開されている。もともとはAtomフィードのcategory要素のscheme属性のために使おうというものだったようだが、タグ文字列がそのままURIに対応することになるので、面白いと同時に危うい面も併せ持つURNだ。 コメント欄に出ている意見は、概ね次のような感じ。 わざわざ新しいURNを登録しなくても、http:で同じことができる、あるいはURNでは参照を辿れないからhttp:の方がよい。 タグあるいはカテゴリを一意に示すには、WikipediaのページURIを利用すればよいではないか。 タグをURIで表すとき、geo:lat=...のような「マシン・タグ」との関係を

    tsupo
    tsupo 2007/02/05
    タグ文字列がそのままURIに対応 / Tim BrayはRDF嫌い / Atom用のスキームとして出発 / 文字列のタグのままでもよさそうな
  • ちょっとしたメモ - GRDDLサポートツール2つ

    2月に入ってGRDDLをサポートするツールが2つ立て続けに登場した。一つはRaptor RDF Parser Toolkit(Dave Beckettのアナウンス)、もう一つはJena GRDDL Reader(Jeremy Carrollのアナウンス)。いずれも、XHTMLプロファイルを通したスタイルシートの間接指定ができるようになっているところが大きい。 Raptorは、C#、JavaPerlPHPRubyなどの言語から利用できるRDFパーサの高速ライブラリで、RDF/XML仕様のエディタ自らが作っている定評あるもの。GRDDLは昨年からサポートしていたが、今回スタイルシートの間接指定も処理できるようになった。手元で試してみたら、XML/RDF出力だとxml:baseがうまく出てこないものの、GRDDLの処理はきちんとできている。 JenaはJavaでRDFを処理するための定番ラ

    tsupo
    tsupo 2007/02/03
    Jena GRDDL Reader: 前処理にNekoHTMLを使って整形式でない(X)HTMLを整形式にバランスさせるオプションがあるので、世の中に氾濫しているXHTMLくずれでもGRDDLが利用できるというのもポイント
  • 評判のオントロジーとFOAF

    パネルテーマ:オントロジーの作り方、使い方 語彙を作り、語彙を使ってインスタンスを記述 ウェブにおいては、軽量オントロジーを用いて分散記述するのが主流 分散しているデータをどう結びつけるかというモデル(語彙設計)が重要 ユーザの評価とmicroformats microformats:コミュニティの合意による半構造化 ウェブログなどに記述する内容を、XHTMLのclass属性を使って半構造化する 名前空間を用いず、コミュニティ内の合意によって語彙を区別 Wikiを用いた合議スタイルによる仕様構築 利用が比較的簡単で、ウェブログ用のプラグインなどツールも多数 ユーザの評価を半構造化するhReview hReview - microformats (2005年5月ごろ0.1登場、2007年1月時点でバージョン0.3) TechnoratiのReview Searchなどで利用 XHTMLのcl

    tsupo
    tsupo 2007/01/26
    このプレゼンが行なわれたイベントの参加レポートを書きました。 http://watcher.moe-nifty.com/memo/2007/01/web2007_5cd5.html
  • タグとオントロジー

    タグとは何か del.icio.usのWhat are tags?から ブックマークなどを整理したり後で思い出すために、自分で自由に与える1語の説明 タグは階層がなく自由なので、あてがいぶちの分類に無理に合わせる苦労がなく、扱いやすい ほかの人のタグと合わせて、関心事項についての協調型レポジトリを構築できる 統制されない自由なキーワード 手軽に利用でき、新しい現象もすぐタグにできる 既存の統制語彙では新しい動きに対応できない 一方、多数のユーザが与えるキーワードには、同義語、多義語が必然的に含まれる 体系化のないフラットな空間 階層ではなく、キーワードの組み合わせで詳細概念を柔軟に表現 一方、階層を利用したグループ化や関連概念の検索はできない 統計的なグループや関連付けはある程度可能 タグのかたち 対象、ユーザ、キーワードの3大要素 タグは、タグを与える対象、タグを与えるユーザ、タグに用い

    tsupo
    tsupo 2007/01/18
    立命館大学びわこ・くさつキャンパス学術公開講演会の講演資料
  • ちょっとしたメモ - RDF Validator多国語対応が改善

    W3CのRDF Validatorによる多国語の図形描画が、ようやくうまく行くようになった模様。Olivier Thereauxのメールによれば、We have managed to make the graphing tool use a font covering a very hight number of scripts. ということで、実際、要素内容だけでなく要素型名に日語を用いたRDFもうまく図形表示できている。2年以上かかってしまったわけだが、これでまともにValidatorが使えるようになった。 依然として、パースと検証はできるものの描画エラーになるケースもある。いくつかチェックしていて、リテラルに二重引用符(")が含まれるとうまく行かないことが判明した。 マッチする二重引用符の中身はグラフには描画されない マッチしない二重引用符があると描画エラーになる 二重引用符内に記

    tsupo
    tsupo 2006/11/26
    要素内容だけでなく要素型名に日本語を用いたRDFもうまく図形表示できている。2年以上かかってしまったわけだが、これでまともにValidatorが使えるようになった → 試しに使ってみよう
  • Web 2.0からセマンティック・ウェブへ

    “Web 2.0”の主張 Tim O'Reillyによれば プラットフォームとしてのウェブ(The Web As Platform) 集合知の利用(Harnessing Collective Intelligence) データが重要(Data is the Next Intel Inside) 商品としてのソフトからサービスとしてのソフトへ(End of the Software Release Cycle) ハッキングと連動が容易な軽量プログラミング(Lightweight Programming Models) PCに限定されない利用(Software Above the Level of a Single Device) Ajaxに代表されるリッチなUI(Rich User Experiences) (What Is Web 2.0 Design Patterns and Busin

    tsupo
    tsupo 2006/11/22
    タグの表記の揺れをどうするか、など、課題は多い