タグ

semanticWebとkanzaki.comに関するks0222のブックマーク (14)

  • 日本語ウェブ・オントロジーの試み

    セマンティック・ウェブでエージェントによるデータ活用を実現するには、豊富な語彙をカバーするオントロジーが不可欠です。英語のオントロジーとして提供されているWordNetに、和英辞書を使って日語を結びつければ、とりあえずエージェントに理解可能な語彙にはなります。URIに日語を使うことに関する問題はありますが、ひとつの試みとして検討してみます。 日語メタデータとオントロジー 和英辞書EDICTからWordNetへ 複数の訳語がある場合 直接の訳がない漢字熟語の場合 否定の接頭辞を持つ熟語 日語の同義語 対応するWordNet定義が見つからない場合 WordNet対応日語ウェブ・オントロジーの試験 日語とURI/IRI 参照文献 ※実験的な報告なので、今後内容をかなり書き換える可能性があります。 日語メタデータとオントロジー セマンティック・ウェブで誰もがメタデータを提供できるよう

  • An experimental ISBN resolver

    A URI "http://purl.org/net/ns/isbn/any_ISBN" identifies a book itself. By dereferencing that URI, you'll be redirected to data URI where you'll get an RDF description of the book, with XLST visual rendaring. See examples: http://purl.org/net/ns/isbn/9784839931957 http://purl.org/net/ns/isbn/9784627829312 http://purl.org/net/ns/isbn/9780062515865 http://purl.org/net/ns/isbn/9780123735560 or try to

    ks0222
    ks0222 2010/02/17
    ISBNによるパーマリンクの実験。
  • セマンティック・ウェブとコミュニティの連携

    コミュニティ連携の課題 コミュニティごとにデータ記述の語彙が異なる データ識別のID体系が異なるので、同じデータを同定できない 同じ属性を「著者」「作者」「責任表示」などさまざまな"単語"で表現 汎用語彙は帯に短し襷に長し データ共有には共通の語彙が必要なことはわかるが... 様々なコミュニティの持つ語彙を取り込むと、語彙が複雑になりすぎる 単純化した語彙では、コミュニティが必要とする要件を満たさない データ公開と交換の方法が煩雑 特定の相手向けではなく、一般にデータを公開する標準的方法がない 異なった形式で記述されたデータを、自分のデータベースに取り込むためには、それぞれの形式ごとに変換フィルタが必要 未知のデータの場合は試行錯誤するしかない セマンティック・ウェブの技術を用いて グローバルな識別子により、データ統合を容易にする URIでデータをグローバルに識別し、分散記述されたものも確

  • DCプロパティと定義域、値域一覧

    Dublin Coreのプロパティは、長い議論の末、dc:名前空間(http://purl.org/dc/elements/1.1/)は互換性維持のため定義域、値域を与えず、dcterms:名前空間(http://purl.org/dc/terms/)のプロパティに定義域、値域を与えるようになりました(2008年1月の改訂)。さらに定義域、値域の大半はRDFスキーマではなく新たに定義したdcam:domainIncludes、dcam:rangeIncludesに変更されました(2020年1月の改定)。以下に、dcterms:のプロパティを一覧にして示します。 プロパティは上位プロパティごとにグループ化(tbody)しています。また、dc:空間と同じ名前で再定義されたプロパティは強調して表示しています。またIncludesではない定義域、値域は(rdfs:domain|range)と付記し

  • ちょっとしたメモ - Dublin Coreの改訂定義

    Dublin Core語彙の定義が、これまで検討されてきた内容を踏まえてかなり改訂され、新DCMI Metadata Termsとして勧告された。定義域、値域は別途Domains and Ranges for DCMI Propertiesという文書にもまとめられ、さらに改訂の概要を説明するRevisions to DCMI Metadata Termsも公開されている。 改訂概要では定義域、値域を「提案している」となっているが、語彙定義に含まれているので、正式なものと考えてよいのだろう。見やすいように「DCプロパティと定義域、値域一覧」としてまとめておく。 今回の改訂では、過去から引きずっていたいろんな経緯を振り切って、できるだけDCMI抽象モデルに忠実になるような整理が行われた。スキーム要素と呼ばれていたものが「語彙符号化スキーム」と「構文符号化スキーム」に分けて定義しなおされたり、プ

  • ちょっとしたメモ - DCの定義域と値域その後

    DCの定義域と値域について、7月2日に改訂案が公開され、7月末まで改めてコメントを受け付けている。問題の日付関連プロパティの値域は全てリテラルに改められており、一安心。コメント期間後、案がUsage Boardに提出されて最終決定となるようだ。 date、created、modifiedなどの値域がrdfs:Literalとなったのは、妥当なところだろう。日付を記述するのに (例) <dcterms:created> <ex:Period> <rdf:value>1995-12-15</rdf:value> </ex:Period> </dcterms:created>

  • ちょっとしたメモ - Dublin Core定義域、値域の案

    昨年の6月頃から動きがあったDublin Coreのモデルを再定義するという話の結果、新DCMI抽象モデル案、DCMI名前空間ポリシー改訂案、そしてDCプロパティの定義域、値域案が公開され、3月5日までが公開コメント期間となっている。注目の定義域、値域は、基15要素には採用せず、その代わりこれらと同じプロパティをdcterms:空間にも定義して、こちらに定義域、値域を持たせるという案だ。 プロパティに定義域、値域を持たせれば、主語、述語のクラスを推論できることに加え、プロパティの使い方に関する約束を示すことにもなる。アプリケーションは、dc:creatorの目的語がリテラルなのかリソースノードなのかについて余計な検証をすることなく、安心して処理できるようになるわけだ。仕様案の言葉でいえば次のようになる。 In practice, this means that the domain in

  • RDF -- リソース表現のフレームワーク

    ウェブの目標である「マシンに理解可能な情報」の表現のためには、メタデータなどのリソース相互の関係を、特定のアプリケーションに依存しない形で叙述的に示す共通の方法が必要です。RDFは、主語(リソース)と述語(プロパティ)、そしてその目的語(オブジェクト:プロパティの値)の三者関係によって、関係の連鎖を辿ることができるようなデータモデルを記述します。 マシンに理解可能な情報の記述 RDFの基データモデルとXML構文 シンプルなRDFモデルとグラフ 基データモデルを表現するXML構文 コンテナモデル 具体化:文についての文 とりあえずのまとめ 稿で取り上げなかったこと 参照文献 ※体系的な解説『RDF/OWL入門』を上梓しました。 マシンに理解可能な情報の記述 バーナーズ・リーが描いていたウェブの目標は、「コンピュータで読みとれる形の情報の空間が、人々の思考、やり取り、仕事のパターンの状態

  • RDFとメタデータの相互運用

    (メタ)データ相互運用の課題 データモデルと名前の相互運用 どんなモデル(データ構造、スキーマ)を採用するか プロパティ(関係記述語彙)はどの程度詳細に設計すべきか、独自語彙か汎用語彙か 人物などの典拠、主題などの語彙(ノードの名前)をどうやって共有するか 記述対象をどのように識別するか(リソースの同一性) (※稿では、最初の2つ、モデルとプロパティについて検討します) 相互運用のスコープ データの共有:統合レポジトリの構築や横断検索の実現 データの交換:AのデータをBが取り込みたいとき データ相互運用とRDF/OWL なぜRDF/OWLか 柔軟性:シンプルで柔軟なグラフ構造でさまざまなモデルを表現できる 意味論:グラフの意味論が定義されており、予備知識のないデータも共通の解釈ができる 語彙の連携:語彙間の関係を記述することができ、その関係を利用した基的な推論ができる 識別と統合:UR

  • 連携するデータ、リンクするデータ

    データのウェブ 人間向けコンテンツ中心の文書のウェブ HTMLによるコンテンツの記述 半構造化データ(単純な文書構造の表現) 厳密さよりも柔軟性(エラーは許容する) エージェント処理を前提にしたデータのウェブ RDFによる共通のデータ表現 グラフによる柔軟なモデル 整形式XMLなど、構文は厳密に 両者を結ぶリンク (X)HTMLへのRDFの埋め込み/(X)HTMLからのRDFの抽出 いずれのウェブも、リンクによって情報の価値が増す グローバル規模のネットワーク効果 RDFのトリプルとグラフ 処理しやすいシンプルなトリプル RDF: リソースの関係を主語、述語、目的語のトリプルで記述する どんなデータでもこの3つの要素だけ考えればよいので処理がシンプル 複雑なデータを記述できる柔軟なグラフ グラフ=トリプルの集合は複雑なモデルも表現できる 複雑なモデルも単純なトリプルに還元できる 名前と識別

  • リンクする書誌データ

    巨大なグローバル・グラフ 関心があるものを結びつけるネットワーク インターネット:コンピュータを結びつける巨大なネット 関心があるのはコンピュータどうしのつながりであって、それがどんなケーブルや通信手段を使っているかじゃないんだ ウェブ:文書を結びつける巨大なネット 関心があるのは文書であって、それがどんなコンピュータや端末にあるかじゃないんだ 次は?:ものごとを結びつける巨大なネット 関心があるのは「ものごと」であって、それがどんな文書に書かれているかじゃないんだ 社会グラフとしてのつながり 関心があるのは仕組み(ネットワーク)ではなくものごととそのつながり(グラフ) 人々がどうつながっているか、どんな記事を書いているか、何を読んだり聴いたりしたか… このつながり=グラフ=を、文書のレベルではなく、共有・再利用可能な形で記述するもの:セマンティック・ウェブ バーナーズ=リーの言うGian

  • ひろがる、つながるCiNiiのために

    リンクするデータ Linking Open Data つながりあう機械可読データは続々と増えてきている(LOD Cloud) FOAFで記述された人物データ、DBPediaなどの概念マップ、Geonamesなどの固有名etc. リンクするデータとRDF データをRDFで記述する 共通の基モデル(トリプル)による基盤 事前の合意なしで複数のデータソースがつながる サービスごとに異なるAPIに対応する必要がない 推論可能なスキーマを用意する 明示されていない関係が推論できる 簡単なクラス階層、サブプロパティ関係でも効果は大きい CiNii型著者モデルの特徴 著者を実体(foaf:Person)として表現 著者と組織を関連付けられる。そのほかの関連情報へのリンク(外向き)も可能 ⇔著者をラベルで表すだけでは、グラフはつながらない 著者が空白ノード 集約、このノードへのリンク(内向き)ができない

  • ウェブ化するNDLSH

    NDLSHをRDF/SKOSで記述すると NDLの書誌をRDFで記述し、関連付けられる dc:subjectの目的語を、文字列キーワードではなくURIとして、グラフを併合できる RDFで表現したNDLSHにはSKOSのskos:broader, skos:relatedなどが含まれるので、関連書籍に結びつく しかしこれらは、従来のOPACでもできていたことでは? 件名標目表をウェブ化できる NDLSHの件名がURIを持つことによって、外部からも主題記述に利用できる 主題件名がウェブ上でリンク可能な名前になる=ウェブ化する 日語による「リンクするデータ」のハブとなりうる ウェブ文書のタグ/主題としてのNDLSH マイクロフォーマットによるタグ記述 リンクのrel属性値を"tag"としてタグ表すrel-tagマイクロフォーマット URIパス構成部の最後(/の後)をタグとみなす(ローカル名がI

  • The Web KANZAKI -- Japan, music and computer

    こんにちは。音楽に関するいくつかのメモや、ウェブ上での情報の共有や活用に関する参考情報があります。 The English only TOC page also available. 音楽の話 ロジャー・ノリントンの話 交響曲に関するいくつかの情報 歌詞/テキストと音楽(レクイエム、ミサ曲、第九、大地の歌、ツァラトゥストラなど) NMLで聴いてメモした曲リスト 古いもの ... show 音楽雑記帖 コントラバスの話 インターネットやコンピュータの話 セマンティック・ウェブ (ジャパンサーチ非公式サポート、グラフ視覚化、画像注釈とIIIF、LD Browser) いくつかの講演スライドそして専門誌/論文誌記事など アクセシビリティおよびごく簡単なHTMLの説明 OWL語彙の実験・提案、その他いろんな試みの記録 古いもの ... show ちょっとしたメモ(主に2003~2008) ハイパー

  • 1