タグ

ブックマーク / www.kanzaki.com (15)

  • セマンティックHTML? KISS!

    Keep It Simple, Stupid ウェブの文書とデータ 人間が読むためのウェブ文書にはさまざまな情報が詰まっている コンピュータ(エージェント/処理ソフト)はHTMLから文書構造の大枠を把握して提示できるが、内容(データの意味)は基的に関知しない コンピュータ処理用のデータは別途用意する? 両方まとめて、シンプルにしよう! HTML文書中のデータをコンピュータ処理も可能にする HTMLのシンプルさを生かすことが大切 しかしコンピュータにとっても明快でシンプルであること だからセマンティックHTML ウェブリソースの型と関係 ウェブ文書中のデータを明示するためには 文脈によらない識別(名前付け):何が同じで何が異なるかを明確にする データはどんなタイプ(型)か:文書について? あるいは文中の映画について? データどうしの関係:この日付は映画の封切り日? 映画を観た日? ウェブ文

  • 写真/画像とメタデータ -- EXIFを利用したJPEGとRDFの連動 (Image-metadata integration with Exif)

    写真のようなイメージデータは、一般にはXHTMLのimg要素でウェブページに埋め込んで提供されますが、その場合、イメージの関連情報はXHTMLで別途記述されるだけで、画像ファイルが単独で参照されるとうまく伝わりません。両者をもっと有機的に融合させるため、Exifデータを抽出する、JPEGに直接RDFを埋め込むなど、画像とメタデータを結びつける方法を検討します。 Image data is generally provided as a part of an XHTML document. The description of the image, written in XHTML, is not reachable when the image itself is retrieved directly. In order to integrate the image and its des

  • リンクするオープンデータ

    集中から分散・連動へ WWWとハイパーテキスト WWW以前:ひとつの閉じたシステム内でのハイパーリンク WWW:不完全(リンク切れ、低信頼度etc.)だが、膨大な情報のネットワーク セマンティック・ウェブとKR セマンティック・ウェブと知識表現の関係は、WWWとそれ以前のハイパーテキストの関係に似ている 10 years ago hypertext was in the same situation - existing systems didn't scale - existing KR systems don't scale/central architectures - there is only one ontology in these systems (Tim Berners-Lee, WSWS2001 Introduction) 情報サイロと情報のリンク 情報サイロ、あるいは

  • ひろがる、つながるCiNiiのために

    リンクするデータ Linking Open Data つながりあう機械可読データは続々と増えてきている(LOD Cloud) FOAFで記述された人物データ、DBPediaなどの概念マップ、Geonamesなどの固有名etc. リンクするデータとRDF データをRDFで記述する 共通の基モデル(トリプル)による基盤 事前の合意なしで複数のデータソースがつながる サービスごとに異なるAPIに対応する必要がない 推論可能なスキーマを用意する 明示されていない関係が推論できる 簡単なクラス階層、サブプロパティ関係でも効果は大きい CiNii型著者モデルの特徴 著者を実体(foaf:Person)として表現 著者と組織を関連付けられる。そのほかの関連情報へのリンク(外向き)も可能 ⇔著者をラベルで表すだけでは、グラフはつながらない 著者が空白ノード 集約、このノードへのリンク(内向き)ができない

  • W3C勧告プロセスの概要

    W3Cは「ウェブの可能性を最大限に引き出す」ために、技術的、社会的な側面から検討を行ない、その結果を標準情報(Technical Report: TR)として公開します。TRには、段階的な審議を経て勧告に至るものと、ノートとして参考に公開されるものがあります。 W3C勧告までの過程 草案(Working Draft) 最終草案(Last Call Working Draft) 勧告候補(Candidate Recommendation) 勧告案(Proposed Recommendation) W3C勧告(Recommendation) 勧告の修正・変更・解除 W3C Notes / Working Group Notes レファレンス この説明は主として2005年版のProcess Documentに基いています。2014年8月, 2015年9月, 2017年3月に改訂版が公開されており

  • セマンティック・マイクロブログ

    ソーシャルメディアとマイクロブログ SNSとソーシャルメディア SNS:個人のプロフィールや関心事などを(範囲を限定して)公開し社会的ネットワークを構成 ソーシャルメディア:社会ネットワークとコンテンツ・メッセージ共有の組み合わせ Ambient Intimacy(何気なくそこにあるような親しみ)の感覚 データの互換性、共有が課題 マイクロブログ(Microblogging) 限られた字数の最小限の=気軽に書けるコンテンツ ゆるやかで手軽なコミュニケーション Why We Twitterの考察では、日常会話+情報探索/共有 フットワークの軽さとモバイルとの相性 携帯端末からも簡単に読み書きできる → 発信する位置という新たなメタデータ マイクロブログのデータモデル コンテンツのモデル ポストの内容(文) ポストのメタデータ(タグ、返信など) サービスによってさまざまな形態 ポスト文中に

  • ちょっとしたメモ - FavikiとタグとDBpedia

    先日登場した新しいブックマークサービス Faviki は、ユーザがタグを与えるときに、英語Wikipediaに登録された語句を候補として提供することで、語彙のゆれ(同義語の問題)を解消しようという特徴を持つ。さらに、タグとWikipediaの連動により、多義語の問題(Operaは歌劇かブラウザか)をも解決する可能性を示す。UIも工夫されており、タグを巡る困難へのひとつの答えともいえる。 タグの共有 以前「タグとオントロジー」で検討したように、タグを広く共有するためには、同義語、多義語の問題を処理する必要がある。アプローチとしては、 従来のタグシステムを前提として、ユーザが自由に与えたタグから、統計的な手法を利用して共通項を見出していく方法と、 ユーザがタグを与える時点で、そのタグを共有可能なもの(統制されたもの)にする方法 が考えられた。Favikiの場合は、後者の立場で、与えられるタグ

  • ちょっとしたメモ - 小文字のsemantic web

    W3Cの進める「Semantic Web」にはまだリアリティを感じられなくても、自分の文書のマーク付けを工夫して、より正確な情報を提供したいと考えている人は少なくない。RDF/XMLを直に記述するのではなく、従来の(X)HTMLを利用してメタデータの提供を試みようという「小文字のsemantic web」が、静かに広まっている。 Real World Semanticsとも呼ばれるこの「小文字のsemantic web」の代表例としては、<a>要素のrel属性に"friend", "met"といった値を記述することで知人関係を表現するXFNがある。クリエイティブ・コモンズも、最近これと同様に<a>要素のrel属性を利用して、ロゴ画像のリンクにrel="license"というメタデータを埋め込むようになった。先頃登場した日語版ライセンス生成ページを利用すると、次のようなコードができるはずだ

  • ちょっとしたメモ - SPARQL: セマンティック・ウェブとWeb 2.0が出会うところ

    RDBMSとRDFをマップすれば、両者の特徴を生かした「セマンティック・ウェブ的な応用」への道が開ける。しかし、RDFの背後にあるデータベースには、外部から直接SQLで問い合わせを行うことができない。ここをカバーするのがRDFのクエリ言語であるSPARQLだ。これは、"Web 2.0アプリケーション"にとってもキーになる可能性がある。少し古い記事だが、Kendall ClarkによるSPARQL: Web 2.0 Meet the Semantic Web を取り上げてみよう。 これは、SPARQLプロトコルの3回目の草案が出たことを受けて、2005年9月16日に書かれたO'Reilly Developer Weblogsの記事。10月の「Web 2.0 Conference 2005」を前に、"Web 2.0"への関心が一般にも高まっていたタイミングで、かなり注目されたものだ。冒頭で、セ

  • ちょっとしたメモ - SKOSの新草案

    旧SWBPのプロジェクトという位置づけで草案が公開されていたSKOSが、W3Cの標準化トラックに乗って、改めて最初の草案 SKOS Simple Knowledge Organization System Reference が公開された。シソーラスや分類表などの図書館系の知識体系を、できるだけそのままRDFで表現できるようにする語彙+モデルで、個人的なカテゴリや分類方法を体系化するのにも使える。さまざまな領域において、すでに多くのシソーラスや用語集が構築されているわけだが、これらは必ずしもOWLなどでそのままクラス体系として記述できるとは限らない。こうした知識や情報を、無理なく「セマンティック・ウェブ」に組み込むモデルとして、SKOSの果たす役割はかなり大きいのではないかと期待される。 SKOSでは、シソーラスや分類で扱う「術語」を、OWLのクラスではなく、概念リソース(Conceptu

  • ちょっとしたメモ - FlickrのMachine tags

    FlickrMachine tagsを実装したというアナウンスがあり、某界隈で話題になっている。これは、従来のタグの書式を拡張して、medium:paint=oilという具合に「名前空間:プロパティ=値」というトリプルタグ(!)を用いてより詳細なタグ付けをし、API経由で処理できるようにするというものだ。一見「おぉ、これは」という感じだが、実際のところはどうだろうか。 まず、ここで「名前空間」はmedium:と名前空間URI接頭辞のような形式になっているが、実際はプロパティや値と同じくユーザが任意に与えるラベルになる(後述のようにURIと結びつける方法があるとされているが、怪しげ)。dc:とかfoaf:といったよく使われるものは収斂していく可能性は高いものの、「Machine tags」と呼ぶにはちょっと弱い。が、まぁそこは「タグ」の世界だから、いいことにしよう。 少しまともなプロパティ

  • タグとオントロジー

    タグとは何か del.icio.usのWhat are tags?から ブックマークなどを整理したり後で思い出すために、自分で自由に与える1語の説明 タグは階層がなく自由なので、あてがいぶちの分類に無理に合わせる苦労がなく、扱いやすい ほかの人のタグと合わせて、関心事項についての協調型レポジトリを構築できる 統制されない自由なキーワード 手軽に利用でき、新しい現象もすぐタグにできる 既存の統制語彙では新しい動きに対応できない 一方、多数のユーザが与えるキーワードには、同義語、多義語が必然的に含まれる 体系化のないフラットな空間 階層ではなく、キーワードの組み合わせで詳細概念を柔軟に表現 一方、階層を利用したグループ化や関連概念の検索はできない 統計的なグループや関連付けはある程度可能 タグのかたち 対象、ユーザ、キーワードの3大要素 タグは、タグを与える対象、タグを与えるユーザ、タグに用い

  • Dublin Core(ダブリン・コア): ウェブ資源メタデータの共通語彙

    メタデータをコンピュータが理解して有益な情報とするには、その意味が共通の認識となっている語彙が必要です。Dublin Coreは、ウェブや文書の作者、タイトル、作成日といった書誌的な情報をメタデータとして記述するためのボキャブラリを定めています。15の基要素と、そのRDFによる表現方法、またより精度の高い情報を提供するための拡張語彙について説明します。 DCMES:基となる15のプロパティ DCMIメタデータ語彙 拡張プロパティ 符号化スキーム タイプ要素 ウェブ文書でのDublin Coreプロパティの利用 RDFでDublin Coreを使う RDFでDC拡張語彙を用いる 外部RDFメタデータをHTML文書にリンクする XHTMLにDCメタデータを直接記述する 参照文献 DCMES:基となる15のプロパティ DCMI (Dublin Core Metadata Initiativ

  • ウェブ ブラウザ小史 2001

    WWWの誕生から「ブラウザ戦争」に至る流れ(1989年〜2001年)の中で登場した様々なブラウザの足跡を辿ってみます。『Web Designing』誌2001年12月号に寄稿した記事をほぼそのまま再掲載するものです(年表はかなり追加調査しています)。 WorldWideWebの誕生 CERNの外で 多様なブラウザの登場 Mosaicから商用ブラウザへ ブラウザ戦争、そして標準化への道 ブラウザ関連年表 WorldWideWebの誕生 1989年3月、ティム・バーナーズ=リーは Information Management: A Proposalと題するペーパーをCERNの関係者に配布した。ウェブの歴史の第一歩が、静かに踏み出されたのだ。 この提案を目に見える形にするためのハイパーテキスト処理プログラム、すなわち最初のウェブ・ブラウザは、翌1990年のクリスマスまでには完成する。 バーナーズ

  • FOAF -- メタデータによる知人ネットワークの表現

    FOAFはRDF/XMLを使って人々に関する情報(メタデータ)とそのつながりを公開、共有するための半ば実用的、半ば実験(少し遊び)的なプロジェクトです。FOAFを使ってマシンにも扱える自己紹介を記述したり、人や組織、関心領域のネットワーク情報をエージェントに処理させるといった応用が試みられており、RSSとの関連でウェブログなどでも注目され始めています。 FOAFとは FOAFを使った人物情報の記述 知人の記述によるメタデータの連鎖 FOAFの語彙一覧 FOAFと情報の信頼性 FOAFの作成と公開 - まず試してみたい人はこちら 参考文献 ※『RDF/OWL入門』、『セマンティックHTML/XHTML』を上梓しました。 FOAFとは FOAF (Friend of a Friend)とは、その名のとおり友達友達友達…という連鎖をメタデータとして表現することで、ネットワーク上の興味深い属性

  • 1