Guroのブックマーク - はてなブックマーク

Japan Search利活用スキーマの設計と応用

分析と概念モデル：FY2017 多様なソースを集約するメタデータ語彙とは博物館、公文書館、人文学、標本、放送番組など20近くのデータを分析 DC-NDLを拡張する？→図書館リソースと同じ精度で他領域まで拡張するのは困難各分野の既存語彙を集める？→対応範囲が広すぎ複雑。つまみ食いで中途半端になりそうまず語彙を特定しない概念モデルからサンプルデータを分析し、記述に必要な要素を整理記述語彙を特定せず、まず要素を表現するためのモデルを考える提供しやすい×利用しやすい提供者に負担をかけない＝事前マッピングなどを求めない元データや現物へのアクセスを導く＝提供者、利用者双方にメリットマッピング開発からベータ版公開：FY2018 語彙を含めたスキーマの策定複数語彙を候補に、概念モデルを記述できるかどうか検討できれば語彙は少数に（膨大な名前空間宣言は不便） Schema.org＋独自語

Guro 2019/07/28

リンク

利活用スキーマの利活用

利活用スキーマの基本モデル使いやすさと詳細さの両立「いつ」「どこ」「なに」「だれ」に絞った正規化 schema.org語彙によるシンプル検索独自語彙による役割区分と元データ保存アクセス情報とソース情報記述対象へのアクセス情報を集約提供データ（つなぎ役）に関する情報「いつ」でつなぐ時間表記の正規化と実体化「元徳三年銘」→ time:1331（文字列ではなく時間実体）時代や曖昧表記を時間範囲として実体化時間実体を利用して、異なる記述のアイテムを検索。例：鎌倉時代の絵画「鎌倉時代」だけでなく、その時代範囲の西暦、和暦記述も検索できる。 SELECT ?s ?start ?end WHERE { {time:鎌倉時代 jps:start ?st ; jps:end ?et} ?s a type:絵画 ; schema:temporal [jps:start ?start;

Guro 2019/07/18

リンク

データ利活用のためのジャパンサーチモデル

利活用しやすいデータを考える見つかるデータ分かりやすい項目：領域を問わず適用でき、特別な知識なしに理解できる項目（キー）一貫した名前：同じものは同じ名前（値）。典拠による識別、もしくは典拠へのリンク無理のない記述：利用者のメンタルモデルに反しないシンプルな構造、膨張しない名前空間活かせるデータ訴求効果がある：表示用画像、地図、年表などで視覚化しやすい項目探索と集約ができる：横断検索、キーワードや分類、正規化値など集約の手掛かり付加価値を生む：データの分析、組み合せや予想外の発見、第三者による情報追加辿れるデータアクセス：より深い情報や現物につながる。その権利もわかるソースと来歴：データのもとになった情報や作成者、更新時リンクするデータ：URIを辿れる、外部情報とつながる、誰もが同様に言及できるジャパンサーチ利活用スキーマ共通記述情報とソース情報の分離見つけやす

Guro 2019/05/27

あとで読む

リンク

IIIFマニフェストの賞味法

間接記述としての注釈直接プロパティでの記述作品の解説→いつ誰が述べた解説か（メタプロパティ）を記述できない間接的な記述によるメタプロパティ関係をノード化し、主語を対象、目的語を内容とすることで、他のプロパティを追加できる複数の記述を併合しても区別できる＝ウェブでの協業に不可欠関係ノードを「注釈」と捉えることで間接記述モデルを汎用化できる注釈モデルの標準化 WWWと注釈 2000年秋にW3CでAnnotea Projectがスタート 2009年には英米豪の大学や図書館を中心にOpen Annotation Web Annotation標準化 2017年にWeb Annotation Data Modelや語彙がW3C勧告に注釈対象をtarget、内容をbodyとする間接記述モデル写本デジタル化の問題意識各大学や図書館の写本資料はそれぞれがサイロ（相互運用性がない）アプ

Guro 2019/04/16

リンク

ジャパンサーチ“利活用スキーマ”の活用

使いやすさと詳細な情報の両立使いやすさ：発見タスクを容易にするいつ、どこ、だれ、なにをschema.org語彙で直接記述＝正規化値名前の正規化と主要LODとのリンク SPARQLを知らなくても利用できるEasySPARQL 詳細なエンドポイント説明と（非公式）サポートページ詳細な情報：識別、選択タスクを確実にする schema.orgによる記述に独自語彙での構造化記述を併置＝正規化＋元データの値アクセス情報によるコンテンツへのアクセス（取得タスク）ソース情報による来歴の確認（つなぎ役へのリンク）利活用スキーマメタデータ提供の流れ各提供機関（→つなぎ役）連携フォーマット（共通ラベル付与）→ジャパンサーチの通常検索共通の正規化辞書＋データセットごとのマッピング定義利活用スキーマのRDFデータ（API提供可のデータのみ）いつ：時間情報の正規化とEasySPARQL 多様な

Guro 2019/03/27

あとで読む

リンク

Japan Search 非公式サポートページ

ジャパンサーチ非公式サポートページ for 利活用スキーマJapan Search unofficial support page ジャパンサーチの（主として利活用スキーマの）応用や活用に関する情報を順次掲載していきます。This is a personal introduction to Japan Search (JPS), the national integrated cross-sectoral metadata portal. ジャパンサーチ（のRDF）を使うUsing Japan Search RDF はじめてのジャパンサーチ利活用スキーマ (2019) SPARQLで使うジャパンサーチ利活用スキーマ (2020) ジャパンサーチ利活用スキーマとSPARQL (2023) ジャパンサーチSPARQLクエリ集いろいろな利用のための材料やヒントSome resources t

Guro 2019/02/27

リンク

IIIFマニフェストの調理法

基本はカンバス注釈としてのカンバスカンバスの拡張マニフェストの役割カンバスの並べ方 (1) カンバスの並べ方 (2) カンバスの並べ方 (3) マニフェスト設計のヒント 8分のLTのために作った短いスライドです。簡単な導入はIIIF：活用したい機能、拡張の可能性（LT）、応用などはIIIFマニフェストの調理法も参照してください。基本はカンバス共有カンバス（Shared Canvas）カンバス上に画像などを「描く」（motivation:painting）縦横のサイズ（width、height）＝アスペクト比を持つアスペクト比は画像の縦横比と一致させる → 不正確だと不具合の元多くは1カンバスに1枚の画像だが、複数画像でもカンバスの一部にでもテキスト注釈はotherContentとして外部から与える（v2の場合）注釈としてのカンバス Web Annotationモデル

Guro 2017/11/13

IIIF

リンク

日本十進分類とリンクするデータ

他の情報と組み合わせるときは個々に明示が必要属性（著者）と値（小田島雄志）だけでは、他の情報と組み合わせた時に混乱する対象を加えた3つの要素による情報記述対象＝主語、属性（関係）＝述語、値＝目的語のトリプルを用いて記述主語と目的語で表されるものをノード（節点）とし、述語（関係）のアークで結んだグラフとして表現できるグラフは共通のノードを繋いで広げていくことができる＝複雑な情報を表現できる複雑な情報も単純なトリプルに分解して扱うことができるグローバルなつながりグローバルな識別子単語だけでは表記の揺れや同名があり、情報の同定、区別が難しい「小田島雄志」と「小田島，雄志」、いろいろな「ロミオとジュリエット」など主語、述語、目的語をURIで表して曖昧さを取り除くコンピュータで直接処理できるデータ（文字列）はURIで指し示すことなくそのまま（リテラル）で扱う URIによる識別

Guro 2016/08/18

リンク

日本十進分類とリンクするデータ

他の情報と組み合わせるときは個々に明示が必要属性（著者）と値（小田島雄志）だけでは、他の情報と組み合わせた時に混乱する対象を加えた3つの要素による情報記述対象＝主語、属性（関係）＝述語、値＝目的語のトリプルを用いて記述主語と目的語で表されるものをノード（節点）とし、述語（関係）のアークで結んだグラフとして表現できるグラフは共通のノードを繋いで広げていくことができる＝複雑な情報を表現できる複雑な情報も単純なトリプルに分解して扱うことができるグローバルなつながりグローバルな識別子単語だけでは表記の揺れや同名があり、情報の同定、区別が難しい「小田島雄志」と「小田島，雄志」、いろいろな「ロミオとジュリエット」など主語、述語、目的語をURIで表して曖昧さを取り除くコンピュータで直接処理できるデータ（文字列）はURIで指し示すことなくそのまま（リテラル）で扱う URIによる識別

Guro 2016/07/06

リンク

NDC-LD中間報告版

日本十進分類法（NDC）の今後の活用方法を検討するため、日本図書館協会と国立国会図書館は、2015年4月から2016年3月末までの予定で、共同でNDCのLinked Data化の共同研究を行っています。ユーザーからのフィードバックを得ることを目的に行った「NDC-LD中間報告版」の試験公開（2015年9月5～13日）は終了しました。ご協力ありがとうございました。今後とも共同研究終了後におけるNDC-LDの試行的提供を想定しつつ、本研究を継続します。 JLA：日本十進分類法のLinked Data形式化に係る国立国会図書館との共同研究について NDL：日本十進分類法のLinked Data形式化に係る日本図書館協会との共同研究 2015年9月14日 NDC-LD共同研究作業グループ 2016-07-05追記：情報管理2016年7月号に研究報告日本十進分類法のLinked Data化：セ

Guro 2015/09/07

NDC
RDF

リンク

図書館目録からLinked Dataへ

データモデリングと実体属性―値対としてのデータ記述フラットな表によるデータの記述実体の関係としてのデータモデル独立した存在として情報を付与できるものを実体（entity）と捉える。実体は属性（attribute）を持つことができる。データを実体間の関連（relation）として捉える（ERモデル）書誌における実体書誌データにおいて実体として捉えられるもの著者、訳者、出版者、出版地などは実体と考えられる本そのものも実体だけれど、書誌データのどこに？分類などは実体？典拠における実体典拠概念と実在する実体標目やノート、ソースなどから構成される典拠概念（実体）標目によって示されている実在物（人物、場所、時代…）標目ID00444960が表す実体は… FRBRの実体関係分析タスクと実体の分析 FRBRでは4タスク（発見、識別、選択、取得）を念頭に実体分析：情報利用者

Guro 2015/02/02

目録
RDA

リンク

MLAとリンクするデータ各国図書館の書誌・典拠グラフを中心に

リンクするデータと書誌・典拠リンクするデータ4原則ものごとをURIで名前付けするこれらの名前を調べて訪ねる（参照解決する）ことができるように、httpスキームのURIを使う名前付けしたURIがたどられたら、有用な情報を返すほかのURIへのリンクを加えて、より多くのものごとを見出せるようにする各国図書館での原則1、2：ユリシーズの場合国立国会図書館…http://iss.ndl.go.jp/books/R100000002-I000002510361-00 ドイツ国立図書館…http://d-nb.info/979821517 英国図書館…http://bnb.data.bl.uk/id/resource/015487226 フランス国立図書館…http://data.bnf.fr/ark:/12148/cb40939669f WorldCat…http://www.world

Guro 2014/11/14

リンク

Web NDL Authoritiesの設計

Web NDLAとは Web NDLSH 国立国会図書館件名標目（NDLSH）をRDF化（2010）作品の主題（キーワード）を表現するための統制語彙基盤データベースから出力したMARCテキストデータを元にRDFに変換国立国会図書館が件名標目データをテキストで公開→RDF版を試作（2006）約10万件の標目を約130万トリプルのRDFで表現 Web NDLA Web NDLSHに人名、団体名、地名、統一タイトルなどの名称典拠（NDLNA）を追加してWeb NDLAに（2011） MarcXMLとして出力されたデータをRDF化約110万件の典拠、標目を約1500万トリプルのRDFで表現既存データからのRDF生成データの解析レコードが記述している対象（実体）の把握レコードの属性と実体の対応付け RDFモデルの設計 URIの設計各実体を記述するモデルデータセット内外のリンク関

Guro 2012/01/18

NDL

リンク

ちょっとしたメモ - 地理コードのURI

OASISから国コード、言語コードを識別するためのPSI = Public Subject Indicator（公開主題指示子）の案が1月6日付で公開されている。PSIはトピックマップ（Topic Maps）で共有可能な主題（トピック）を示すための仕組みだが、識別子としてURIを用いているため、そのままRDFでも利用できる。たとえば言語コードに、一般的なjaというリテラルを用いる代わりに、http://psi.oasis-open.org/iso/639/#jpn と表現しようというわけだ。 OASISの提案する国コードPSIはISO 3166、言語コードPSIはISO 639をベースにしているのだが、よく使われる2文字コードではなく、国の場合は3桁数値コード、言語の場合は3文字コードを採用している。だから、日本国のPSIは http://psi.oasis-open.org/iso/31

Guro 2011/06/26

地図

リンク

ウェブ化するNDLSH

NDLSHをRDF/SKOSで記述すると NDLの書誌をRDFで記述し、関連付けられる dc:subjectの目的語を、文字列キーワードではなくURIとして、グラフを併合できる RDFで表現したNDLSHにはSKOSのskos:broader, skos:relatedなどが含まれるので、関連書籍に結びつくしかしこれらは、従来のOPACでもできていたことでは？件名標目表をウェブ化できる NDLSHの件名がURIを持つことによって、外部からも主題記述に利用できる主題件名がウェブ上でリンク可能な名前になる＝ウェブ化する日本語による「リンクするデータ」のハブとなりうるウェブ文書のタグ/主題としてのNDLSH マイクロフォーマットによるタグ記述リンクのrel属性値を"tag"としてタグ表すrel-tagマイクロフォーマット URIパス構成部の最後（/の後）をタグとみなす（ローカル名がI

Guro 2010/03/11

リンク

ちょっとしたメモ - SKOSの新草案

旧SWBPのプロジェクトという位置づけで草案が公開されていたSKOSが、W3Cの標準化トラックに乗って、改めて最初の草案 SKOS Simple Knowledge Organization System Reference が公開された。シソーラスや分類表などの図書館系の知識体系を、できるだけそのままRDFで表現できるようにする語彙＋モデルで、個人的なカテゴリや分類方法を体系化するのにも使える。さまざまな領域において、すでに多くのシソーラスや用語集が構築されているわけだが、これらは必ずしもOWLなどでそのままクラス体系として記述できるとは限らない。こうした知識や情報を、無理なく「セマンティック・ウェブ」に組み込むモデルとして、SKOSの果たす役割はかなり大きいのではないかと期待される。 SKOSでは、シソーラスや分類で扱う「術語」を、OWLのクラスではなく、概念リソース（Conceptu

Guro 2009/08/20

リンク

はてなブックマーク

タグ

ブックマーク / www.kanzaki.com (16)

お知らせ

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス