タグ

ブックマーク / www.kanzaki.com (16)

  • Japan Search利活用スキーマの設計と応用

    分析と概念モデル:FY2017 多様なソースを集約するメタデータ語彙とは 博物館、公文書館、人文学、標、放送番組など20近くのデータを分析 DC-NDLを拡張する?→図書館リソースと同じ精度で他領域まで拡張するのは困難 各分野の既存語彙を集める?→対応範囲が広すぎ複雑。つまみいで中途半端になりそう まず語彙を特定しない概念モデルから サンプルデータを分析し、記述に必要な要素を整理 記述語彙を特定せず、まず要素を表現するためのモデルを考える 提供しやすい×利用しやすい 提供者に負担をかけない=事前マッピングなどを求めない 元データや現物へのアクセスを導く=提供者、利用者双方にメリット マッピング開発からベータ版公開:FY2018 語彙を含めたスキーマの策定 複数語彙を候補に、概念モデルを記述できるかどうか検討 できれば語彙は少数に(膨大な名前空間宣言は不便) Schema.org+独自語

    Japan Search利活用スキーマの設計と応用
    Guro
    Guro 2019/07/28
  • 利活用スキーマの利活用

    利活用スキーマの基モデル 使いやすさと詳細さの両立 「いつ」「どこ」「なに」「だれ」に絞った正規化 schema.org語彙によるシンプル検索 独自語彙による役割区分と元データ保存 アクセス情報とソース情報 記述対象へのアクセス情報を集約 提供データ(つなぎ役)に関する情報 「いつ」でつなぐ 時間表記の正規化と実体化 「元徳三年銘」→ time:1331(文字列ではなく時間実体) 時代や曖昧表記を時間範囲として実体化 時間実体を利用して、異なる記述のアイテムを検索。例:鎌倉時代の絵画 「鎌倉時代」だけでなく、その時代範囲の西暦、和暦記述も検索できる。 SELECT ?s ?start ?end WHERE { {time:鎌倉時代 jps:start ?st ; jps:end ?et} ?s a type:絵画 ; schema:temporal [jps:start ?start;

    Guro
    Guro 2019/07/18
  • データ利活用のためのジャパンサーチモデル

    利活用しやすいデータを考える 見つかるデータ 分かりやすい項目:領域を問わず適用でき、特別な知識なしに理解できる項目(キー) 一貫した名前:同じものは同じ名前(値)。典拠による識別、もしくは典拠へのリンク 無理のない記述:利用者のメンタルモデルに反しないシンプルな構造、膨張しない名前空間 活かせるデータ 訴求効果がある:表示用画像、地図、年表などで視覚化しやすい項目 探索と集約ができる:横断検索、キーワードや分類、正規化値など集約の手掛かり 付加価値を生む:データの分析、組み合せや予想外の発見、第三者による情報追加 辿れるデータ アクセス:より深い情報や現物につながる。その権利もわかる ソースと来歴:データのもとになった情報や作成者、更新時 リンクするデータ:URIを辿れる、外部情報とつながる、誰もが同様に言及できる ジャパンサーチ利活用スキーマ 共通記述情報とソース情報の分離 見つけやす

  • IIIFマニフェストの賞味法

    間接記述としての注釈 直接プロパティでの記述 作品の解説→いつ誰が述べた解説か(メタプロパティ)を記述できない 間接的な記述によるメタプロパティ 関係をノード化し、主語を対象、目的語を内容とすることで、他のプロパティを追加できる 複数の記述を併合しても区別できる=ウェブでの協業に不可欠 関係ノードを「注釈」と捉えることで間接記述モデルを汎用化できる 注釈モデルの標準化 WWWと注釈 2000年秋にW3CでAnnotea Projectがスタート 2009年には英米豪の大学や図書館を中心にOpen Annotation Web Annotation標準化 2017年にWeb Annotation Data Modelや語彙がW3C勧告に 注釈対象をtarget、内容をbodyとする間接記述モデル 写デジタル化の問題意識 各大学や図書館の写資料は それぞれがサイロ(相互運用性がない) アプ

    Guro
    Guro 2019/04/16
  • ジャパンサーチ“利活用スキーマ”の活用

    使いやすさと詳細な情報の両立 使いやすさ:発見タスクを容易にする いつ、どこ、だれ、なにをschema.org語彙で直接記述=正規化値 名前の正規化と主要LODとのリンク SPARQLを知らなくても利用できるEasySPARQL 詳細なエンドポイント説明と(非公式)サポートページ 詳細な情報:識別、選択タスクを確実にする schema.orgによる記述に独自語彙での構造化記述を併置=正規化+元データの値 アクセス情報によるコンテンツへのアクセス(取得タスク) ソース情報による来歴の確認(つなぎ役へのリンク) 利活用スキーマメタデータ提供の流れ 各提供機関(→つなぎ役) 連携フォーマット(共通ラベル付与)→ジャパンサーチの通常検索 共通の正規化辞書+データセットごとのマッピング定義 利活用スキーマのRDFデータ(API提供可のデータのみ) いつ:時間情報の正規化とEasySPARQL 多様な

  • Japan Search 非公式サポートページ

    ジャパンサーチ 非公式サポートページ for 利活用スキーマJapan Search unofficial support page ジャパンサーチの(主として利活用スキーマの)応用や活用に関する情報を順次掲載していきます。This is a personal introduction to Japan Search (JPS), the national integrated cross-sectoral metadata portal. ジャパンサーチ(のRDF)を使うUsing Japan Search RDF はじめてのジャパンサーチ利活用スキーマ (2019) SPARQLで使うジャパンサーチ利活用スキーマ (2020) ジャパンサーチ利活用スキーマとSPARQL (2023) ジャパンサーチSPARQLクエリ集 いろいろな利用のための材料やヒントSome resources t

    Japan Search 非公式サポートページ
    Guro
    Guro 2019/02/27
  • IIIFマニフェストの調理法

    はカンバス 注釈としてのカンバス カンバスの拡張 マニフェストの役割 カンバスの並べ方 (1) カンバスの並べ方 (2) カンバスの並べ方 (3) マニフェスト設計のヒント 8分のLTのために作った短いスライドです。簡単な導入はIIIF:活用したい機能、拡張の可能性(LT)、応用などはIIIFマニフェストの調理法も参照してください。 基はカンバス 共有カンバス(Shared Canvas) カンバス上に画像などを「描く」(motivation:painting) 縦横のサイズ(width、height)=アスペクト比を持つ アスペクト比は画像の縦横比と一致させる → 不正確だと不具合の元 多くは1カンバスに1枚の画像だが、複数画像でもカンバスの一部にでも テキスト注釈はotherContentとして外部から与える(v2の場合) 注釈としてのカンバス Web Annotationモデル

    Guro
    Guro 2017/11/13
  • 日本十進分類とリンクするデータ

    他の情報と組み合わせるときは個々に明示が必要 属性(著者)と値(小田島雄志)だけでは、他の情報と組み合わせた時に混乱する 対象を加えた3つの要素による情報記述 対象=主語、属性(関係)=述語、値=目的語のトリプルを用いて記述 主語と目的語で表されるものをノード(節点)とし、述語(関係)のアークで結んだグラフとして表現できる グラフは共通のノードを繋いで広げていくことができる=複雑な情報を表現できる 複雑な情報も単純なトリプルに分解して扱うことができる グローバルなつながり グローバルな識別子 単語だけでは表記の揺れや同名があり、情報の同定、区別が難しい 「小田島雄志」と「小田島,雄志」、いろいろな「ロミオとジュリエット」など 主語、述語、目的語をURIで表して曖昧さを取り除く コンピュータで直接処理できるデータ(文字列)はURIで指し示すことなくそのまま(リテラル)で扱う URIによる識別

  • 日本十進分類とリンクするデータ

    他の情報と組み合わせるときは個々に明示が必要 属性(著者)と値(小田島雄志)だけでは、他の情報と組み合わせた時に混乱する 対象を加えた3つの要素による情報記述 対象=主語、属性(関係)=述語、値=目的語のトリプルを用いて記述 主語と目的語で表されるものをノード(節点)とし、述語(関係)のアークで結んだグラフとして表現できる グラフは共通のノードを繋いで広げていくことができる=複雑な情報を表現できる 複雑な情報も単純なトリプルに分解して扱うことができる グローバルなつながり グローバルな識別子 単語だけでは表記の揺れや同名があり、情報の同定、区別が難しい 「小田島雄志」と「小田島,雄志」、いろいろな「ロミオとジュリエット」など 主語、述語、目的語をURIで表して曖昧さを取り除く コンピュータで直接処理できるデータ(文字列)はURIで指し示すことなくそのまま(リテラル)で扱う URIによる識別

  • NDC-LD中間報告版

    十進分類法(NDC)の今後の活用方法を検討するため、日図書館協会と国立国会図書館は、2015年4月から2016年3月末までの予定で、共同でNDCのLinked Data化の共同研究を行っています。 ユーザーからのフィードバックを得ることを目的に行った「NDC-LD中間報告版」の試験公開(2015年9月5~13日)は終了しました。ご協力ありがとうございました。 今後とも共同研究終了後におけるNDC-LDの試行的提供を想定しつつ、研究を継続します。 JLA:日十進分類法のLinked Data形式化に係る国立国会図書館との共同研究について NDL:日十進分類法のLinked Data形式化に係る日図書館協会との共同研究 2015年9月14日 NDC-LD共同研究作業グループ 2016-07-05追記: 情報管理2016年7月号に研究報告日十進分類法のLinked Data化:セ

    Guro
    Guro 2015/09/07
  • 図書館目録からLinked Dataへ

    データモデリングと実体 属性―値対としてのデータ記述 フラットな表によるデータの記述 実体の関係としてのデータモデル 独立した存在として情報を付与できるものを実体(entity)と捉える。実体は属性(attribute)を持つことができる。 データを実体間の関連(relation)として捉える(ERモデル) 書誌における実体 書誌データにおいて実体として捉えられるもの 著者、訳者、出版者、出版地などは実体と考えられる そのものも実体だけれど、書誌データのどこに? 分類などは実体? 典拠における実体 典拠概念と実在する実体 標目やノート、ソースなどから構成される典拠概念(実体) 標目によって示されている実在物(人物、場所、時代…) 標目ID00444960が表す実体は… FRBRの実体関係分析 タスクと実体の分析 FRBRでは4タスク(発見、識別、選択、取得)を念頭に実体分析: 情報利用者

  • MLAとリンクするデータ 各国図書館の書誌・典拠グラフを中心に

    リンクするデータと書誌・典拠 リンクするデータ4原則 ものごとをURIで名前付けする これらの名前を調べて訪ねる(参照解決する)ことができるように、httpスキームのURIを使う 名前付けしたURIがたどられたら、有用な情報を返す ほかのURIへのリンクを加えて、より多くのものごとを見出せるようにする 各国図書館での原則1、2:ユリシーズの場合 国立国会図書館…http://iss.ndl.go.jp/books/R100000002-I000002510361-00 ドイツ国立図書館…http://d-nb.info/979821517 英国図書館…http://bnb.data.bl.uk/id/resource/015487226 フランス国立図書館…http://data.bnf.fr/ark:/12148/cb40939669f WorldCat…http://www.world

  • Web NDL Authoritiesの設計

    Web NDLAとは Web NDLSH 国立国会図書館件名標目(NDLSH)をRDF化(2010) 作品の主題(キーワード)を表現するための統制語彙 基盤データベースから出力したMARCテキストデータを元にRDFに変換 国立国会図書館が件名標目データをテキストで公開→RDF版を試作(2006) 約10万件の標目を約130万トリプルのRDFで表現 Web NDLA Web NDLSHに人名、団体名、地名、統一タイトルなどの名称典拠(NDLNA)を追加してWeb NDLAに(2011) MarcXMLとして出力されたデータをRDF化 約110万件の典拠、標目を約1500万トリプルのRDFで表現 既存データからのRDF生成 データの解析 レコードが記述している対象(実体)の把握 レコードの属性と実体の対応付け RDFモデルの設計 URIの設計 各実体を記述するモデル データセット内外のリンク関

    Guro
    Guro 2012/01/18
  • ちょっとしたメモ - 地理コードのURI

    OASISから国コード、言語コードを識別するためのPSI = Public Subject Indicator(公開主題指示子)の案が1月6日付で公開されている。PSIはトピックマップ(Topic Maps)で共有可能な主題(トピック)を示すための仕組みだが、識別子としてURIを用いているため、そのままRDFでも利用できる。たとえば言語コードに、一般的なjaというリテラルを用いる代わりに、http://psi.oasis-open.org/iso/639/#jpn と表現しようというわけだ。 OASISの提案する国コードPSIはISO 3166、言語コードPSIはISO 639をベースにしているのだが、よく使われる2文字コードではなく、国の場合は3桁数値コード、言語の場合は3文字コードを採用している。だから、日国のPSIは http://psi.oasis-open.org/iso/31

    Guro
    Guro 2011/06/26
  • ウェブ化するNDLSH

    NDLSHをRDF/SKOSで記述すると NDLの書誌をRDFで記述し、関連付けられる dc:subjectの目的語を、文字列キーワードではなくURIとして、グラフを併合できる RDFで表現したNDLSHにはSKOSのskos:broader, skos:relatedなどが含まれるので、関連書籍に結びつく しかしこれらは、従来のOPACでもできていたことでは? 件名標目表をウェブ化できる NDLSHの件名がURIを持つことによって、外部からも主題記述に利用できる 主題件名がウェブ上でリンク可能な名前になる=ウェブ化する 日語による「リンクするデータ」のハブとなりうる ウェブ文書のタグ/主題としてのNDLSH マイクロフォーマットによるタグ記述 リンクのrel属性値を"tag"としてタグ表すrel-tagマイクロフォーマット URIパス構成部の最後(/の後)をタグとみなす(ローカル名がI

  • ちょっとしたメモ - SKOSの新草案

    旧SWBPのプロジェクトという位置づけで草案が公開されていたSKOSが、W3Cの標準化トラックに乗って、改めて最初の草案 SKOS Simple Knowledge Organization System Reference が公開された。シソーラスや分類表などの図書館系の知識体系を、できるだけそのままRDFで表現できるようにする語彙+モデルで、個人的なカテゴリや分類方法を体系化するのにも使える。さまざまな領域において、すでに多くのシソーラスや用語集が構築されているわけだが、これらは必ずしもOWLなどでそのままクラス体系として記述できるとは限らない。こうした知識や情報を、無理なく「セマンティック・ウェブ」に組み込むモデルとして、SKOSの果たす役割はかなり大きいのではないかと期待される。 SKOSでは、シソーラスや分類で扱う「術語」を、OWLのクラスではなく、概念リソース(Conceptu

  • 1