多分野統合ポータルの課題と対策 多ソース利用の課題 分散していてアクセス方法もさまざま 取得できるデータ形式がさまざま 同一対象でもIDや記述がさまざま アクセス メタデータのポータルをつくり発信元にリンク 分野ごとに先達あり データ形式 記述の基本要素を単純化する(シンプルなものを組み合わせる) スキーマを固定せず柔軟にする(異なるモデルや語彙でも吸収できる) IDと記述 グローバルな識別子=多様につながるリンクするデータ 値のばらつきを正規化。ただし元データも確認できること "葛飾北斎画"、"勝川春朗筆"は「葛飾北斎」に統一するが、元の記述も分かるようにする RDF:シンプルで柔軟なモデル さまざまな記述をRDFトリプルで単純化する 項目:値ペアの対象(主語)を明示 → 主語―述語―目的語の三つ組(トリプル) トリプルの各要素をURIで識別する。目的語が文字列そのものならリテラルとする