ブックマーク / www.kanzaki.com (13)

  • ちょっとしたメモ - セマンティック・マーク付け本ようやく脱稿

    さて、昨年夏から格闘していたセマンティック・マーク付けに関するの原稿をようやく書き上げ、出版社に送りました。仮タイトルは『セマンティックHTML/XHTML』で、毎日コミュニケーションズから5月下旬に刊行予定です。5年ほど前からの企画はありながら、なかなかまとめられずにいたのですが、昨年とあるプロジェクトが没になったのを機に、集中してこのに取り組み、何とか脱稿にこぎつけました。 セマンティック・マーク付けとは、普通のウェブ文書の中に含まれるイベントや人物などの情報を、ソフトウェア・エージェントでも扱えるように明示することで、人間が読むための文書(文書のウェブ)を、同時にコンピュータにも処理できる情報(データのウェブ)にしようという試みです。何度か取り上げたGRDDLやマイクロフォーマットもその一種ですし、最近ではRDFaという仕様がW3C勧告になり、注目を集めています。このは、そう

    leva
    leva 2009/04/06
    「仮タイトルは『セマンティックHTML/XHTML』で、毎日コミュニケーションズから5月下旬に刊行予定」
  • ちょっとしたメモ - FavikiとタグとDBpedia

    先日登場した新しいブックマークサービス Faviki は、ユーザがタグを与えるときに、英語Wikipediaに登録された語句を候補として提供することで、語彙のゆれ(同義語の問題)を解消しようという特徴を持つ。さらに、タグとWikipediaの連動により、多義語の問題(Operaは歌劇かブラウザか)をも解決する可能性を示す。UIも工夫されており、タグを巡る困難へのひとつの答えともいえる。 タグの共有 以前「タグとオントロジー」で検討したように、タグを広く共有するためには、同義語、多義語の問題を処理する必要がある。アプローチとしては、 従来のタグシステムを前提として、ユーザが自由に与えたタグから、統計的な手法を利用して共通項を見出していく方法と、 ユーザがタグを与える時点で、そのタグを共有可能なもの(統制されたもの)にする方法 が考えられた。Favikiの場合は、後者の立場で、与えられるタグ

    leva
    leva 2008/05/28
    シソーラスやIdentifierとしてのWikipedia
  • ちょっとしたメモ - HTML5はモジュール化しないの?

    HML5の最初の草案が公開されたが、まともに印刷すると400ページ以上になる分量を読むのはなかなか大変。それなのに仕様は、First, it should be read cover-to-cover, multiple times. Then, it should be read backwards at least once. Then it should be read by picking random sections ...なんてことを要求している。まぁそれはともかく、こんな巨大な仕様は、モジュール化するのが吉というのが、HTML4実装の教訓だったんじゃないのかな。適切に設計すれば、「HTML5の○○が気に入らない」という相反する意見も、モジュールの組み合わせでうまく行くかもしれないのに。 さまざまな機器でウェブにアクセスするようになり、またその利用目的もオンライン取引からソー

    leva
    leva 2008/01/24
    HTML5は巨大すぎるからモジュール化してみてはと言う提案。「モジュール化によるウェブの分断」とかは現状でも兆候はないしなぁ。いいんじゃないかと思います。See also http://www.kanzaki.com/docs/html/xhtml11.html
  • ちょっとしたメモ - NBNあるいは書籍の識別

    そういえば、全国書誌番号(NBN)の話をメモしただけで、どうやってその番号を調べるかを書かないままだった。新刊書籍なら、国立国会図書館の『日全国書誌』にJP:として記載されているJP番号、既刊書なら国立国会図書館 NDL-OPACで検索した結果の全国書誌番号がその書籍のNBNにあたる。いろいろ慣用があるとはいえ、同じ識別子を、その作成者自身が場所によって異なる名前で表記している点からして、NBN利用の多難さを物語るってとこかな。 その他、都立図書館などの検索でも全国書誌番号は表示されるが、大学図書館のOPACや公立図書館あたりだと出てこないケースの方が多い(さすがにISBNは、どんな図書検索システムでも表示される)。大学図書館だとNIIのWebcatと連動することが多いので、この識別番号であるNCIDが合わせて示されることもある。また図書館流通センターの書誌データを利用している図書館では

    leva
    leva 2008/01/17
    書誌識別子としてはISBNやNCIDが現実解と言うところか。
  • テーブル -- ごく簡単なHTMLの説明

    いくつかの属性とそのサンプルのような、2次元で表現できる情報は「表」の形にまとめると理解しやすくなります。表計算やデータベースでは、横軸に属性(氏名、住所、電話など)をとり、縦軸にサンプル(それぞれの属性を持つメンバー)をとって表現します。リストが「列挙」という形で1次元の情報を表現していたのと対比すると、「表」がふさわしい情報のタイプがよく分かります。 目次: テーブルの基構成要素 簡単なテーブル 罫線とセルの境界 テーブルの説明 項目名 セルの伸張 セルの背景色 行と列のグループ化 取り上げる要素: table caption tr td th col colgroup thead tbody tfoot HTMLのテーブルはたくさんの要素や属性があって複雑ですが、XHTMLのモジュール化においてBasic Tableと分類されている範囲として、まず項目名あたりまで目を通しておくだけ

    leva
    leva 2007/04/01
    table要素って、属性で明示する形で表示単位を「行」とするか「列」とするか切り替えられれば便利なんだけどなぁ。行だけだと列主体の表が書きにくいなぁと思うことがままありますし。
  • RDFとメタデータの相互運用

    (メタ)データ相互運用の課題 データモデルと名前の相互運用 どんなモデル(データ構造、スキーマ)を採用するか プロパティ(関係記述語彙)はどの程度詳細に設計すべきか、独自語彙か汎用語彙か 人物などの典拠、主題などの語彙(ノードの名前)をどうやって共有するか 記述対象をどのように識別するか(リソースの同一性) (※稿では、最初の2つ、モデルとプロパティについて検討します) 相互運用のスコープ データの共有:統合レポジトリの構築や横断検索の実現 データの交換:AのデータをBが取り込みたいとき データ相互運用とRDF/OWL なぜRDF/OWLか 柔軟性:シンプルで柔軟なグラフ構造でさまざまなモデルを表現できる 意味論:グラフの意味論が定義されており、予備知識のないデータも共通の解釈ができる 語彙の連携:語彙間の関係を記述することができ、その関係を利用した基的な推論ができる 識別と統合:UR

    leva
    leva 2007/03/09
    RDF/OWLでの書籍の表現における留意点。See Also http://www.kanzaki.com/works/2006/pub/0923nal.html
  • ごくごく簡単なDTDの説明

    例えば、辞書型定義リストDLの場合は <!ELEMENT DL - - (DT|DD)+> となっていますが、これは開始タグ、終了タグとも必須で、内容としてはDTもしくはDDが1回以上出現しなければならないということを意味しています。 例外についての注意 +(E)という書き方は、要素(群)Eは内容モデルの「例外」として出現して良いことを示します。この例外は「その要素の実現値の中の全ての場所に適用する」とされ、その子孫にわたって内容モデルにかかわらず出現して良いという意味になります。これは結果的にDTDの読み方を少し難しくしているので注意が必要です。例えばBODY要素タイプの定義を見てみましょう。 <!ELEMENT BODY O O (%block;|SCRIPT)+ +(INS|DEL) > BODY要素の内容にはブロックレベル要素(%block;)もしくはSCRIPT要素が1回以上出現

    leva
    leva 2007/02/10
    よくまとまっているDTDの解説
  • 評判のオントロジーとFOAF

    パネルテーマ:オントロジーの作り方、使い方 語彙を作り、語彙を使ってインスタンスを記述 ウェブにおいては、軽量オントロジーを用いて分散記述するのが主流 分散しているデータをどう結びつけるかというモデル(語彙設計)が重要 ユーザの評価とmicroformats microformats:コミュニティの合意による半構造化 ウェブログなどに記述する内容を、XHTMLのclass属性を使って半構造化する 名前空間を用いず、コミュニティ内の合意によって語彙を区別 Wikiを用いた合議スタイルによる仕様構築 利用が比較的簡単で、ウェブログ用のプラグインなどツールも多数 ユーザの評価を半構造化するhReview hReview - microformats (2005年5月ごろ0.1登場、2007年1月時点でバージョン0.3) TechnoratiのReview Searchなどで利用 XHTMLのcl

    leva
    leva 2007/01/27
    セマンティックWebコンファレンス2007の講演スライド。これ実装まで持って行きたいな。
  • タグとオントロジー

    タグとは何か del.icio.usのWhat are tags?から ブックマークなどを整理したり後で思い出すために、自分で自由に与える1語の説明 タグは階層がなく自由なので、あてがいぶちの分類に無理に合わせる苦労がなく、扱いやすい ほかの人のタグと合わせて、関心事項についての協調型レポジトリを構築できる 統制されない自由なキーワード 手軽に利用でき、新しい現象もすぐタグにできる 既存の統制語彙では新しい動きに対応できない 一方、多数のユーザが与えるキーワードには、同義語、多義語が必然的に含まれる 体系化のないフラットな空間 階層ではなく、キーワードの組み合わせで詳細概念を柔軟に表現 一方、階層を利用したグループ化や関連概念の検索はできない 統計的なグループや関連付けはある程度可能 タグのかたち 対象、ユーザ、キーワードの3大要素 タグは、タグを与える対象、タグを与えるユーザ、タグに用い

    leva
    leva 2007/01/17
    神崎先生の講演スライド。具体例が多くて助かります
  • XHTML + CSS + JavaScriptによるスライドショーシステム

    XHTML版スライドとは CSSJavaScriptによる疑似スライドシステム 1つのXHTMLファイルを、div要素あるいは見出し要素単位で複数のスライドに見立てる。 CSSで1つのスライドブロックのみを表示(他はdisplay:none)。 クリックやキー操作イベントでJavaScriptを起動し、表示するスライドブロックを切り替え。 様々なXHTMLスライドシステムが存在するが、基的な考え方は同じ。 XHTML版スライドのメリット 1つのファイルにまとまってコンパクトで扱いやすい。 適切に作ればCSSJavaScriptが使えない環境でも通常のウェブページとして閲覧可能。 パワーポイントなどの専用アプリケーションが不要で、どこでもプレゼンテーションできる。 ウェブアプリケーションのデモをするときに、そのままブラウザ内でシームレスに操作できる。 アウトラインプロセッサの出力などの

    leva
    leva 2007/01/17
    汎用性は重視していないらしい。
  • Web 2.0からセマンティック・ウェブへ

    “Web 2.0”の主張 Tim O'Reillyによれば プラットフォームとしてのウェブ(The Web As Platform) 集合知の利用(Harnessing Collective Intelligence) データが重要(Data is the Next Intel Inside) 商品としてのソフトからサービスとしてのソフトへ(End of the Software Release Cycle) ハッキングと連動が容易な軽量プログラミング(Lightweight Programming Models) PCに限定されない利用(Software Above the Level of a Single Device) Ajaxに代表されるリッチなUI(Rich User Experiences) (What Is Web 2.0 Design Patterns and Busin

    leva
    leva 2006/11/22
    神崎先生の講演プレゼン
  • フォーマルで行こう

    情報のかたちと理解 InformationはFormを持つ 情報を構成する枠組みを知る 情報を既存の知識と関連付ける エージェントに伝える形、ユーザに伝える形 ウェブの「型」を身につけよう 文学や芸術に“形式”があるように「フォーム」は重要 ウェブの「型」 → ユニバーサルアクセスとデータ共有・再利用 情報のかたちと名前 コンピュータと形式と名前 形式化:形(枠組み)に名前を与えて共有可能にする 形式化された情報はコンピュータ処理が可能 情報を抽出する、変換する、推論する… 名前とコンテクスト おーい、あれ持ってきて(完全にローカルコンテクスト) オペラが好きだ(コミュニティによる違い) 東京都中央区銀座1丁目(コンテクストに依存しない) 名前は共有できてはじめて意味がある ウェブページで使われる名前はどんなスコープで通じるか HTMLと情報のかたち 文書のかたちを示すマーク付け シンプル

    leva
    leva 2006/07/26
    相変わらずわかりやすい。具体的トピックとしてはmicroformatsやSPARQLなど
  • スタイルの設計とCSS 2.1

    情報ブロックの設計とCSS 2.1のコアについて解説した原稿(詳細目次と一部文)が、『セオリー・オブ・スタイルシート』のPart 1と付録(計約170ページ分)として出版されました。

    leva
    leva 2006/03/07
    神崎先生のCSS本
  • 1