タグ

ブックマーク / www.kanzaki.com (6)

  • ちょっとしたメモ - RDFとは何か

    What Is RDFという、xml.comに8年前から掲載されている記事がある。Tim Brayによるオリジナル版のあとで2001年にDan Brickleyによる改訂版が出て、またまた今回Joshua Taubererによる再改訂版が登場した。RDFの現在の位置づけやセマンティック・ウェブとの関連を踏まえて新たに書き下ろしたものだが、新改訂版を以前からあるURLで公開し、旧版を別のURLに移動しているのが面白い。 旧版ではRDFを「メタデータを記述してウェブでの検索を高度にするもの」という形で捉えていたが、最新版ではどういう紹介になっているのか、かいつまんで見ていくことにしよう。まず導入部分。 セマンティック・ウェブ(以下SW)では、コンピュータが私達のためにブラウジング(それに探索や照会など…)を行ってくれる。SWは、コンピュータがウェブ上に分散している知識を探し出し、それをかみ合わ

    j0hn
    j0hn 2006/07/28
  • フォーマルで行こう

    情報のかたちと理解 InformationはFormを持つ 情報を構成する枠組みを知る 情報を既存の知識と関連付ける エージェントに伝える形、ユーザに伝える形 ウェブの「型」を身につけよう 文学や芸術に“形式”があるように「フォーム」は重要 ウェブの「型」 → ユニバーサルアクセスとデータ共有・再利用 情報のかたちと名前 コンピュータと形式と名前 形式化:形(枠組み)に名前を与えて共有可能にする 形式化された情報はコンピュータ処理が可能 情報を抽出する、変換する、推論する… 名前とコンテクスト おーい、あれ持ってきて(完全にローカルコンテクスト) オペラが好きだ(コミュニティによる違い) 東京都中央区銀座1丁目(コンテクストに依存しない) 名前は共有できてはじめて意味がある ウェブページで使われる名前はどんなスコープで通じるか HTMLと情報のかたち 文書のかたちを示すマーク付け シンプル

  • ちょっとしたメモ - セマンティック・ウェブ再訪

    Scientific American誌の2001年5月号に The Semantic Web が登場してからちょうど5年目のタイミングで、IEEE Intelligent Systems誌に The Semantic Web Revisited が掲載され、話題になっている。こちらもバーナーズ=リーが執筆陣に加わっており、現時点でのセマンティック・ウェブの総括といえる内容だ。 記事抄録を訳して紹介しておこう。 サイエンティフィック・アメリカンに最初のセマンティック・ウェブの記事が登場したのは2001年のこと。そこでは、主として人間が読むための文書で構成されれているウェブから、コンピュータが処理できるデータや情報を含むウェブへの発展が語られていた。セマンティック・ウェブとは、作動可能な(actionable)情報、すなわちシンボルを解釈するための意味理論を通じてデータから取り出された情報の

  • ちょっとしたメモ - バーナーズ=リー vs. Google

    バーナーズ=リーが18日のアメリカ人工知能学会の基調講演を行ったときに、Googleの検索担当ディレクタのPeter Norvigが疑問を投げかけたという話がZDNetで取り上げられている(Google exec challenges Berners-Lee)。内容は特に目新しくはないのだが、Googleという立場でセマンティック・ウェブの課題に対する考えが述べられているのは、興味深いところ。 基調講演でバーナーズ=リーは、永続的なURIとRDFで情報を識別することの重要性を強調し、これらの仕様を一貫して用いることで、ウェブが来目指していた協調的な性質をセマンティック・ウェブが獲得できるのだという持論を展開する。その講演後のQAセッションで、最初にマイクを握ったのがNorvigだったというわけだ。 Norvigは、セマンティック・ウェブに反対するわけではないが、Googleの視点からする

  • ウェブのデータと検索の可能性

    検索の手順:何をコンピュータに任せられるか どこに情報があるか データベース検索 → DB推薦? 一括検索? 文書検索 → 文書からデータを取り出すには 何をどう検索するか 適切な検索語句 → シソーラスや検索候補 適切な検索式 → フリーキーワード v.s. 多項目検索 結果をどう利用するか 検索結果を見る → より分かりやすいプレゼンテーション 結果を評価・判断する → ページランク、適合度、信頼度評価 継続検索 → 検索式の自動補正、絞込み 次のアクション → 別のサービスへの自動接続、結果からの推論 文書の検索と情報の検索 情報を知るためには 情報が記述されている文書(書籍、ウェブページ)を検索して内容を読む 情報を(あらかじめ整備されたデータベースなどで)直接調べる 文書の中の情報が検索できたら? 人間に代わってコンピュータが文書内から情報を取り出してくれたら? 2006年5月の

  • ちょっとしたメモ - W3Cの新しいXSLTサービスとGRDDL

    W3CのオンラインXSLTサービスが新しくなって、文字コードの扱いが改善された。以前はUTF-8以外の文字コードは即座にJavaの例外を引き起こしていたのだが、今回はShift_JISでもEUC-JPでもちゃんと処理できている。これによって、日語XHTMLページからGRDDLでRDFを容易に抽出できるようになる、はずだ。 XHTML文書からRDFを抽出するには、たとえば当サイトの汎用XSLT(xh2rdf.xsl)をこのオンラインサービスで適用すればよい。整形式を満たしている文書なら、タイトルや見出しがメタデータとして取り出され、要約やキーワード、作者の連絡先があればそれも含めたRDFが得られる。 XHTML: さらに、head要素のプロファイルとしてhttp://purl.org/net/ns/metaprofを記述していれば、W3CのGRDDL demoページから直接RDF抽出を行う

    j0hn
    j0hn 2006/04/29
  • 1