タグ

ブックマーク / mojix.org (4)

  • HTML 5では「article」タグでページの「本文」が取れる - モジログ

    次世代HTMLの「HTML 5」について、そのウワサは以前から耳にしながらも、中身については知らなかった。 仕様や解説記事(末尾にまとめた)をいくつか流し読みしてみて、驚いた。これこそ、私の求めていたものだ。 私は以前より、Webページの「文」がどこからどこまでなのか、ソフトウェアで判定できる標準的な方法があればいいとずっと思っていた(「フィードをアイテム単位に区切れば、セマンティック・ウェブが一気に現実化する」)。HTML 5では、いくつか導入される新しい要素(タグ)の中に「article」というものがあり、これがまさに「記事」の範囲を示すものなのだ。 これさえあれば、プログラム的にWebページを取得して、その「article」タグの部分だけ抽出すれば「文」になる。あらゆるWebページにこの「article」タグが入ってくれば、もうフィードに頼る必要もなく、どんなページの「文」でも

  • Google、東京研究センター設立へ / セマンティック検索とGoogleの「方向」 - モジログ

    ITmedia : Google、日語検索強化へ東京研究センターを設立へ http://www.itmedia.co.jp/news/articles/0404/20/news025.html CNET Japan : 「より質の高い検索結果をめざす」:Google、東京研究開発センターの設置を発表 http://japan.cnet.com/news/media/story/0,2000047715,20065572,00.htm それにしても、GmailあたりからGoogleのニュースがやたら多くなってきたが、今度は「日」だ。 ITmediaの記事によると、 <これまでGoogleの日語検索エンジンは、英語用のエンジンをベースに米国社でローカライズしていた。東京研究開発センターでは、日語に特化した検索アルゴリズムなどを研究し、日語専用の新しい検索エンジンの開発を目指す> と

    kiwofusi
    kiwofusi 2008/06/20
  • フィードをアイテム単位に区切れば、セマンティック・ウェブが一気に現実化する - モジログ

    ブログを更新すると、トップページに最新エントリが出てくる。 これは、ブログのトップページが一種の「一覧ページ」だからだ。 一覧ページのURLは変わらずに、その中身が変わっていく。 これに対して、ブログの1つのエントリを表示する「個別ページ」は、基的に中身が変わらない。 1つのエントリに対して固有のページが割り当てられ、そのURLが「パーマネントリンク」になる。 この2種類のページ、「一覧ページ」と「個別ページ」は役割が違う。 「一覧ページ」はフォルダのようなもので、「個別ページ」はファイルのようなものだ。 フォルダにファイルが追加されるように、「一覧ページ」に「個別ページ」が追加される。 「フィード」とは、この2種類のページのうち、前者の「一覧ページ」をソフトウェア向けにしたものだ。 Webページは人間が見るために作られているが、フィードはソフトウェア向けに作られている。 フィードのおか

    kiwofusi
    kiwofusi 2008/03/29
  • Zopeジャンキー日記 :なぜネットではディレクトリが敗れ、サーチとタグが勝利するのか

    「なまえとタイトル」の最後のほう、「対象が多すぎると、タイトル的な名前は機能しない」という項で、私は次のように書いた。 <「ファイル名はなくてもいいかもしれない」という話が出てくるのも、まさにこの状況だ。ファイルが多すぎて、どこにあるかわからなくなるような状況では、ファイル名の「説明」機能がそもそも果たせない。 そしてこれこそが、インターネットにおいてサーチやタグが浮上してきた理由なのだ。 これは重要なトピックなので、あらためて別エントリで書きたい>。 このエントリは、この話の続きだ。 ■インターネットという、「対象が多すぎる」世界 「対象が多すぎる」とは、この場合、「全部のタイトルをざっと眺める」ことすらできないくらい、対象が多い状況を指す。 インターネットが、この「対象が多すぎる」世界であることに疑問の余地はないだろう。 仮に、ネット上にある全ページのタイトルがどこかに列挙されていると

  • 1