タグ

2005年6月14日のブックマーク (7件)

  • ここギコ!: タグの揺らぎからオントロジーへ

    タグの日語揺らぎをロジックで吸収する - tdiary.ishinao.net このエントリを書いた者として、似たような事考えてましたー。 タグ付けをメタデータ付与と考えるなら、その重複度を解析すれば、トップダウンではなくボトムアップの形でのオントロジーが生成できるんじゃないのー、みたいな。 実装ほぼ放棄した身なんで、当に考えてただけですが。考えてただけ of 考えてただけ s。 でも、タグの揺らぎが多すぎて実用的でないと書かれてますけど、そんなもんでいいんじゃないのー、と思います。 bulkfeedsのSimilarity Search、あれなんかはテキストベースの揺らぎ検索と言えるんじゃないかと思うんですけど、 あれってどういう内部ロジックなのかよく知らないですし、もしかしたらmiyagawaさんはその辺にも詳しいのかもしれないですが、でも多分、その方面に関してはmiya

  • いしなお! - いろいろ変えました (14:57) , タグの日本語揺らぎをロジックで吸収する (14:59) , タグってぇのは、ジャンルのことじゃないよね?..

    _ いろいろ変えました (14:57) 主だった変更点は、 トップページに表示する情報を整理した(特に新着情報を減らした) 代わりに、各カテゴリーごとの新着情報を別ページで表示するようにした(URL、ASIN、地図、テレビ番組) [類似メモ]を[関連情報]に変更し、「キーワードが似ているメモ」「同一URL/ASINに関するメモ」「同一URL/ASINにリンクしたサイト」をまとめて表示するようにした mylist以外のメモ表示時にも、メモコメント等を表示するようにした。 あたりかな。 _ タグの日語揺らぎをロジックで吸収する (14:59) そういや、日語のタグ(MMではジャンル)の揺らぎをロジックで吸収する実験として、 「同じ話題に違うタグが付けられているものは、(重複数が多いほど)同じ意味を示している可能性が高い(たとえばあるURLメモに付けられているタグに「技術」と「tech」が多

    satojkovic
    satojkovic 2005/06/14
    重複の多いもの同志を同一視することでタグの揺らぎを吸収するアイデア。
  • ウェブのオントロジー言語OWL -- ウェブに存在するものとその関係の定義

    RDFモデルとRDFスキーマによるリソースの叙述という基ツールを使って、ウェブに存在するものごとの分類体系(クラス)やその関係、さらにはそれを推論していくためのルールを定義するオントロジー言語OWLが2004年2月にW3C勧告となりました。セマンティック・ウェブでは、各地で独自に定義される語彙を関連づけ、相互運用できるようにするためにオントロジーが重要になります。オントロジーで表現された知識を利用して、エージェントが高度な検索などを行うことが期待されています。 オントロジーとは ウェブ・オントロジーのユースケース W3Cのウェブ・オントロジー言語OWL OWLの基構成 ヘッダ要素 クラス公理 プロパティ公理 個体による事実の記述 参照文献 ※OWLを含む体系的な解説『RDF/OWL入門』を上梓しました。 オントロジーとは オントロジー(ontology)は、アリストテレス以来の「存在論

  • http://www.kc.t.u-tokyo.ac.jp/NLP_Portal/lecture.html

  • シソーラスとオントロジー

    2.2 電子化されたシソーラス キーボードから直接どこでも指定できるので木構造をたどりながら探していく必要はありません。もはや木構造ではなく、網構造になって複数の広義語が持てるようになります。しかしその結果同じ文字列で複数の意味を持つ多義語が区別できない問題がでてきます。例えば木構造で検索したときには、「時間」からたどった「月」(month)と、「天体」からたどった「月」(moon)の二つの異なった意味の語は区別できますが、網構造では区別ができなくなります。 「月」を「天体」の観点でとらえたときはmoon で「時間」の観点でとらえたときはmonthであるとすれば解決できます。 一つのグループに入れる語を多くしすぎるとグループのなかを探すのに時間がかかってしまいます。逆に少なくしようとすると階層が深くなってしまいます。電子化されたシソーラスでは、クリックするだけで、簡単に上下の階層

  • regex Tips

    Copyright (c) 2001 Koichi OKADA まず「取扱説明書」をお読みください。 はじめに regex とは regex ってのは POSIX 準拠の正規表現ライブラリです。 POSIX 準拠のシステムでは標準で準備されています。 正規表現というのは任意のテキストを検索する際に便利な表現方法です。 最近流行りの多くの Script 言語でも採用されています。 C は特に文字列の処理が不得手なので知っておくと便利です。 GNU Rx GNU Rx とは POSIX 互換の正規表現ライブラリです。 POSIX の regex と同名の関数が使えます。 GNU Rx 特有の機能もありますが、ここでは解説しません。 win32(VisualC++) 向けの Software / GNU Rx(librx) で公開しておきます。 ライセンス reg

  • ジョブズCEO、スタンフォード大学で波乱の半生を語る | WIRED VISION

    ジョブズCEO、スタンフォード大学で波乱の半生を語る 2005年6月14日 コメント: トラックバック (0) AP通信 2005年06月14日 カリフォルニア州パロアルト発――米アップルコンピュータ社のスティーブ・ジョブズ最高経営責任者(CEO)は11日(米国時間)、スタンフォード大学の卒業生たちに向かって、大学中退は自分がこれまでに行なった最高の決断だったと語った。大学中退によって、創造的にならざるを得なくなった――夕代を捻出する場合にさえ――からだ、とその理由を説明した。 一風変わった気取りのない卒業式のスピーチで、ジョブズCEO(50歳)はおよそ5000人の卒業生を前に、珍しいタイプの膵臓ガンを経験した(日語版記事)ことで、毎日を精一杯生きなければならないことを再認識したとも述べた。 「人の時間には限りがある。だから他人の人生を生きて時間を無駄にするな」と、ジョブズCEOはスタ

    satojkovic
    satojkovic 2005/06/14
    他人の人生を生きて時間を無駄にしないように