タグ

ブックマーク / nais.to/~yto (4)

  • [を] 指定した URL へのリンクのアンカーテキストを収集する

    指定した URL へのリンクのアンカーテキストを収集する 2006-09-12-1 [YahooHacks] 今回の YahooHacks は「アンカーテキストの収集」です。 とはいえ、文字コードにはまったー! 「./hack_anchor.pl http://www.yahoo.co.jp/」を実行すると、 「UTF-16LE:Malformed LO surrogate dab3 at /usr/lib/perl/...」 などと怒られて落ちるのですが(環境によって異なるみたい…)、 これを skip するにはどうしたら良いのでしょうか? とりあえず、decode のところを eval してみました…。 ■■■あるページへのリンクのアンカーテキストを収集する 同じページを指すハイパーリンクのアンカーテキストにはいろいろと バリエーションがあります。 例えば、 ht

    sst
    sst 2006/09/13
    指定した URL へのリンクのアンカーテキストを収集する
  • [を] 机の片付け方法

    机の片付け方法 2006-06-21-1 [LifeHacks] シンプリファイ[2006-06-17-5]に載っていた机の片付け方法。 ■四分円法(アイゼンハワー方式) まず何も載っていない机の上を以下のように四等分(机がなければ床でも) にし分類していく。 (1) 捨てるもの (2) 人に任せるもの (3) 重要なもの(自分で片付けなければならない用件) (4) 特別な場所(片付けながら同時に処理できるもの←収納するもの等) このとき守るべき3つの原則。 (1) 中間地帯を作らない (2) 書類を手にしたら、その場ですぐ処理する (3) 5,6番目の場所を作らない

    sst
    sst 2006/06/21
  • [を] 「次」と「前」の意味と並び順

    「次」と「前」の意味と並び順 2006-05-22-2 [Blog][WebTool] 次の日、前の日、次のページ、前のページ、次の記事、前の記事。 「前」「次」はそれぞれどういう意味か。 またそれらはどういう順番で並んでいるか。 気になったので調査中。 サービス名[位置]と表記意味livedoor blog[左] 前の記事古い記事へlivedoor blog[右] 次の記事新しい記事へtDiary[左] 前の日記古いページへtDiary[右] 次の日記新しいページへMovable Type 系[左] 古い記事へMovable Type 系[右] >> 新しい記事へはてなダイアリー[左] 前の日 古いページへはてなダイアリー[右] 次の日 新しいページへYahoo! 360°[左] 前の日記古いページへYahoo! 360°[右] 次の日記新しいページへ2ちゃんねる[左] 前10

  • [を] 形態素解析と検索APIとTF-IDFでキーワード抽出

    形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基中の基ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード

  • 1