sstのブックマーク - はてなブックマーク

sst id:sst

ブックマーク / nais.to/~yto (4)

[を] 指定した URL へのリンクのアンカーテキストを収集する
指定した URL へのリンクのアンカーテキストを収集する 2006-09-12-1 [YahooHacks] 今回の YahooHacks は「アンカーテキストの収集」です。とはいえ、文字コードにはまったー！「./hack_anchor.pl http://www.yahoo.co.jp/」を実行すると、「UTF-16LE:Malformed LO surrogate dab3 at /usr/lib/perl/...」などと怒られて落ちるのですが（環境によって異なるみたい…）、これを skip するにはどうしたら良いのでしょうか？とりあえず、decode のところを eval してみました…。 ■■■あるページへのリンクのアンカーテキストを収集する同じページを指すハイパーリンクのアンカーテキストにはいろいろとバリエーションがあります。例えば、 ht
sst 2006/09/13
指定した URL へのリンクのアンカーテキストを収集する

yahoo

program

seo

tool

tips
リンク
[を] 机の片付け方法
机の片付け方法 2006-06-21-1 [LifeHacks] シンプリファイ本[2006-06-17-5]に載っていた机の片付け方法。 ■四分円法（アイゼンハワー方式）まず何も載っていない机の上を以下のように四等分（机がなければ床でも）にし分類していく。 (1) 捨てるもの (2) 人に任せるもの (3) 重要なもの（自分で片付けなければならない用件） (4) 特別な場所（片付けながら同時に処理できるもの←収納するもの等）このとき守るべき3つの原則。 (1) 中間地帯を作らない (2) 書類を手にしたら、その場ですぐ処理する (3) ５，６番目の場所を作らない
sst 2006/06/21
lifehack
リンク
[を] 「次」と「前」の意味と並び順
「次」と「前」の意味と並び順 2006-05-22-2 [Blog][WebTool] 次の日、前の日、次のページ、前のページ、次の記事、前の記事。「前」「次」はそれぞれどういう意味か。またそれらはどういう順番で並んでいるか。気になったので調査中。サービス名[位置]と表記意味livedoor blog[左] 前の記事古い記事へlivedoor blog[右] 次の記事新しい記事へtDiary[左] 前の日記古いページへtDiary[右] 次の日記新しいページへMovable Type 系[左] 古い記事へMovable Type 系[右] >> 新しい記事へはてなダイアリー[左] 前の日古いページへはてなダイアリー[右] 次の日新しいページへYahoo! 360°[左] 前の日記古いページへYahoo! 360°[右] 次の日記新しいページへ2ちゃんねる[左] 前10
sst 2006/05/23
design

usability

interface

summary
リンク
[を] 形態素解析と検索APIとTF-IDFでキーワード抽出
形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。教科書に載っているような基本中の基本ですが、あらためてエッセンスを簡単な例で解説したいと思います。目的：キーワード抽出対象テキストから、そのテキストを代表するキーワードを抽出します。TF-IDF という指標を用います。（この値が大きいほどその単語が代表キーワードっぽいということでよろしく。） TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード
sst 2005/11/08
tool

technology

informatics
リンク
1