k_37toのブックマーク - はてなブックマーク

k_37to id:k_37to

ブックマーク / nais.to/~yto (12)

[を] 「SEもEnglish」の目次
「SEもEnglish」の目次 2006-12-28-2 [英語] 「ITmedia エンタープライズ：顧客満足度ナンバーワンSEの条件」 http://www.itmedia.co.jp/enterprise/special/se/ にある「Keri's Business English Clinic - SEもEnglish」。アクセスしづらいので目次だけ取り出してみた。まあ最終回のページだけブックマークしとけばいいんだけど。 (1)「あいづちの英語」 http://www.itmedia.co.jp/enterprise/articles/0505/13/news010.html Yeah. Uh, huh. I see. Right. Good. Exactly. Absolutely. (2)「相手の話を遮ぎる、相手の話の流れを変える英語」 http://
k_37to 2006/12/30
english

se

engineer
リンク
[を] プレインテキストでの ToDo 表記法いろいろ
プレインテキストでの ToDo 表記法いろいろ 2006-11-14-3 [LifeHacks] プレインテキストでの ToDo 表記法いろいろ。 2年半前の書きかけ記事が出てきたのでそのまま公開してみる。 TODO管理 - capsctrldays (2004-03-05) http://capsctrl.que.jp/kdmsnr/diary/20040305.html#p06 ■：完了！：遅延 →：進行中 □：未着手 TO DO管理 - DARK SERVER http://nyaos.org/d/?date=20040306#p02 [ ] 未着手 [x] 完了 [v] 実施中 [-] やらんでえーことにした [を] TODO管理[2004-03-04-3] ●完了 - 今日完了！ ◎作業中 - 完了しなかったけど、やってます ○進捗なし -
k_37to 2006/11/16
lifehacks

todo

write

style
リンク
[を] Count Sketch アルゴリズムというのがおもしろそう
Count Sketch アルゴリズムというのがおもしろそう 2006-10-28-3 [Algorithm] これおもしろそう。大量のデータから出現頻度の高いものを効率よく取り出す方法らしい。 - "Count Sketch" - Radium Software Development http://www.radiumsoftware.com/0610.html#061020 元の論文はここから読める。あとで読んでみる。 - Finding Frequent It ems in Data Streams - Charikar, Chen, Farach-Colton (ResearchIndex) http://citeseer.ist.psu.edu/charikar02finding.html
k_37to 2006/11/03
count

sketch

algorithm
リンク
[を] Firefox 2 にした＆「Copy URL 」修正
Firefox 2 にした＆「Copy URL+」修正 2006-10-25-3 [Software] メインのWebブラウザを「Firefox 1.5」から「Firefox 2」にしてみました。 Mozilla Japan - Firefox http://www.mozilla-japan.org/products/firefox/ タブや検索窓のデフォルトの背景が白からグラデーションになったので、透明背景使ってない favicon がきれいに見えない問題発生！透明背景でアイコン作り直すかな。要調査。あと、本家でそのうち対応されるだろうけど、常用しているアドオンの一つである Copy URL+ V1.3.2 (http://copyurlplus.mozdev.org/) が使えなくなった。激しく不便。すぐにでも使いたいので、「拡張機能の日本語化 ― t
k_37to 2006/11/03
firefox

2

copy

url
リンク
[を] わかったつもり
わかったつもり 2006-09-23-2 [書評・感想] ■西林克彦 / わかったつもり - 読解力がつかない本当の原因全体的に例が豊富で丁寧です。わかったつもりの正体がわかりました、だいたい。いろいろ身につまされます。（わかったつもりについてわかったつもりになりました、などというベタなことは言いません。）文脈が重要という話。文脈によってわかるものも変わるし、わかる度合いも変わる。ビジネス書の速読法なんかでは、「読む前に『この本から何を得たいのか』という目的を持て」、なんてことが言われますが、これも一つの文脈なわけですね。「いろいろ」に注意。「いろいろあるのだな」と認識した時点で、実は人はそれ以上の追及を止めてしまうのです。(p.149) そうなんだよなあ。とはいえ、たいして興味のないことに関しては、「いろいろあるねえ」で済まして
k_37to 2006/11/03
book
リンク
[を] 裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する
裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する 2006-09-17-1 [YahooHacks][NLP] 今回の YahooHacks は、長い文を検索キーとしてWeb検索をするというハックです。一年前の検索会議[2005-09-30-3]で紹介しましたが、今回ゼロから書き直しました。サンプルコードが長くなってしまってすいません…。 (一時的にデモを置いておきます。そのうち消えます。ご了承下さい。 http://nais.to/~yto/tmp/yahoohacks-samp/hack_sentence.cgi 検索例：SEOの10ステップと...←うろ覚えタイトル ) ■■■長い文をそのまま検索キーとして Web 検索するどこかからコピペしてきた長い文をそのまま Yahoo! で検索してもヒットしないことが多いです。そういう場合
k_37to 2006/11/03
perl

search

yahoo

api

meCab
リンク
[を] Yahoo!商品検索のRSSで商品検索サイトを作る
Yahoo!商品検索のRSSで商品検索サイトを作る 2006-09-13-1 [YahooHacks] どんな検索サービスにも言えることですが、検索結果のRSSが提供されているということは、そのまま検索APIとして使えるということを意味しています。てなわけで、今回の YahooHacks は、 Yahoo!商品検索(http://psearch.yahoo.co.jp/)のRSSを用いた検索サイトの作り方です。なお、「use CGI qw/-no_xhtml/;」としているのはバッドノウハウです。バージョンの違いもあるかもだけど、start_html() で散々嫌な目にあったので。今回は、CGI.pm で昔ながらの方法を使って書いてみたのですが、前述のバッドノウハウも含め、なんか疲れますね。普段はテンプレートを使っています。そういうサンプルも今後
k_37to 2006/11/03
yahoo

api

rss

shopping

search
リンク
[を] 指定した URL へのリンクのアンカーテキストを収集する
指定した URL へのリンクのアンカーテキストを収集する 2006-09-12-1 [YahooHacks] 今回の YahooHacks は「アンカーテキストの収集」です。とはいえ、文字コードにはまったー！「./hack_anchor.pl http://www.yahoo.co.jp/」を実行すると、「UTF-16LE:Malformed LO surrogate dab3 at /usr/lib/perl/...」などと怒られて落ちるのですが（環境によって異なるみたい…）、これを skip するにはどうしたら良いのでしょうか？とりあえず、decode のところを eval してみました…。 ■■■あるページへのリンクのアンカーテキストを収集する同じページを指すハイパーリンクのアンカーテキストにはいろいろとバリエーションがあります。例えば、 ht
k_37to 2006/11/03
yahoo

api

link

anchor

text
リンク
[を] Yahoo! APIでサイトに含まれるページ数を知る
Yahoo! APIでサイトに含まれるページ数を知る 2006-09-11-1 [YahooHacks] 今回の YahooHacks は、あるサイトに含まれるページ数を知る方法です。「http://d.hatena.ne.jp に含まれるページ数」ではなく、「http://d.hatena.ne.jp/yto に含まれるページ数」が知りたいというのが動機です。ホスト指定でなく、URL指定。とはいえ、当然のことながらインデックスされているページ数しかわかりませんよ。あと、いまいち inurl の使い方が分かっていないところがあるので、内容は不正確です。何か情報ありましたら、お願いします。それではどうぞ： ■■■あるサイトに含まれるページ数を知るあるサイトに含まれるページ数を知るにはどうしたらよいでしょう。そのサイトに含まれるページ数＝ヤフーにイン
k_37to 2006/11/03
yahoo

api

directory

index
リンク
[を] あるページの検索インデックスへの登録の有無
あるページの検索インデックスへの登録の有無 2006-09-10-1 [YahooHacks] 今回の YahooHacks は、「あるページがヤフーの検索インデックスへ登録されているかどうか」を調べる方法についてです。 ■■■あるページの検索インデックスへの登録の有無を調べるあるページがヤフーの検索インデックスに登録されているかどうかを知りたい！ということがときどきあります。 ■クエリー構文「url:」ヤフーWeb検索では、クエリー構文「url:」を使い、そのページの URL を指定すると、インデックスに登録されているか否かを知ることができます。登録されていれば検索結果が表示されます。 http://search.yahoo.co.jp/search?p=url:http://nais.to/~yto/clog/ 「url:」を使って、URL のリス
k_37to 2006/11/03
yahoo

api

index
リンク
[を] アマゾンの URL から ASIN を取得
アマゾンの URL から ASIN を取得 2006-09-06-1 [Programming][Affiliate] tsupo さんのブログ記事、「[観] アマゾンの URL から ASIN を取得する関数 getASIN()」 http://watcher.moe-nifty.com/memo/2006/09/_url_asin_getas_1a25.html を読んで、 URL に amazon.co.jp が含まれているなら、 /[B0-9][A-Z0-9]{9} みたいな単純なパターンにマッチさせるだけでも十分かな、と思いました。（とはいえ、たぶん用途上、そう単純にできないのかも？） amazon 以外の URL に含まれる ASIN にマッチさせる場合は、こんな正規表現でどうかなあ。前後にちょっと足しました。 [/=?&]([B0-9][A-Z0-9
k_37to 2006/11/03
Amazon

URL

ASIN
リンク
[を] 形態素解析と検索APIとTF-IDFでキーワード抽出
形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。教科書に載っているような基本中の基本ですが、あらためてエッセンスを簡単な例で解説したいと思います。目的：キーワード抽出対象テキストから、そのテキストを代表するキーワードを抽出します。TF-IDF という指標を用います。（この値が大きいほどその単語が代表キーワードっぽいということでよろしく。） TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード
k_37to 2006/11/03
全文検索エンジン

search

algorithm

tf-idf
リンク
1