タグ

ブックマーク / nais.to/~yto (12)

  • [を] 「SEもEnglish」の目次

    「SEもEnglish」の目次 2006-12-28-2 [英語] 「ITmedia エンタープライズ:顧客満足度ナンバーワンSEの条件」 http://www.itmedia.co.jp/enterprise/special/se/ にある「Keri's Business English Clinic - SEもEnglish」。 アクセスしづらいので目次だけ取り出してみた。 まあ最終回のページだけブックマークしとけばいいんだけど。 (1)「あいづちの英語」 http://www.itmedia.co.jp/enterprise/articles/0505/13/news010.html Yeah. Uh, huh. I see. Right. Good. Exactly. Absolutely. (2)「相手の話を遮ぎる、相手の話の流れを変える英語」 http://

  • [を] プレインテキストでの ToDo 表記法いろいろ

    プレインテキストでの ToDo 表記法いろいろ 2006-11-14-3 [LifeHacks] プレインテキストでの ToDo 表記法いろいろ。 2年半前の書きかけ記事が出てきたのでそのまま公開してみる。 TODO管理 - capsctrldays (2004-03-05) http://capsctrl.que.jp/kdmsnr/diary/20040305.html#p06 ■:完了 !:遅延 →:進行中 □:未着手 TO DO管理 - DARK SERVER http://nyaos.org/d/?date=20040306#p02 [ ] 未着手 [x] 完了 [v] 実施中 [-] やらんでえーことにした [を] TODO管理[2004-03-04-3] ●完了 - 今日完了! ◎作業中 - 完了しなかったけど、やってます ○進捗なし -

  • [を] Count Sketch アルゴリズムというのがおもしろそう

    Count Sketch アルゴリズムというのがおもしろそう 2006-10-28-3 [Algorithm] これおもしろそう。 大量のデータから出現頻度の高いものを効率よく取り出す方法らしい。 - "Count Sketch" - Radium Software Development http://www.radiumsoftware.com/0610.html#061020 元の論文はここから読める。あとで読んでみる。 - Finding Frequent Items in Data Streams - Charikar, Chen, Farach-Colton (ResearchIndex) http://citeseer.ist.psu.edu/charikar02finding.html

  • [を] Firefox 2 にした&「Copy URL 」修正

    Firefox 2 にした&「Copy URL+」修正 2006-10-25-3 [Software] メインのWebブラウザを「Firefox 1.5」から「Firefox 2」にしてみました。 Mozilla Japan - Firefox http://www.mozilla-japan.org/products/firefox/ タブや検索窓のデフォルトの背景が白からグラデーションになったので、 透明背景使ってない favicon がきれいに見えない問題発生! 透明背景でアイコン作り直すかな。要調査。 あと、家でそのうち対応されるだろうけど、常用しているアドオンの 一つである Copy URL+ V1.3.2 (http://copyurlplus.mozdev.org/) が 使えなくなった。激しく不便。 すぐにでも使いたいので、「拡張機能の日語化 ― t

  • [を] わかったつもり

    わかったつもり 2006-09-23-2 [書評・感想] ■西林克彦 / わかったつもり - 読解力がつかない当の原因 全体的に例が豊富で丁寧です。 わかったつもりの正体がわかりました、だいたい。 いろいろ身につまされます。 (わかったつもりについてわかったつもりになりました、 などというベタなことは言いません。) 文脈が重要という話。 文脈によってわかるものも変わるし、わかる度合いも変わる。 ビジネス書の速読法なんかでは、 「読む前に『このから何を得たいのか』という目的を持て」、 なんてことが言われますが、これも一つの文脈なわけですね。 「いろいろ」に注意。 「いろいろあるのだな」と認識した時点で、実は人はそれ以上の追及を止 めてしまうのです。(p.149) そうなんだよなあ。とはいえ、たいして興味のないことに関しては、 「いろいろあるねえ」で済まして

    k_37to
    k_37to 2006/11/03
  • [を] 裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する

    裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する 2006-09-17-1 [YahooHacks][NLP] 今回の YahooHacks は、 長い文を検索キーとしてWeb検索をするというハックです。 一年前の検索会議[2005-09-30-3]で紹介しましたが、 今回ゼロから書き直しました。 サンプルコードが長くなってしまってすいません…。 (一時的にデモを置いておきます。そのうち消えます。ご了承下さい。 http://nais.to/~yto/tmp/yahoohacks-samp/hack_sentence.cgi 検索例:SEOの10ステップと...←うろ覚えタイトル ) ■■■長い文をそのまま検索キーとして Web 検索する どこかからコピペしてきた長い文をそのまま Yahoo! で検索しても ヒットしないことが多いです。 そういう場合

  • [を] Yahoo!商品検索のRSSで商品検索サイトを作る

    Yahoo!商品検索のRSSで商品検索サイトを作る 2006-09-13-1 [YahooHacks] どんな検索サービスにも言えることですが、 検索結果のRSSが提供されているということは、 そのまま検索APIとして使えるということを意味しています。 てなわけで、今回の YahooHacks は、 Yahoo!商品検索(http://psearch.yahoo.co.jp/)のRSSを用いた 検索サイトの作り方です。 なお、「use CGI qw/-no_xhtml/;」としているのはバッドノウハウです。 バージョンの違いもあるかもだけど、start_html() で散々嫌な目に あったので。 今回は、CGI.pm で昔ながらの方法を使って書いてみたのですが、 前述のバッドノウハウも含め、なんか疲れますね。普段はテンプレートを 使っています。そういうサンプルも今後

  • [を] 指定した URL へのリンクのアンカーテキストを収集する

    指定した URL へのリンクのアンカーテキストを収集する 2006-09-12-1 [YahooHacks] 今回の YahooHacks は「アンカーテキストの収集」です。 とはいえ、文字コードにはまったー! 「./hack_anchor.pl http://www.yahoo.co.jp/」を実行すると、 「UTF-16LE:Malformed LO surrogate dab3 at /usr/lib/perl/...」 などと怒られて落ちるのですが(環境によって異なるみたい…)、 これを skip するにはどうしたら良いのでしょうか? とりあえず、decode のところを eval してみました…。 ■■■あるページへのリンクのアンカーテキストを収集する 同じページを指すハイパーリンクのアンカーテキストにはいろいろと バリエーションがあります。 例えば、 ht

  • [を] Yahoo! APIでサイトに含まれるページ数を知る

    Yahoo! APIでサイトに含まれるページ数を知る 2006-09-11-1 [YahooHacks] 今回の YahooHacks は、あるサイトに含まれるページ数を知る方法です。 「http://d.hatena.ne.jp に含まれるページ数」ではなく、 「http://d.hatena.ne.jp/yto に含まれるページ数」が知りたいというの が動機です。ホスト指定でなく、URL指定。 とはいえ、当然のことながらインデックスされているページ数しかわかり ませんよ。 あと、いまいち inurl の使い方が分かっていないところがあるので、 内容は不正確です。何か情報ありましたら、お願いします。 それではどうぞ: ■■■あるサイトに含まれるページ数を知る あるサイトに含まれるページ数を知るにはどうしたらよいでしょう。 そのサイトに含まれるページ数=ヤフーにイン

  • [を] あるページの検索インデックスへの登録の有無

    あるページの検索インデックスへの登録の有無 2006-09-10-1 [YahooHacks] 今回の YahooHacks は、 「あるページがヤフーの検索インデックスへ登録されているかどうか」 を調べる方法についてです。 ■■■あるページの検索インデックスへの登録の有無を調べる あるページがヤフーの検索インデックスに登録されているかどうかを知り たい!ということがときどきあります。 ■クエリー構文「url:」 ヤフーWeb検索では、クエリー構文「url:」を使い、そのページの URL を 指定すると、インデックスに登録されているか否かを知ることができます。 登録されていれば検索結果が表示されます。 http://search.yahoo.co.jp/search?p=url:http://nais.to/~yto/clog/ 「url:」を使って、URL のリス

  • [を] アマゾンの URL から ASIN を取得

    アマゾンの URL から ASIN を取得 2006-09-06-1 [Programming][Affiliate] tsupo さんのブログ記事、 「[観] アマゾンの URL から ASIN を取得する関数 getASIN()」 http://watcher.moe-nifty.com/memo/2006/09/_url_asin_getas_1a25.html を読んで、 URL に amazon.co.jp が含まれているなら、 /[B0-9][A-Z0-9]{9} みたいな単純なパターンにマッチさせるだけでも十分かな、と思いました。 (とはいえ、たぶん用途上、そう単純にできないのかも?) amazon 以外の URL に含まれる ASIN にマッチさせる場合は、 こんな正規表現でどうかなあ。前後にちょっと足しました。 [/=?&]([B0-9][A-Z0-9

  • [を] 形態素解析と検索APIとTF-IDFでキーワード抽出

    形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基中の基ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード

  • 1