タグ

ブックマーク / nais.to/~yto (59)

  • [を] Introduction to Information Retrieval

    Introduction to Information Retrieval 2007-01-23-5 [][Algorithm] Introduction to Information Retrieval http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html 「Christopher D. Manning, Prabhakar Raghavan and Hinrich Schu"tze, Introduction to Information Retrieval, Cambridge University Press. 2007.」 の中身が、つまり一冊分の内容が PDF で公開されている。 A preliminary version of the book is available

  • [を] Dynamic Programming による類似文字列マッチの実装例

    Dynamic Programming による類似文字列マッチの実装例 2007-01-22-4 [Programming][Algorithm] 「Modern Information Retrieval」(8.6.1 p.216) での Dynamic Programming (DP) の解説のところのアルゴリズムを 素直に Perl で実装したみた。 さらにマッチ箇所取り出しロジックも実装してみた。 DP はいわゆる「類似文字列検索(あいまい検索)」に使うと 便利なアルゴリズム。 実は、大学院でも前の会社でも、PerlやらC++やらで実装して使ってた。 単純ながら使い勝手もよく、まさに現場向きかと。 grep 式に頭から見ていくので計算量的にはイマイチなのだが、 転置インデックス検索などで範囲を絞ってから適用すれば実用上問題ない。 ■定義みたいなの Q1. 二

  • [を] アマゾンリストマニア検索サイト「リストマニャ」公開!

    アマゾンリストマニア検索サイト「リストマニャ」公開! 2007-01-21-1 [Listmanya][Affiliate] Yahoo! Web検索経由でアマゾンの「リストマニア」を キーワード検索できる商品情報検索サイト「リストマニャ」 を公開しました。 アマゾンリストマニア検索サイト「リストマニャ」 http://lm.yasazon.com/ リストマニアを網羅的にキーワード検索する機能が amazon に見当たらな かったので(AWS[2007-01-19-3]でもできなげ)作ってみました。 ロジックはヤサゾン(http://yasazon.com/)と同じです。 つまり、リストマニャはヤサゾンの姉妹サイトなのです。 というわけで、よろしくお願いします。 あと、アフィリエイターの方にも朗報! 検索結果 URL にあなたのアソシエイト ID が指定できます。

  • [を] レバレッジ・リーディング

    レバレッジ・リーディング 2007-01-07-3 [書評・感想][LifeHacks] ■田直之 / レバレッジ・リーディング 著者は「読書投資活動である」と潔くワリキリ。 しかも、非常に割の良い投資であり、投資に対して利益が100倍、と。 数字はともかく、読書ほど格安な投資はないのです! 「忙しくて読むヒマがない」という意見に対しては、 「を読まないから時間がない」のである、とバッサリ。そのわけは: ビジネス書には、努力の末に成功した人がその知識やノウハウを 書いたものがたくさんあります。[...] を書いた人が何年も何十年もかけて体得したノウハウを、 わずか一冊のを読むだけで手に入れることができるのです。 そのうえで自分なりの工夫を加えれば、早く、少ない労力で、 成功にたどり着ける。その結果、時間の余裕が生まれるというわけです。 「読む技術」の解説

  • [を] テキストマイニングを使う技術/作る技術

    テキストマイニングを使う技術/作る技術 2006-12-28-3 [書評・感想] テキストマイニングの分野で有名なIBMの那須川哲哉氏による入門書。 全編具体的で分かりやすい。 ■那須川哲哉 / テキストマイニングを使う技術/作る技術 ―基礎技術と適用事例から導く質と活用法 テキストマイニングというと、ブログや掲示板での特定の何かの評判情報 検索など、近年その活躍の場が一般ユーザの目に付くところまで広がって 来ている。 このはテキストマイニングを支える技術、事例紹介、技術以外の側面 (運用など)はもちろん、「テキストマイニングとは何か」ということ についても初心者にも分かりやすいよう、かなり丁寧に解説されている。 一番重要なポイントが最初の方で述べられてる。これ、大切。 [...]テキストマイニングというものは、あくまで人間が膨大な文書データ を有効活用するた

  • [を] 「ウェブ人間論」の読書メモ

    「ウェブ人間論」の読書メモ 2006-12-23-3 [書評・感想] ■梅田望夫, 平野啓一郎 / ウェブ人間論 読了。いろいろとわくわくする話があり、楽しめました。 書の流れは置いておいて、個人的に気になる箇所を適当に ピックアップしてコメント(三色ボールペンで言うと緑): 自分より年上の人と過ごす時間を減らし、若い人たちと過ごす時間を 増やすという決断をしたという梅田さん。 梅田 ...背中を押してくれたのは『葬送』にあった言葉でした。 主人公のドラクロワが、自分の絵が未来に残るためには自分より若い人た ちが評価してくれなければならない、という確信する場面があったと思い ますが、あれにすごく啓示を受けた。... (p.14) これは私も感じますね。 これに関してはいろいろ書きたいことがあるが、まあ何年かしてから。 梅田 だから、グーグルが実現させるぞと表明し

  • [を] スルー力には二種類ある

    スルー力には二種類ある 2006-12-06-3 [ネタ] 「jkondoの日記 - スルー力なんて無くていい」 (http://d.hatena.ne.jp/jkondo/20061205/1165365107) を読んで、 「スルー力」には (1) 自分に対するどうでもいい批判をスルーする力 (2) 世の中にあふれるどうでもいいネタをスルーする力 の二種類があって、 …という話を書こうと思うも、後者のスルー力を発揮し、書かないことに。 …というありがちな展開。ああ、ベタ。 ref. http://0xcc.net/blog/archives/000133.html Referrer (Inside): [2007-07-01-2] [2007-03-05-5] [2006-12-23-3]

    j708
    j708 2006/12/07
  • [を] アマゾンのトラッキングIDが簡単に増やせるように!

    アマゾンのトラッキングIDが簡単に増やせるように! 2006-12-05-6 [Affiliate] amazon アソシエイト・セントラルから 「アカウントサービス」→「トラッキングIDの管理」 で、簡単にトラッキングIDが追加できます。 今までは、 わざわざ申請して返事を待たなきゃいけなくてちょっと面倒なうえ、 hoge-1-22 みたいに間に数字が入ったのしか取れなかったけど、 これはかなり良いかも! - Amazon アソシエイト・プログラム ブログ: トラフィック分析ツール、トラッキングID http://affiliate-blog.amazon.co.jp/2006/11/id.html 追記061206: もうちょっと詳しい解説を書いてみました。 ■ちょっと前までの「アソシエイトID」と「トラッキングID」 アソシエイトIDは、 hoge-22 の

  • [を] ASINUKI

    ASINUKI 2006-11-24-6 [Affiliate][Programming] こんなのどうかな。みんな使うかなあ。 入力されたテキストに含まれている ASIN を抜き出して、 アフィリエイト用のコードを生成するだけのツールなんだけど。 ASINUKI http://nais.to/tools/asinuki.cgi 入力テキストは、URLとかHTMLコードとかメールのテキストとかね。 試しにアマゾンのページのHTMLコードのとか入れてみると良いかも。 アソシエイトIDを指定して呼び出すときは下記のように aid で。 http://nais.to/tools/asinuki.cgi?aid=137439-22 一応ソースも公開しておきますね。バカらしいほどシンプル。 http://nais.to/tools/asinuki_cgi.txt (なお、IS

  • [を] 世間のウソ

    世間のウソ 2006-11-15-3 [書評・感想] ■日垣隆 / 世間のウソ 世間のウソいろいろ。ふむふむなるほどな。 いくつかメモ: 「宝くじは買わなければ当たらない」というのは 「外に出なければ轢き殺されない」と質的には違わない、と。 交通事故で死んだり大怪我をするほうが、92651倍も可能性が高いらしい。 (まあ細かい数字はともかく)。 あと、裁判員制度で裁判員に指名される確率は宝くじで1000万当たる確率 に匹敵するとのこと。 それと驚いたのは、公営ギャンブルって、各省庁がそれぞれやっているっ てこと。 - 宝くじ:総務省。 - 競馬:農林水産省と地方自治体。 - パチンコ:警察庁。 - 競輪:経済産業省。 - オートレース:経済産業省。 - 競艇:国土交通省。 - サッカーくじ:文部科学省。 これは手放せないだろうなあ。 ギャンブル、

  • [を] 雨の降る日曜は幸福について考えよう

    雨の降る日曜は幸福について考えよう 2006-11-11-4 [書評・感想][Money] 朝から雨の土曜日。 このを読んで、雨の降る土曜に幸福について考えてみた。 まあ、雨は夕方にはやんだけど。 ■橘玲 / 雨の降る日曜は幸福について考えよう 橘玲(たちばなあきら)のエッセイ。 タイトルは自己啓発っぽいけど、さにあらず。 年金、医療、教育不動産など、人生における諸問題を経済の視点から 考えるです。前半は日経新聞日曜版に連載していたもの。連載当時、 ちょうど日経新聞をとっていたのでよく読んでました。後半は書き下ろし。 3年前に読んで衝撃を受けた「お金持ちになれる黄金の羽根の拾い方」 [2003-01-31-2]とともにオススメです。いや、ほんと、視界がちょっと 広がる感じ。しんみりしたりもします。読むべし! 以下、読書メモ。 筋と関係あることやないこと

  • [を] UTF-8 で半角カナを判定

    UTF-8 で半角カナを判定 2006-11-09-3 [Programming] PerlUTF-8 で半角カナを判定するには、 顔文字みたいな正規表現を使うと良いみたい。 なお、下記では全角になっていますが、「。」「゜」は半角です。 print if /[。-゜]/; 以下、確認スクリプト utf8hankana-test.pl。 begin 755 utf8hankana-test.pl.gz M'XL("+7C4D4``W5T9CAH86YK86YA+71E<W0N<&P`1<_)2L-@$,#Q^SS%9[Q8 ML>0J1H1"]>K!>'()M48-U"A)BP<1M.[5NN];L>[[OFM]F"IXZROX5P\._&!F MF!F8XB(]X7MZB^/JW;87DV+UF4Y]'<SEDR?YP51)O5D3+`](PK>5'_><:-SX MS7L

    j708
    j708 2006/11/10
    [[?][XL][BP][QB][UO][3G][AMP][BEGIN][UTF-8][ML][print][MF][PK][test][Perl][SS][ss]
  • [を] 行動するだけで終わってしまう人

    行動するだけで終わってしまう人 2006-11-08-5 [仕事] 考えるだけ、言うだけで終わってしまう人よりは、 行動するだけの人の方を良しとするのが一般的ではありますが (成果評価を考えると、なにかしらやったもの勝ち)、 とんちんかんな人はいるみたいですね。 「仕事の禁句変換辞典」[2006-10-25-4]に載っている言い換え: とんちんかんな行動を繰り返す人 →情熱的に取り組む人 解説ストーリ(p.149)もおもしろ: 好奇心を満たすためなら、物怖じせずに、たとえ知らない人でも、 どんな地位の高い人でも訪ねていける。すばらしい行動力だ。しかし、 行動するだけで終わってしまう人がいる。[...] はじめは、その行動力を絶賛していた人も 「あれは結果として何になったの?」 「脈絡なく行動しているようにみえる」 と不満をまもなく口にし始めた。 関連: -

    j708
    j708 2006/11/09
  • [を] アメリカの古い地図がいっぱい

    アメリカの古い地図がいっぱい 2006-11-07-4 [地理] アメリカ(など)の古い地図がいっぱい。 こういうサイトって良いですね。 アメリカ史のを読むことがあったら参照しようかと。 - Map Collections Home Page http://memory.loc.gov/ammem/gmdhtml/gmdhome.html

  • [を] Perlのプロファイラ - Devel::DProf

    Perlのプロファイラ - Devel::DProf 2006-11-06-3 [Programming] Devel::DProf http://metatoys.org/propella/tips/Devel_DProf.html DProfの話は、「プログラミングPerl 第3版 VOLUME 1」の 第20章「Perlデバッガ」に載っています。 デバッガ(perl -de0)の話も詳しいです。 で、プロファイルの使い方。 例えば、foo.pl というプログラムをプロファイリング。 % perl -d:DProf foo.pl で、tmon.out というファイルができます。整形して見るには dprofpp。 % dprofpp Total Elapsed Time = 54.58411 Seconds User+System Time = 49.11048 Sec

  • [を] ネームドロッパー

    ネームドロッパー 2006-11-01-2 [ネタ] 百式の田口元さんのブログより: 恩師の教え:「Name Dropperにはなるな」 | i d e a * i d e a http://www.ideaxidea.com/archives/2006/10/name_dropper.html 「Name Dropper」とは「Name Droppingする人」という意味ですが、 平たく言うと「あ、俺、○○さん、知ってるよ、紹介するよ」 「あ、○○さんね、知ってる、知っている」「○○ さん?あぁ、 仲いいよ」とすぐ言う人のことです(と、個人的に理解してます)。 なるほど。 これ、説明するのにしっくりくる表現がなかったのですが (「ある種の権威主義」みたいな感じで表現したりしていました)、 ネームドロッパーと呼ぶのですね。 使ってみます。内輪で。 誰も知らない○○

    j708
    j708 2006/11/01
    [:link][background-color][margin][LOGO][border][COLOR][RED][name][TOP]
  • [を] ダジャレ脳の弊害

    ダジャレ脳の弊害 2005-12-06-1 [駄洒落] 笑うネタではなくて真面目な話。 気をつけなくてはと肝に銘じています。 「今市もイマイチ」和歌山市長が議会答弁、陳謝へ <http://www.yomiuri.co.jp/national/news/20051205i115.htm> 「広島もかなり郊外だし、栃木の今市もいまいち。そういうところで 事件が相次いでいる。我々の街も、全く人ごとでない」と答弁した。 駄洒落抑止力[2001-09-24-3]がないと、真面目な発言に勝手にダジャレが 紛れ込んでしまう危険性があります。相手が気づかなければ、何事もなく、 人間関係もギクシャクせずにすみます。しかし、無意識に出てしまう ダジャレはベタなものがほとんどです。一般に、ベタなダジャレほど 多くの人に認識されやすく、スルーされにくいのです。 結局このような場面では最大

    j708
    j708 2006/09/28
  • [を] Google マップに地下通路情報が

    Google マップに地下通路情報が 2006-09-26-1 [WebTool] Googleマップ(http://maps.google.co.jp/)に、いつの間にか、地下鉄の 出口だけじゃなく地下通路の情報がつきましたね。便利さアップですね。 都市部では地下通路情報は重要です。see [2005-10-03-3] 【規約違反の可能性があるため画像取り下げ】 ref. - Googleマップがまた進化--“日”に合わせて地図データを全面更新 http://japan.cnet.com/news/media/story/0,2000056023,20248507,00.htm Google Maps

  • [を] Text::MeCabは導入が楽

    Text::MeCabは導入が楽 2006-09-24-3 [Programming][NLP] Text::MeCabはCPANに登録されているMeCabのPerlモジュール。 - Daisuke Maki / Text-MeCab-0.13 - search.cpan.org http://search.cpan.org/~dmaki/Text-MeCab-0.13/ - きまぐれ日記: Text::MeCab が公開された http://chasen.org/~taku/blog/archives/2006/05/textmecab.html MeCab.pm [2006-02-25-4]よりもこっちの方がインストールが 手軽そうなので、サンプルプログラムに使おうかと。 インストール方法: MaCab体は事前にインストールしてあると仮定。 (取得はこちらから→

  • [を] Software Design 2006年10月号のPlagger特集のメモ

    Software Design 2006年10月号のPlagger特集のメモ 2006-09-24-1 [] Software Design (ソフトウエア デザイン) 2006年 10月号 [雑誌] posted with Yasazon (2006.09) 定価 : ¥ 970発売日 : 2006/09/16出版社/メーカー : 技術評論社 Plagger 特集より、インストールコマンドメモ (pp.78-81): wget http://www.perl.com/CPAN/src/perl-5.8.8.tar.bz2 bzip2 -dc perl-5.8.8.tar.bz2|tar xvf - cd perl-5.8.8 sh Configure -des -Dprefix=$HOME/perl make make install export PATH=$HOME/perl/