タグ

ブックマーク / nais.to/~yto (13)

  • [を] 裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する

    裏で形態素解析器を使い長い文をそのままキーとしてWeb検索する 2006-09-17-1 [YahooHacks][NLP] 今回の YahooHacks は、 長い文を検索キーとしてWeb検索をするというハックです。 一年前の検索会議[2005-09-30-3]で紹介しましたが、 今回ゼロから書き直しました。 サンプルコードが長くなってしまってすいません…。 (一時的にデモを置いておきます。そのうち消えます。ご了承下さい。 http://nais.to/~yto/tmp/yahoohacks-samp/hack_sentence.cgi 検索例:SEOの10ステップと...←うろ覚えタイトル ) ■■■長い文をそのまま検索キーとして Web 検索する どこかからコピペしてきた長い文をそのまま Yahoo! で検索しても ヒットしないことが多いです。 そういう場合

    shidho
    shidho 2006/09/17
    どうなんだろう。アイデアはおもしろいけど。
  • [を] 若者はなぜ3年で辞めるのか?

    若者はなぜ3年で辞めるのか? 2006-09-16-3 [書評・感想][仕事] 『内側から見た富士通「成果主義」の崩壊』[2006-05-04-2]の 著者城繁幸による、主に「若者」まわりの労働環境とかそういうテーマの。 就職前の人、入社したての人で「仕事」について興味ある人は読むとよい! (ref. [を] 3年で辞めちゃう?[2006-09-14-3]) ■城繁幸 / 若者はなぜ3年で辞めるのか? 年功序列が奪う日の未来 いろいろ考えさせられました。 ということで、以下メモ: 若者の離職率が増加。 →原因の多くは人の希望と業務内容のミスマッチ。 →古い人「最初からやりたいことができるという考えが甘い。忍耐重要。」 →but (1)就職の選考が厳しくなった。分、期待も大きく。 (2)年功序列も崩れ忍耐が報われない。 離職率。大卒入社3年以内で36.5%(2

    shidho
    shidho 2006/09/17
    気に入らない仕事をやらせられているなら、気に入る仕事を探せ、ということなのかどうか。
  • [を] Perlで素数判定と近隣素数の探索

    Perlで素数判定と近隣素数の探索 2006-08-15-2 [Programming][Algorithm] ハッシュのサイズを決める際に、 ある数に近い素数が欲しいと思うことがあったりします。 例えば「1000000に近い素数が欲しい!」など。 ということでPerl版の素数判定&近隣素数探索プログラムです。 素数判定は下記を参考にしました。 - 素数判定 - Wikipedia http://ja.wikipedia.org/wiki/%E7%B4%A0%E6%95%B0%E5%88%A4%E5%AE%9A 以下、ソースと実行例。 ソース(prime.pl): #!/usr/bin/perl use strict; use warnings; my $n = shift @ARGV; my $prime = is_prime($n); if ($prime) { p

    shidho
    shidho 2006/08/16
    けっきょくエラトステネスのふるいなんだ。$iを2乗するところがスピードネックになりそうなんだが。
  • [を] 地下鉄の路線図みたいに通りの名前が一目で分かる地図が欲しい

    地下鉄の路線図みたいに通りの名前が一目で分かる地図が欲しい 2006-07-26-5 東京には、明治通り・六木通り・青山通りなど名前が付いた通りがいろ いろありますが、どこからどこまでなのかいまいちよく分かりません。 通りの名前と範囲が一目で分かる地図が載っているサイトを探しています。 あと246などのメジャーな国道なんかも載ってると嬉しいです。 それと○○街道(中原街道、甲州街道)とかも。 地下鉄路線図みたいに色づけされてると分かりやすいんだけどなあ。 Wikipedia には情報がいろいろあるんですが、個別ページになっていて 分かりづらいです。地図も欲しい。 - 例:国道246号(青山通り から転送) http://ja.wikipedia.org/wiki/%E9%9D%92%E5%B1%B1%E9%80%9A%E3%82%8A もうちょっと調べてみると、「○

    shidho
    shidho 2006/07/27
    とりあえず、北区の地図を見て、住所表記の通り基準化は無理っぽいと思った。
  • [を] 町や村は必ず郡に属するかと思ったら例外があった

    町や村は必ず郡に属するかと思ったら例外があった 2006-05-14-6 [地理] ズームイン郵便番号検索 (サービス終了) に関連した話。 町や村は必ず郡に属するものかと思っていたのですが、例外がありました。 - 東京都大島大島町 - 東京都利島利島村 - 東京都新島新島村 - 東京都神津島神津島村 - 東京都三宅島三宅村 - 東京都御蔵島御蔵島村 - 東京都八丈島八丈町 - 東京都青ケ島青ケ島村 - 東京都小笠原諸島小笠原村 聞いた話によると、品川ナンバーだそうです。 というわけで、区市町村にマッチする正規表現を書きなおしました。

    shidho
    shidho 2006/05/16
    品川ナンバーなことと郡がないのは関係ないと思うが、大島町が郡に所属してないのは確かにそう。大島支庁だっけ?
  • [を] Firefox で使える favicon エディタ

    Firefox で使える favicon エディタ 2006-04-17-3 [WebTool] JavaScriptでfaviconエディタ(Firefox) | weblog | 東京嫉妬 http://tokyoenvious.xrea.jp/b/b/javascript/favicon_editor.html JavaScript Favicon Generator http://tokyoenvious.xrea.jp/javascript/favicon/ 某氏から、Firefox で使える favicon エディタを教えてもらいました。 Firefox ならこれで favicon がプチプチと作成できます。 手軽です。favicon.ico の格作成の前にはこれで! ref. [を] 久しぶりにfaviconを作った[2006-04-16-2]

    shidho
    shidho 2006/04/18
    保存出来るの?
  • [を] Perl による Suffix Array の実装

    Perl による Suffix Array の実装 2006-04-10-2 [Programming][Algorithm] 昔作った「Perlによるsuffix arrayの実装」を発掘したので公開しておき ます。 ソースコードです。 #!/usr/bin/perl -w use strict; my $t = "mississippi"; # Text - 対象テキスト my @sa = (0..length($t)-1); # Suffix Array - 初期設定 ### Suffix Array の作成 @sa = sort {substr($t, $a) cmp substr($t, $b)} @sa; # テスト出力 for (0..$#sa) { print "$_ $sa[$_] ",substr($t, $sa[$_]),"\n"; } ### バイナリサーチ

    shidho
    shidho 2006/04/12
    Suffix Arrayの概要と共に読み進めればいいや。
  • [を] 「みんなの意見」は案外正しかった!

    「みんなの意見」は案外正しかった! 2006-02-25-5 [書評・感想][Affiliate] 読了! ■ジェームズ・スロウィッキー / 「みんなの意見」は案外正しい フランシス・ゴールトンの調査の話から始まります。 見市で、一番近い値を予想した人に商品が与えられるという 雄牛の重量当てコンテストがあって、参加者は800人で、 で誰かが商品をゲットしたんだけどそれは置いといて、 ゴールトンが投票用紙から推測値を集めて平均値を出してみたら なんと実際の値とほぼぴったり! 実際は1198ポンド、予測は1197ポンド。 なるほど「みんなの意見」ってすごいなあ、 と思うもののちょっとまゆつば。 ということで実験してみました。 私の2006年1月のアフィリエイトAdSenseAmazon楽天、等)収入合計 を推測して下さい。みなさんの推測値の平均と実際の値との誤

    shidho
    shidho 2006/02/26
    余談なしの判断でなければそれは無理だと思うが。そして余談がなくても情報もなければ意見の出しようもない。ヒント:俺のアフィリエイトは月いくらもらってる?
  • [を] 転職の理由の添削

    転職の理由の添削 2006-01-04-3 [仕事] 転職の理由の一つとして、ステップアップしたい、というのがあるが、 かと言って「ここにはもう学ぶことはない」なんてのは悪い表現。 「ここにはもう学びたいことはない」と言うのが良いかと。 どんなところにも学ぶことはいくらでもある。 どんな人からも学ぶことはいくらでもある。 「学ぶことはない」などと言ってプライドを刺激してはいけない。 自分にとって学びたいか、だけがポイント。 どんな否定的な理由も、自己都合、嗜好の問題に変換しておくことが肝要。 辛口不要。 以上、誰にともなく、なんとなく偉そうにお送りしました。っと。 Referrer (Inside): [2006-01-05-4]

    shidho
    shidho 2006/01/05
    参考にします。
  • [を] アドセンス狩りの被害が減らないわけ

    アドセンス狩りの被害が減らないわけ 2005-12-11-1 [Affiliate] 結論から言うと、アドセンス狩りの被害が減らないのは、 「Google AdSenseが日のコンテンツ連動広告を独占しているから」 。 別に目新しい意見ではありませんが。 あるサイトのGoogle AdSenseの広告を大量にクリック(人手 or 自動) すると、不正クリックとみなされ、そのサイトオーナーに一方的に AdSense契約破棄が言い渡されます(警告なしでいきなり破棄)。 これを嫌がらせで、つまり「攻撃対象のサイトの広告を大量クリックして 契約破棄に持ち込み収入源を断つ」という目的でやるのが、 いわゆる「アドセンス狩り」と呼ばれるものです。 最近では、著名なPerlハッカーであるDan Kogaiさんが被害にあった模様。 - 404 Blog Not Found:AdSen

    shidho
    shidho 2005/12/12
    どこでも独占は弊害か。
  • 『100 円ショップで買って良かったもの』

    shidho
    shidho 2005/11/25
    100円ショップでなくても100円で売っているものにも注目するといいかも。
  • [を] 働き者と怠け者の割合について

    働き者と怠け者の割合について 2005-08-07-1 [仕事] 働きアリの話ってよく聞きますよね。 優秀なアリだけ選抜しても、怠けアリだけ取り除いても、 結局それらの割合は変わらない、などという話。 例えば以下にある話: - 「80対20」革命! - [起業・独立開業]All About <http://allabout.co.jp/career/entrepreneur/closeup/CU20030315Abb/> 例えば、働きアリの集団でも当に一生懸命に仕事をするのは2割で、残 りの8割のアリたちは、仕事を怠けているどうです。[...] 試しに、働いている2割のアリと、怠けている8割のアリを分けてみます。 するとまじめに働いていた集団の8割が怠け始めるそうです。反対に、怠 け者のアリの集団では、2割が働き始めるそうです。 つまり集団をどう選んでも、やがて全

    shidho
    shidho 2005/08/08
    ふーん。ウソというか、定説が固まってない状態なんだなまだ。
  • [を] 右クリック画像保存を禁止する方法

    右クリック画像保存を禁止する方法 2005-07-02-2 [Tips] Flickr (http://www.flickr.com/) では、 右クリックによる保存ができない画像があります。 正確にはローカルに保存するとダミーの画像になってしまいます。 仕組みは簡単。ダミー画像を重ねているだけ。 コピペして試せるようにエッセンスだけ抽出: <img src="http://chalow.net/image/yto-logo-hou.png" width="318" height="81"><img style="position:relative; top:-83px; margin-bottom:-83px; display:block;" width="320" height="83" src="http://chalow.net/image/1x1.gif"> お試しあ

    shidho
    shidho 2005/07/03
    重ねて表示、はまた別の用途に使えると思うな。
  • 1