タグ

ブックマーク / nais.to/~yto (12)

  • [を] Baiduよけ

    Baiduよけ 2006-10-18-1 [WebTool][Tips] 中国の検索エンジン「百度」(Baidu)のクローラは元気が良すぎて困る。 今のところ利点はないのでクロールを拒否しておくことに。 そりゃまあ、百度から日語での検索もできないことはないですけど、 そもそも日語向けじゃないから精度は問題外。 - だめな例:パンク(ンはストップワードか?) - 少しは見れる例:東京タワー アクセスログに残っていたURL「网頁搜索幇助-禁止搜索引??収録的方法」 (http://www.baidu.com/search/robots.html) を見てみると、普通の robots.txt の書き方が書いてあった。で、下記を robots.txt に追加。 User-agent: baiduspider Disallow: しかし、この Baiduspider、なかなか

  • [を] 下流喰い―消費者金融の実態

    下流喰い―消費者金融の実態 2006-10-05-5 [書評・感想][Money] ■須田慎一郎 / 下流喰い―消費者金融の実態 「下流喰い」読了。おそろしい世界です。 幸運なことに、今まで消費者金融のお世話になることなしに暮らして きました。しかしこのご時世、これから先はどうなるか分かりません。 とはいえ、絶対に、これからも借りずに生きていきたい、と思いました。 以上、感想文。 以下、読書メモ: 消費者金融の利用者数は2004年の一年間で2000万人突破。 平均借入額は101万円。 2002年度消費者金融。新規顧客の71.8%が男性。年齢は30未満が44.1%、 30〜40が23%。年収は、500万未満が81.2%(400万未満が65.3%、300万未満 が41.9%、200万未満が16.6%)。これらから、主たる顧客層は 「低収入の若年男性」へシフトしているこ

  • [を] ダジャレ脳の弊害

    ダジャレ脳の弊害 2005-12-06-1 [駄洒落] 笑うネタではなくて真面目な話。 気をつけなくてはと肝に銘じています。 「今市もイマイチ」和歌山市長が議会答弁、陳謝へ <http://www.yomiuri.co.jp/national/news/20051205i115.htm> 「広島もかなり郊外だし、栃木の今市もいまいち。そういうところで 事件が相次いでいる。我々の街も、全く人ごとでない」と答弁した。 駄洒落抑止力[2001-09-24-3]がないと、真面目な発言に勝手にダジャレが 紛れ込んでしまう危険性があります。相手が気づかなければ、何事もなく、 人間関係もギクシャクせずにすみます。しかし、無意識に出てしまう ダジャレはベタなものがほとんどです。一般に、ベタなダジャレほど 多くの人に認識されやすく、スルーされにくいのです。 結局このような場面では最大

    shoma
    shoma 2006/09/28
    オヤジがオヤジたる由縁は抑止力不足
  • [を] Perl でのデバグ用のダンプ

    Perl でのデバグ用のダンプ 2006-09-15-4 [Programming] 「Perl Hacks」よりデバグ用のダンプの話。 Data::Dumper をよく使っていたが、よりデバグに適したモジュール Dumpvalue を知った(p.182, HACK#71)。よさげなので活用するつもり。 以下、自分用メモを兼ねたサンプルコードと実行例: % cat dumpvalue-test.pl #!/usr/bin/perl use strict; use warnings; use Dumpvalue; my $d = Dumpvalue->new(); my @array = ({foo => ["One", "Two"], bar => "Hello"}, {foo => ["Hi", "Hu", "Mi"]}, {foo => ["ABCD", "EFG"], ba

  • [を] Yahoo!APIを使ったアダルトページ判定

    Yahoo!APIを使ったアダルトページ判定 2006-09-09-2 [YahooHacks][Asamasearch] Asamasearch で使っている、 アダルトページ判定ロジックの解説を書いてみました。 参考:Yahoo!デベロッパーネットワーク (YDN) http://developer.yahoo.co.jp/ ちなみに、「my %seen;」からの5行は「Perl クックブック」に載っている よく知られたイディオムを改変して使ってます。 それではどうぞ: ■■■アダルトページの判定 ヤフー検索にはアダルトページフィルタ機能があります。 Yahoo!検索APIにおいてパラメータ adult_ok を 1 にすると、 アダルトコンテンツ入りの、 0 にするとアダルトコンテンツなしの検索結果になります。 デフォルトは 1 です。 この機能を使って、

    shoma
    shoma 2006/09/12
  • [を] オン・ザ・ロックス

  • [を] ボーダフォンでの英文スパムメール対策方法

    ボーダフォンでの英文スパムメール対策方法 2006-08-12-2 [悪] Vodafone でのスパムメールに困っているという話を書いたら[2006-08-11-1]、 こんな情報を頂きました。ありがとうございます。 URLを含むメールを全て受け取らない、という設定にしました。 ちょっと不便かもしれないけど、当面はこれで行きます。 英文による、薬物案内等に関する迷惑メールへの対策について|ボーダフォン http://www.vodafone.jp/information/announce/2006/20060811_1.html

  • 技術文書:くっつきトラックバック

    since 2004-06-29 山下達雄 はじめに この文書では、CSIを使って TrackBackを chalow で利用するための手順を解説します。 もちろん chalow 以外の Web日記・Weblogツールへも応用できます。 CSI(Client Side Include)とは、 JavaScript形式の情報ファイルをWebページに埋め込むという手法はです。 JavaScript feed とも呼ばれています。 私は「くっつき手法」と呼んでいます。 よく知られているSSI(Server Side Include)は サーバが元の Web ページに別データを埋め込む(サーバ側がインクルードする) ものですが、 CSIはクライアント(つまりブラウザ)が表示されたWebページに別データを埋め 込む(クライアント側がインクルードする)ものです。 Tra

  • [を] SICP読書会に行ってきました(7)

    SICP読書会に行ってきました(7) 2006-05-10-2 [Programming] SICP読書会に行ってきました。前回の参加は[2006-04-26-5]。 今回は月島某所のひろーいDK宅にて。 場所提供ありがとうございました。 夜分遅くお邪魔しました。コーヒーごちそうさまでした。 - 素人くさいSICP読書会 http://www.csus4.net/hiki/SICPReading/ http://www.csus4.net/hiki/SICPReading/?SICPReading012 - 計算機プログラムの構造と解釈 - 404 Blog Not Found:(いい) http://blog.livedoor.jp/dankogai/archives/50489679.html) 今回の内容は、アキュムレーション関数の一般化。 来週はいよいよ、

  • [を] 内側から見た富士通「成果主義」の崩壊、読書メモ蔵出し

    内側から見た富士通「成果主義」の崩壊、読書メモ蔵出し 2006-05-04-2 [書評・感想][仕事] ■内側から見た富士通「成果主義」の崩壊 富士通の「成果主義」の「弊害」にスポットを当てたです。 読んだ当時[2004-08-03-4]、読書メモの公開は見送っていたのですが (mixi日記には書いた)、環境も変わって久しいので公開しておきます。 このに書いてあることが「正しい」との保証もありませんし、 さらに最近の富士通社内事情は分かりませんので、 この読書メモでは「こういうことが述べられたがあった」という 情報のみの提供です。ご了承下さい。 § 基:目標を立てる。上司承認。期末に評価。 目標の達成度によりSA,A,B,C,Eの評価が上司から与えられる。 絶対評価を標榜していたが実際は相対評価だった。 「評価」の割り当ては最初から決まっている。 「お前

    shoma
    shoma 2006/05/08
    富士通の評価体系の話
  • [を] 各都道府県の人口に占めるネットユーザーの割合は?

    各都道府県の人口に占めるネットユーザーの割合は? 2005-12-14-1 ITmediaニュース:ネットユーザーが一番少ない県は…… <http://www.itmedia.co.jp/news/articles/0512/14/news049.html> - 推定ユーザー数全国構成比シェア(%)1 東京 17.232 神奈川8.463 大阪 7.774 愛知 5.525 埼玉 5.17- - -43 山梨 0.5344 鳥取 0.5245 徳島 0.5146 島根 0.4747 佐賀 0.39 ふむふむ。 しかし、ITmediaニュースに対するはてなブックマークのコメントに <http://b.hatena.ne.jp/entry/http://www.itmedia.co.jp/news/ articles/0512/14/news049.html> 2005年12月

  • [を] 形態素解析と検索APIとTF-IDFでキーワード抽出

    形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基中の基ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほどその単語が代表キーワードっぽいということでよろしく。) TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード

  • 1