タグ

ブックマーク / www.drk7.jp (23)

  • Perl で作る画像類似検索システムの考察

    今日はとてもショッキングな出来事がありました。あまりにショックがでかいので何かに没頭しなければ気が紛れそうにありません。と言うわけで全く専門分野でもないし当面使う予定もないのですが、1年ほど前にちょっと気になっていた画像の類似検索についていろいろ調べてみました。 どうやら ImgSeek ってソフトが結構有名らしいです。最新バージョンは 0.86 で Linux Only です。1つ前のバージョン 0.85 は Windows binary があります。 過去にいくつか画像類似検索ソフトを試したような記憶がありますが忘れてしまいました(vector でも結構類似検索ソフトありますね)。まずは windows binary 版をダウンロードしてきて実行してみました。 それなりに使えそうな予感がします。Linux 向けの imgSeek-0.8.6.tar.bz2 をダウンロードしてインストー

  • ワードサラダ技術について

    後半部分が重要で、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である ということです。 さて、実例です。たとえば次の文章を考えてみます。 「通信販売大手セシールは9日、生命保険の販売に格参入する方針を明らかにした。」 まず形態素解析するとこんな感じになります。 通信 名詞,サ変接続,*,*,*,*,通信,ツウシン,ツーシン 販売 名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ 大手 名詞,一般,*,*,*,*,大手,オオテ,オーテ セシール 名詞,固有名詞,組織,*,*,*,セシール,セシール,セシール は 助詞,係助詞,*,*,*,*,は,ハ,ワ 9 名詞,数,*,*,*,*,9,キュウ,キュー 日 名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ 、 記号,読点,*,*,*,*,、,、,、 生命 名詞,一般,*,*,*,*,生命,セイメイ,セイメイ 保険 名詞,一般

  • VMware が頻繁にディスクアクセスして OS 全体が固まる件

    こんな現象が発生するようになったのも XP + VMware 5 → Vista + VMware 6ベータ にしてからなのですが、物理メモリもたっぷりのっていて空きメモリもある状態にもかかわらず、VM を起ち上げていると頻繁にディスクアクセスが発生してマシンが数分間フリーズしたかのごとく固まる現象が続いています。 以前物理メモリが 2GB だった時は、まぁ〜しょうがないか〜と思っていたのですが今は 3GB のっていて(ホントは4GBだけど OS が 32bit なのでうまく認識しない・・・)コレは流石にキツイ。ってことで原因を調べてみました。 まずはリソースモニタを起ち上げて VM を使ってディスクアクセスが発生するのを待つ。すぐに発生した。 どうやら VMware の .vmem ってのが頻繁にディスクアクセス(read)を行っている模様。もう少し様子を見てみる。 こんどは頻繁にディス

  • Lighttpd 1.5 系がスゴイらしい

    はてブで lighty のブログがあることを知ってブログを見てみました。lighty の中の人が書いてます。 ナント、lighty 1.5 系が pre release されているではありませんか! なんでも、1.5 系は いままでより 80% のスループット向上が見込めると書かれています。激速の lighty が更に高速になるってわけですよ。Σ(゚Д゚; Using Async IO allows lighttpd it overlap file-operations. We send a IO-request for the file and get notified when it is ready. Instead of waiting for the file (as in the normal sendfile()) and blocking the server, we ca

  • Pound が Header Buffer を 2KByte しか確保しない不都合

    業の Web サーバの構成について以前書いた記憶もあるのですが、Lighttpd や Apache2 の mod_proxy が流行る前に構築したこともあって、ちょっとだけ Pound が流行った?時によくある構成で組んでます。ザックリ図にしてみると な感じになっています。で、前から薄々気がついてはいたのですが、この構成、致命的な欠陥があるんです。 その欠陥とは、pound の HTTP リクエストのヘッダ処理の実装にあります。pound のソースは適当にしか読んでいないので、間違ってる可能性もありますが、図にするとヘッダーのサイズ最大値の処理がこんな感じになっています。 ヘッダーの中でサイズが大きいと言えば、Cookie しかないですね。その Cookie に関しては RFC 2109 (set-cookieについて)と RFC 2965 (set-cookie2について)で定められて

  • ガスコンロの隙間をうめるすきまボードってのを買った

    ガスコンロやキッチンの作りに応じて高さが調節可能。フッ素樹脂加工がしてあるので、ガスコンロの表面と同じ雰囲気で統一感もあります。まぁ、高さが合わなければ、床に何か置けば高さは調節できるので何とかなります。 (※念のために可燃性の物を置くのはやめた方がよいと思いますが。) で、装着するとこんな感じのキッチンになります。 いいお家のキッチンならこんなことをしなくても綺麗に広々と使えるガスコンロ周りですが、古いタイプのお家でもガスコンロ周りを綺麗に広く使うことができるようになります。このすきまボードってやつ、奥様方にはかなりのオススメ! ※ガスの元栓が完全に隠れるので、ガス栓を閉めるときだけがメンドウです。ガスコンロメーカーの開発者の方が、もしもこの記事をみてましたら、是非とも可動式のすきまボード標準搭載ってなのを作って下さい。(上にかぱっと開けられる感じで) 売れると思いますよ。

  • 安くて契約が簡易なクレジットカード決済サービス一覧 :: Drk7jp

    会社のお仕事で、クレジットカード決済サービスを利用したデータ販売の話がありまして市場調査。契約とか煩雑なのは勘弁なので、ASP事業者と契約すればカード会社との契約が不要なタイプのサービスで比較的安価なものの一覧を作成してみました。 ネットでサービス比較一覧くらいでてるだろうと軽く思っていたら全くその手の情報が無かったので、ちまちま調べるハメになりました。せっかく作ったので、WEBで公開してみました。

  • 吉野家の牛丼より美味しい牛丼を目指すレシピ

    さて、このブログの一番人気とも言える記事は「吉野家の牛丼再現レシピ」なわけですが、一時期ハマリにハマッた吉牛再現レシピも最近は全く作らなくなったなぁ〜とふと思い、今週末は牛丼を作ろうと決めてました。 最近、はてブで人気の高かった「牛丼店の味を家庭で再現 牛丼の作り方 - [料理のABC]All About」なんかを見て、未だ牛丼の人気衰えずと思うばかり。 そんなんで、もう物の味も忘れてしまった感じもありますが、「吉野家の牛丼再現レシピ version 3α」を更に改良してみました。かなりウマイと思います。 材料(二人分) 牛肉薄切り(しゃぶしゃぶ用で脂身多め):160g 玉ねぎ(小)ざく切り:1個 汁材料1 牛脂:1かけ 玉ねぎ摺り下ろし:大さじ1 生姜汁:小さじ1 ガーリックパウダー:小さじ1/2 ネギ油:小さじ2 汁材料2 水:300cc 甘口白ワイン:10cc 固形ブイヨン:1/2

  • qmail の配信能力を極限まで引き出す方法(ログ関連)

    「syslog は I/O 負荷が高い → daemontool に移行しよう!」でも書きましたが、メール配信サービスのような用途の場合、メールサーバの配信ログってのは極めて重要。qmail の配信能力を極限まで引き出すには、様々なチューニングの中でも重要なのがログの出力。 そこで思いついたのがログの出力を RAMディスク上に出力するって方法。もちろんログの出力は daemontool 経由で。 もちろん出力したログは日時バッチでローカルディスク上にバックアップログとして保存。OS フリーズ等でメモリ上のログが失われるって可能性は許容するって要件で構築。 実際に業務で採用して速度の計測をしていたところ、 Intel(R) Xeon(TM) CPU 3.06GHz × 2、 メモリ4G (うち、RAMディスクは2G) なHW環境、 net-qmail ベースにいろいろな patch を適用し

  • 究極の油こし器「コスロン」が激しく良い

    どこの家庭にもある油こし器。これスーパーとかで普通に売っているヤツ。油は横から漏れるし、油こし紙(フィルター)を使っても、たった一回の揚げ物するだけで油がかなり汚くなりますよね。最近奥さんが買った、「コスロン」って油こし器が激しく良いんです。 2、3回の揚げ物をやっても全然問題なし。フィルターの性能が素晴らしく良いらしく、油がめちゃめちゃキレイになります。 今回は4回目の揚げ物を濾過した時の写真です。4回目だというのに、まだまだ余裕で油を再利用できます。 この油こし器は丸五産業株式会社って工業用フィルターを専門とする会社が工業用フィルタの性能を活かして油こし器に応用した製品で、一番の特徴は畳み一畳分にもなる200枚のフィルターを重ねた高性能フィルターにあります。 まぁ浄水器と同じで、フィルターの性能が良ければそれだけ綺麗な油が出てくる仕組み。その分、フィルターを通る時間は長く、油を入れてか

  • 名古屋流(風来坊をめざす)手羽先の作り方(レシピ)

    マッサージチェアを買ったことを名古屋の実家に電話していたら、名古屋流の手羽先がべたくなってきました。名古屋流の手羽先と言えば、山ちゃんか風来坊。どうやら、山ちゃんは関東にも進出してきているのでべようと思えばべることができます。(※飲みの時間専門です。昼やって内のが残念です。) まぁそんなわけで風来坊風を再現してみようと挑戦(ちょっと山ちゃん風も入ってるかも)。とは言え、今までに一度も作ったことがないのでネットで情報収集をはじめる。風来坊の門外不出のレシピは、風来坊自身が結構ヒントをだしてます。参考になるのはこんなサイトたち。 東海の味 TOKAI no Aji : 「風来坊の手羽先」の作り方を徹底追跡!! あいちまNAVI NAVI 〜手羽先からあげ〜 手羽先大好き! : 自家製手羽唐レシピ はなびし草の名古屋流手羽先 by はなびし草 [クックパッド]簡単おいしいみんなのレシピ

  • ちょい苦の美味しいゴーヤチャンプルの作り方(レシピ)

    材料 ゴーヤ:1 豚バラ肉(薄切り):150g 木綿豆腐:1丁 卵(溶き卵):1個 調味料 中華スープ(鶏ガラベース):大さじ2 酒:大さじ1 醤油:大さじ1 塩・胡椒:少々 ※中華スープはウェイパー小さじ0.5+熱湯大さじ2で代用できます。 調味料(仕上げ) 鰹節:適量 作り方(レシピ) まず始めに、木綿豆腐に水切り。キッチンペーパーに2重にくるんで、コップ2杯程度の水が入ったヤカンでも上からのせておきます。この料理に不要な水がしみ出てきます。20分程度でOKです。 次にゴーヤの下ごしらえ。頭とお尻を2cmほど切ったら縦に真っ二つに切り、スプーンで種とワタをキレイに取り除きます。5mm程度の厚さて輪切りにしたら大さじ1の塩で良くもみほぐして3分程度放置します。その間、沸騰したお湯を作ります。 沸騰したお湯で30秒〜1分程度ゴーヤを茹でます。ちょうど綺麗な緑色になったところで、ざるに揚げ

  • Catalyst の Catalyst::Helper::Model::CDBI でいつもハマる・・・orz

    何か、Catalyst をいろんな環境にインストールするたびに、Helper スクリプトを実行して、create model CDBI するといつも同じエラーで躓くので備忘録として記事にしておこうと思いました。 その1)Class::DBI::mysql をインストールし忘れる perl myapp_create.pl model CDBI CDBI dbi:mysql:WebService testid testpw exists "/home/apache/tmp/MyAPP/script/../lib/MyAPP/Model" exists "/home/apache/tmp/MyAPP/script/../t" created "/home/apache/tmp/MyAPP/script/../lib/MyAPP/Model/CDBI.pm" Couldn't require lo

  • 聘珍樓の杏仁豆腐「杏雲」を食べたら激ウマだった

    色づけとして、クコの実なんかあると格的っぽくて良い。熱湯を少なくして、牛乳を多くすると、まろやかさが更に増します。コクを更に加えたいときは、植物性生クリームを加えると良いと思います。フルーツのトッピングは杏仁の香りが飛ばない程度が良いと思います。 あと、牛乳によっても結構味が変わると思います。僕が使ったのは森永の美味しい牛乳。脂肪分が高めでコクがある牛乳です。 さて、お味の方ですが正直ビックリしました。まさか、普通のスーパーで手に入るインスタントの杏仁豆腐がココまで進化しているとは思いませんでした。そこらの中華料理店でべるあん仁豆腐よりよっぽど美味しいし、杏仁の香りも遙かに上です。 なにより、商品名の「杏雲」から想像できるとおり、雲のような感で、口に入れると溶けて無くなります。後には杏仁の香りが口中に広がります。シロップにも杏仁エキスが入っているのでシロップだけでも旨いんです。 買い

  • SimpleAPI の仕組みについて考察してみる

    最近気になっているサービスと言えば、一躍有名になった「SimpleAPI その1.ウェブサイトサムネイル作成API β版」っていうサービス。その1って書いてあるくらいだから、作者の方はその2、その3を考案中と思われるわけですが、サイトのサムネイルを生成するってのはいろいろなところで役に立ちそうな気がします。 で、できれば自社で同じような仕組みを作って自社で解決したいと思われている方も多くいるのでは?と思います。僕的には会社の仕事からすれば何ら関連のないジャンルのサービスですが、個人的には非常に興味がそそられるサービスなので、その仕組みについて考察してみました。勝手な考察なので、全然違う可能性もあるので、あしからず・・・。 どうやってサイトのサムネイルを生成しているのか? 自前で位置からブラウザの描画を模倣するプログラムってのは作るには敷居が高すぎると直感。特に CSSJavaScri

    overlast
    overlast 2006/04/06
  • Lightbox Plus で画像を同一画面にオーバーレイして表示 :: Drk7jp

    前からやろうやろうと思っていたことなのですが、サムネイルをクリックしたときに別画面を起ち上げて元画像を表示するのではなくて、同一画面上にレイヤー重ねて表示したいと思ってました。世の中には便利 Javascript が公開されていまして、メジャーどころで言えば、Lightbox JS ってやつがそうです。 使い方を丁寧に説明してあるサイトで有名どころは、「小粋空間: Lightbox JS で画像を表示する」あたりでしょうか。僕的には Lightbox を更に拡張した Lightbox Plus を入れることにしました。

  • XML2JSON + LWWS で導入簡単なお天気 JavaScript

    XML2JSON サービスは、最近はあふれかえるほど存在する Web service をより簡単に使うための道具な訳ですが、リリースしたまま放置状態が長い間続いてしまったので、XML2JSON ってなんのために存在するのだろう??って思っていた方も多いかと思います。 今週末はちょっと時間ができたので、Livedoor Weather Web Service を使って自分のサイトにお天気情報を表示する JavaScript ツールを作ってみました。当サイトで配布している MTWeather と違って、Movable Type 以外のサイトにも設置頂けます。 お天気好きな方は、どうぞご利用下さい。近いうちに、Japan Weather Forecast xml 版も作るので、降水確率や週間予報が欲しい方は今しばらくお待ちを。 導入方法についての説明 JavaScript 一式をインストールする

  • MT の個別ページに Javascript でカテゴリー別の最新記事を表示

    Movable Type の個別ページ(Individual Entry Archive)のテンプレートで、最近の記事一覧を表示するテンプレートとして、下記のようなタグがデフォルトで入っているかと思います。 <MTEntries lastn="10"> <a href="<$MTEntryPermalink$>"><$MTEntryTitle$></a><br /> </MTEntries> 当然ながら、静的な html が生成されるので、記事を書いた時点もしくは再構築をした時点での最新記事が表示されることになります。ですが、常に最新の記事を表示したいと思うのがブロガーとしての当然の心理。ちょっと調べてみますと、「ブログ(MovableType)の個別ページに、Javascriptで最新記事を表示:Goodpic」ってのが見つかります。 この方法、UTF-8 なブログであれば問題なく上手く

    overlast
    overlast 2006/03/08
  • Amazon Search のコンテンツ解析ロジックをリファクタリング中

    Amazon Search サービスを開始してから約2年になりました。開始始めは 2004 年 03 月 07 日らしいんですが、自分でも覚えていません・・・ 細かい修正を含めるて数えてみたら、52回目のバージョンアップになりますが、サーバの計算力も Pentium 4 から Athlon 64 X2 と大幅に向上したこともあり、コンテンツ解析部分の計算量を増やして、より適合度の高い関連商品が選択されるようにしてみました。 前より良くなってますよね? (なってなかったらごめんなさい・・・) ※新しいエントリーもしくは古いキャッシュが消えるまでお待ち頂いてからご確認ください。 さて、計算量を増やす代わりに、形態素解析を ChaSen (茶筌)から MeCab に変更しました。MeCab は ChaSen の3〜4倍程度は高速に動作するので、全体としては速度的に速くなっているかもしれません。

  • Lighttpd でエラーコード別に表示する html を変更する方法

    Apache から Lighttpd に変更する際に、httpd.conf に相当する lighttpd.conf 向けにいろいろ設定を移行(変更)する必要がありますが、ずーっと気になっていたことがありました。 Apache ではエラー画面をかっこうよく見せるために、ErrorDocument ディレクティブなるものが存在します。具体的にはこんな風に書きます。 ErrorDocument 500 http://foo.example.com/cgi-bin/tester ErrorDocument 404 /cgi-bin/bad_urls.pl ErrorDocument 401 /subscription_info.html ErrorDocument 403 "Sorry can't allow you access today"