タグ

ブックマーク / private.ceek.jp (3)

  • ML には smtp.gmail.com を使わない - Ceekz Logs (Move to y.ceek.jp)

    送信メールを Gmail に自動バックアップするために、送信メールサーバに smtp.gmail.com を利用していますが、注意が必要なことに気がつきました。 Gmail の場合 Message-ID が重複する場合、破棄しているようです(表示しないだけ?)。 同じメールが複数届かない(TO, CC, BCC に同じアドレスを入れても1通しか届かない)という利点があるのですが、送信・受信を区別しない Gmail の場合、例えば、送信先が ML であれば、送信メールと届くはずのメールとの Message-ID が同じなので、片方が破棄されます。後のメールが破棄されるようなので、投稿したメールが ML から届かないです。 友人が会長を務める会社の ML にポストしたときに気がつきました(自分に届かないから)。 ML に投稿する場合だけ、送信メールサーバに smtp.gmail.com を使わ

    vndn
    vndn 2007/03/14
  • MySQL + Namazu の原始的手法 - Ceekz Logs (Move to y.ceek.jp)

    MySQL + Namazu の原始的手法ということで、一時ファイルを書き出す方法で実装してみた。この方法だと mknmz をいじる必要がなく、とっても楽チンに実装できる。 手順は、下記のような感じ。 1. MySQL の内容を SELECT で取得 2. 一時ディレクトリに PRIMARY KEY を基にしたファイルを作る 3. mknmz で一時ディレクトリの中をインデックス化 CEEK.JP NEWS の場合だと、ファイル名の基となる PRIMARY KEY は、ページの URL となっています。一時ファイルは、普通に HTML を出力するようにしました。出力の形式は、自分でフィルターを作成してそれにあわせるのも良いのではないかと思う。 何十万というファイルを一気に書き出しているので、結構負担がかかっているんじゃないかと思う。これが原因で HDD が逝ったら嫌だなぁ。そうならないこと

  • EUC の正規表現 - Ceekz Logs (Move to y.ceek.jp)

    最近は、ニュース検索に新たな機能を追加しようと試行錯誤しています。 EUC の文字列が文字化けしていないかどうかをチェックする必要がありました。チェック自体は難しくなく、単に EUC の範囲外の文字が含まれているかどうかを調べればよいのです。 EUC の 1byte 文字は、以下のように表現することが出来ます。というか、すべての ASCII 文字 はこれ。 [\x00-\x7F] しかし、よくよく考えると、この表現には制御文字も含まれているんですよね。なので、このままマッチさせると文字化けを発見することが出来ないわけです。なので、制御文字を除いてマッチさせるのが吉だと思う。 [\x20-\x7E] ということで、僕は、以下のように定義して文字化けが無いかどうかを調べています。 $euc = '[\x20-\x7E]|[\x8E\xA1-\xFE][\xA1-\xFE]|\x8F[\xA1-

  • 1