タグ

ブックマーク / txqz.net (10)

  • 電車の中で通話していたら切れられて強制下車させられたのを見た (2008-12-02)

    遅刻していつもより2遅い電車に乗りかえた。転換クロスシートの4人がけになっているところ(4C)に着席、向かいの窓側(3D)には男性が座っていて、携帯電話でいろんなところに電話をかけていた。なんでも、ストレスで腸が動かないくらいになり退職したので家族やお世話になった人に連絡して回っているらしい。私はかばんからノートパソコンを取り出してPHSにつなげ、低速インターネットを楽しんでいた。 駅間のやや長い区間になったので車掌が車内を巡回し始めた。もっとも車掌室寄りの車両だったので車掌はすぐに私の真横を通り過ぎた。そのまま次の車両へ行くのかと思いきや、向かいで電話をしている人に「車内での通話はご遠慮ください」みたいな注意をした。男性はすぐには通話をやめなかったが、通路を挟んで左奥(5A)に座っていた男性が「そうだやめろ」みたいなことを大声で叫んだので、電話氏はいったん通話を止めた。電話氏が通話をや

    Kiske
    Kiske 2008/12/04
    みんなtwitterでつぶやけば万事解決
  • PHPカンファレンス2008のメモ

    10時 「こうなる。」のリリースを翌日に控えているのにもかかわらず東京まで出張ってPHPカンファレンス2008に参加するなどした。京急の青物横丁~京急蒲田が新規乗車区間にカウントできた。京急蒲田駅が2面3線なのにまずびっくりした。京急蒲田は羽田空港へ向かう線と横浜へ向かう線の分岐駅で、どちらも非常に大量の列車が運行されている。品川から羽田空港行きの快特に乗ったのだが、降りたホームの発車案内に行き先と真反対にある地名が次の列車の行き先として表示されていてはじめてこの駅が2面3線であることに気づいた。これだけ厳しい条件でよく普通に運転できるなあ。平面交差分岐の通過車両数ランキングを作ったら、名鉄の枇杷島分岐点と京急蒲田駅のどちらが上位に来るのだろう。 鉄道話はこれくらいにしてカンファレンスの話。午前のセッションはメモし忘れたので午後から。 13時 まずIPAの人によるセキュリティの話。

  • Twitterのクラスタ間を結ぶもの (2008-05-21)

    Anonymous Twitterがクラスタ間のハブになるという話を以前読んだことがある。いま検索しても自分のブクマを見直しても該当エントリが見つからなかったのでアレだけど、だいたい以下のような話だった気がする。Twitterは人をフォローする点が話題単位の掲示板と異なり、さらにスレッドフロート式掲示板の「スレ一覧」にあたるようなものがない。その結果、誰をフォローするかによって見えないクラスタが生まれる。フォローしない人の発言は見えないから、自分が所属しているクラスタ内で話題にならないことは目に入らない。そこで、クラスタから独立した存在であるAnonymous Twitterをフォローしておくと、Anonymous Twitterを通じて他のクラスタで話題になっていることを俯瞰できる。そう説明された。しかし、anondiaryが人気な一方Anonymous Twitterはさほど利用されて

  • Re: PHP コード最適化 Best Practices 63+ (2008-05-22)

    Kiske
    Kiske 2008/05/23
  • 1:nなデータを検索しやすくDBに入れたい (2008-03-20)

    手元に資料があるもので適当に問題を置き換えたので例が悪いが、とにかくこういうデータをどういうスキーマで格納するかを考える。教科書どおりに沿って考えると、このデータは正規化されていないので、正規形に変える必要があるだろう。 夜行バス ID名前行き先片道運賃 1

  • CentOSにMeCab+Senna+MySQLを入れる

    語で全文検索をするために MySQL に Senna を組み込むメモ。少し前は個人ニュースサイトめぐり→日記書きに数時間を要していた私が次に目をつけたのがRSSめぐり→はてブ登録なのだがそれでも依然として数時間かかる。そんなあなた (私) に朗報です。私の代わりにブックマークしてくれるエージェントを作ればいいのです。そしてそのエージェントが今日よく使われていた単語やタグとか出してくれて、1次ソースAについてBさんとCさんとDさんがそれぞれの立場でこんなことを書いているとかいうのが俯瞰できて、さらにあとから検索とかができればいいのです。いまホッテントリを見なくてもいいのです。あとで検索できればいいのです。Googleが拾ってくる量は莫大過ぎるし個人で把握できる範囲にも限度がある。ユーザの皆さんが勝手に重み付けしてくれるならそれを使ったらいい。先週の週刊東洋経済を読んで悟った。いやなんか変

    Kiske
    Kiske 2007/08/16
    インストールするときの参考に
  • XREAでPHPからChasenを使う (2007-03-17)

    MeCabは利用できないみたい。SSH経由でいろいろ見てみたけれどもMeCabはインスコされていないぽい。なのでChasenを使う。Chasenは連続する数字を一塊にしてくれないのが残念。あと半角英単語もそうなるので、半角文字については適宜全角に置き換えるようにする。 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html401/loose.dtd"> <title>Chasenテスト</title> <table> <?php $path = '/usr/local/php/bin/chasen'; $str = "浜松駅の耐震工事のために長いこと利用できなかったekimachi eastの工事が、予定通り3月15日までに終了した。これでマクドナルドやミスドにまた行

    Kiske
    Kiske 2007/08/16
  • PHPでメールアドレスかどうか調べる方法 (2007-05-31)

    Otsuneのtwitter経由でphpspotがオススメするメールアドレスの正規表現。8:2ルールを採用したような簡便な正規表現にはてブのコメント欄が賑わっている。 「メールアドレス 正規表現」で検索すると最初に出てくるリソースに、思いっきり メールアドレスに一致する正規表現は「ありません」 なんてあって、その下に条件付きの鬼のような正規表現が紹介されている。メールアドレスの闇は深い。ヘタに触れると火傷する。 一応正確なアドレスを弾かずに、「なるべく」おかしなアドレスを弾く正規表現として $d3 = '\\d{1,3}'; $ip = join('\\.', ($d3) x 4); $ascii = '[\\x01-\\x7F]'; $domain = '([-a-z0-9]+\\.)*[a-z]+'; $mailre = "^$ascii+\\@($domain|\\\\[$ip\\\

    Kiske
    Kiske 2007/08/16
  • MySQLでTF-IDFの計算、あと2つのベクトルの内積の計算 (2006-12-19)

    文を形態素分解し、必要な品詞をtfテーブルとdfテーブルに入れる。分析対象となる文書群すべてについてこの処理を行い、各形態素のTF-IDF値を求めて文書をベクトル化する。他の文書ベクトルと内積を比較し、小さい順に「似ている記事」を求めたい (クラスタリングとかは別途)。 HarmanによるTF値の正規化とSparok JonesによるDF値の正規化をする場合のTF-IDF値の計算式は以下のようになる (参考文献): tfidf(i,j) = log2(freq(i,j) + 1) / log2(NoT) * (log2(N / Dfreq(i)) + 1)

    Kiske
    Kiske 2007/08/16
  • MySQLノウハウ

    いろいろなからメモってきたメモのメモ。出典を書いておくのを忘れた。思い出し次第補完するかも。 deleteのコストは高いので、無効化を示すフィールドを作ってupdateすべき slow query logに要注意 多くのエントリでほとんどのフィールドが同じ値を持つ場合はインデックスの効果が小さい →複合インデックスの効果が大きい 複合インデックスは指定の順番が大切。AとBという指定の場合、A単独でもインデックスの効果がある。逆は真でない。 インデックスが使われる場面は フィールド値を定数と比較するとき (where name = 'hogehoge') フィールド値でJOINするとき (where a.name = b.name) フィールド値の範囲を求めるとき (<,>,between) LIKE句が文字列から始まるとき (where name like 'hoge%') min(),

    Kiske
    Kiske 2007/06/25
    ノウハウいろいろ
  • 1