タグ

ブックマーク / private.ceek.jp (11)

  • 情報検索とエージェント - Ceekz Logs (Move to y.ceek.jp)

    5年ほど前に購入した書籍。何度か読んでいましたが、やっと全部読み通した。 インターネット時代に生じる様々な課題とそれらに対する知識処理の適用についての解説書。現在における質的な課題、人工知能をはじめとする知的処理の取り組み、今後のインターネットの方向性についてわかりやすく解説する。 Amazon.co.jp に書かれた紹介文より。 2002年に出版された書籍と言うこともあり、内容が古い。ウェブサービスに関する話は殆ど無く、既存の研究を WWW に適用する試みが解説されており、大の研究題材を知るのには良いかも。 擁護に関しては、比較的丁寧に解説されているので、論文(日英問わず)をサーベイする前に目を通しておくと、効率良く調べられそう。 なお,XMLはWeb上の構造化文書フォーマット以外に,構造データの表現に利用できる半構造データ(semi-structured data)でもあるというこ

    hiromark
    hiromark 2008/11/25
    あああ、この本、もう何年も積読だー。
  • バグ祭なるものがあってな - Ceekz Logs (Move to y.ceek.jp)

    情報学類の一部で行われる祭。ということで、昨日(21日)の事内容です。 昼は、コナクリでエビピラフをべました。後輩がグラタンかドリアをべていて、そっちも美味しそうだと思った。ピラフばっかだしな。 夜は、情報学類ラウンジで行われるバグ祭に出る。祭という名ですが、単なる飲み会。チキンナゲットが美味しかった。 近年の警備強化に伴い、ラウンジで何かやろうとしても9時までしか実施できない…。今回、9時以降の実施も情報学類長の承諾を得ていたみたいだけど、事務から警備に伝わっていなかったとか。事務をアテにせず、学類長から捺印済みの書類を得ておく方が安全ですね。 コナクリ (昼) エビピラフ 情報学類ラウンジ (夜) バグ祭

    hiromark
    hiromark 2008/11/24
    うちの会社にもほしいなwww
  • Google誕生 ガレージで生まれたサーチ・モンスター - Ceekz Logs (Move to y.ceek.jp)

    1年以上前に発刊された書籍で、棚の肥やしになりかけていた。 米国には、世界中の情報を集める Google という企業が存在する。この企業は、検索エンジンサービスを中心とする IT ベンチャーであるが、慣例や常識を覆す企業運営を行っている。書は、創成期から現在までのドラマを新聞記者がまとめたものである。 綿密な取材と膨大なインタビューで、初めて明かされる Google 革命の舞台裏! ザ・サーチ と重なる部分が多かったが、より Google のドラマに踏み込んでいた。書を読めば、慣例や常識を覆しながらも、管理部門を強化しているのが分かるだろう。現在の Google は、大企業なのである。 また、普段あまり語られることのないエンジェル投資家、ベンチャーキャピタリスト達の知られざる努力が克明に描かれている。 帯の引用であるが、この通りに Google を支える資金源についても、取り上げられ

    hiromark
    hiromark 2007/09/03
    ちゅうか、この本の存在をチェックしてなかった orz
  • Web Diff - Ceekz Logs (Move to y.ceek.jp)

    テキストの差分を簡単に取りたいので、ウェブから使える Web Diff なんてのを作ってみました。 HTML::Template の差分もなかなか上手く取れて大満足です。 Algorithm::Diff というモジュールを使ったので、僕がコーディングした部分は、主に表示部分ばかりです。ということで、性能品質に関しては Algorithm::Diff に依存するので、なんともできません。 あと、長い文章を「スペース」で区切ると、計算量が膨大になり結果が出ずにタイムアウトします… 空気を読んでお使いください。行区切りにすると大丈夫だと思う。 区切り方法の選択を無くして、とりあえず行区切りにして、そこで違いがあった場合、スペース区切りや MeCab を利用して、詳細な違いを計算するようにすればよさそう。 そのうち時間があればやる。 とりあえず、お試し版の公開ということで。 【関連情報】 ・Web

    hiromark
    hiromark 2006/03/06
    なかなか便利。
  • はてブニュースにユーザー数を表示 - Ceekz Logs (Move to y.ceek.jp)

    はてなブックマーク件数取得API というのが始まったらしいので、早速 はてブニュース でも使ってみた。 サンプルプログラムをもとに作ったのですが、いくつか嵌ったのでメモ。 ・URL は & に統一すること & でクエリーを投げてもダメでした。 XMLRPC::Lite の仕様かも知れない。とりあえず & を & に変更することによって、取得できました。 DB の URL は、エスケープ前のを保存する方がよいかな… 表示するときにエスケープする方向で。 ・HTTPS には対応していないようです https://www.arena-fx.com/customer/ こんな感じの URL はだめぽでした。仕様だと思う。 ・なぜか取得できない URL がある http://www.excite.co.jp/News/odd/00081132406950.html この URL は

    hiromark
    hiromark 2005/12/13
    グッジョブ!
  • プログラマーの格言(盗作多し) - Ceekz Logs (Move to y.ceek.jp)

    サラリーマンプログラマーの辛さを知っていますか? プログラマーの格言(盗作多し) を見れば、サラリーマンプログラマーの憂がわかるかもしれません。プログラマーの憂という別ページがあるほどですが。 顧客は水と仕様追加はタダだと思ってる。 などのように、プログラマー視点で SE や 顧客 を語っています。時には、自分自身をも。 ここで、あなたがサラリーマンプログラマーかどうかを判定する方法があります。どうすればいいのか?答えは簡単、この 格言 を見て、笑えたらまだまだ大丈夫。それは、自分には降りかかっていないのだけど、そういうのもあるよね?と理解できているから。 やたらと陽気になり、元気な声が響き渡るようになる。この状態を「プログラマーズ・ハイ」と呼ぶ。 こんな状況かもしれませんけど。 久しぶりに、普通なウェブページを一気に読んだ。最近は、ブログばかり読んでいて、ちょっと薄っぺらい感じがして

    hiromark
    hiromark 2005/09/21
    リンク先に笑った (脱力した)
  • はてブでのホスト名の偏り - Ceekz Logs (Move to y.ceek.jp)

    Hatena Bookmarker Ranking を作った後に、こんなことを書いた。 ITmedia や CNET をブックマークしまくれば、多分上位にい込める。とはいっても、そうなる原因の1つは、まだまだ はてなブックマーク のユーザー層に偏りがあるということ。 体感的に正しい気がするのだけど、データはどう示すのか改めて調べてみた。 以下が、はてなブックマークの人気エントリーのホストランキングです。人気エントリーとは、以前からの定義どおり、20以上のオープンユーザーがブックマークしているエントリーです。 11.043 d.hatena.ne.jp 8.166 www.itmedia.co.jp 4.272 japan.cnet.com 2.063 blog.livedoor.jp 1.860 hotwired.goo.ne.jp 1.511 itpro.nikkeibp.co.jp

    hiromark
    hiromark 2005/08/18
    ここまで解析したか。すごい。
  • はてなブックマーカーランキングからわかること - Ceekz Logs (Move to y.ceek.jp)

    タイトルが長くなったorz まぁ。ぶっちゃけ、自分で集計しないとわからないけど。 Hatena Bookmarker Ranking を作るにあたって、仮説をたてていました。それは、貢献ユーザーの総数は、上位貢献ユーザーを軸に対数関数的に伸びるということ。すなわち、上位の貢献ユーザーが、人気エントリーを 1番目 〜 10番目 にブックマークしているということ。言い換えると、人気エントリーをブックマークしている多くのユーザーは、他の特定ユーザに乗っかっているだけなのではないか?ということ。 完全な対数関数にならなかったのだけど、おおむね満足できる結果となりました。グラフは、クリックすると大きい画像が表示されます。 グラフの見方を少々説明。縦軸は、貢献ユーザーの総数を表しています。すなわり、集計エントリー数の10倍になります。横軸は、トータルランキングの貢献ユーザーです。ランキング1位から順に

    hiromark
    hiromark 2005/08/08
    ユーザ地図、おもしろいと思いますよ。
  • GPS 携帯を使ったサービスが出ない訳 - Ceekz Logs (Move to y.ceek.jp)

    GPS 携帯が出てきた当時は、アレもできるコレもできるという話をいっぱい聞いたような気がするのですが、一向にそんなサービスが出てきません。なんでだろうなぁ。と調べてみたところ特許で縛られているようです。 その一例をあげると位置依存サービスをしようとしても、携帯端末がGPSなどから取得した位置情報を何らかのメッセージ(メールを含む)でサーバに転送して、そのサーバから現在位置に関するコンテンツを携帯端末が受け取ると特許に抵触します。 まじかー。とりあえず、一次情報の特許電子図書館で調べてみる。 【発行国】 日国特許庁(JP) 【公報種別】 公開特許公報(A) 【公開番号】 特開2002-199423(P2002-199423A) 【公開日】 平成14年7月12日(2002.7.12) 【発明の名称】 座標ウェイポイントでメッセージにアクセスして記録するシステム及び方法 うーん。当っぽい。ま

    hiromark
    hiromark 2005/08/03
    ああ、そういうことだったんだ。
  • 試すのがいいことか? - Ceekz Logs (Move to y.ceek.jp)

    ML に直接流そうかと思ったけど、関係ない話題なので日記に書いてみた。 引用元は、SoftEther ML から。 ついでに、 ML に投稿するときは Outlook は避けましょう。 Thunderbird は hotmail アドレスも繋がって見えるのでお勧めですが、最低でも Outlook Exprss を使ってください。 (softether:02762) という内容が、ML に流れていました。一緒に書かれていた内容は、別に何かの回答というわけでもなく、投稿文の言葉遣いをもっとよくしたほうがいいよ。という内容。 対して、指摘された方が、こんな内容を流す。 すみません。どうして Outlook がだめなのでしょうか?自分は Outlook 2003 でヤフーメールを使用しているのですがだめなんですか? (softether:02763) そうすると、別の方(softether:027

    hiromark
    hiromark 2005/04/05
    俺ルールを ML で進言しないほうがよいのではないかということ
  • namazu.cgi と通信する - Ceekz Logs (Move to y.ceek.jp)

    以前、namazu を CGI から叩く方法を書きました。LWP を使った方が安全だよ。という親切なコメントに対しては、検証せずにスルーしてました。 ごめんなさい。 LWP は使わないけど、HTTPプロトコルを使って namazu.cgi を叩くことにします。 これには、以下のような理由があります。 ・安全性の面から ・負荷分散の面から 安全性の面からいうと、 Perl CGI 上からコマンドラインを叩く場合は、コマンドライン演算子(バッククォート演算子)を用いて標準出力を得る必要があるのですが、任意のコマンドを叩けるようになる可能性があります。 namazu に対して、任意の検索キーワードを叩けるようにしようとすると、エスケープが面倒でした。というか、調べるのも面倒だったので、途中で止めました。 負荷分散の面からいうと、コマンドラインで叩いた場合は、基的に localhost しか叩け

    hiromark
    hiromark 2005/03/17
    HTTP で namazu.cgi と通信。この手は使える!
  • 1