タグ

2007年12月29日のブックマーク (3件)

  • 2008年、Webは文字列解析で変わっていく

    前回は、Perlモジュールである「Web::Scraper」を使ったスクレイピングについて説明した。Webページ(HTML)は、「構造」と「デザイン」面で比較的分離が進んできたため、CSSセレクタによるスクレイピングが有効であることが分かったはずだ。 今回の最終回では、コンテンツの自動収集と統計手法について考えてみよう。 記事内で扱っていくのは、幾つかのコンテンツをたどって、「利用頻度の高い語句を集め、話題となっているキーワードを見つけよう」というものだ。 話題のキーワードを集める手法 近年ブログのポータル上などでは、話題となっているキーワードを「利用頻度に応じたフォントサイズ」で示し、クリックすると該当の記事一覧が表示されるという仕組みが実装されているものが多い。 オルタナティブ・ブログにも似たようなものとして「話題のキーワード」が見られる。キーワードをクリックすると、Googleによる

    2008年、Webは文字列解析で変わっていく
    faultier
    faultier 2007/12/29
  • 「人気の職業」化は末端の現場に悲惨な現実をもたらす - 萌え理論ブログ

    「人気の職業」化はその職業を幸せにするか 全力でプログラマーを「人気の職業」に押し上げたい - Attribute=51 全く賛成できない。もちろん、引用元の文章には善意が感じられるが、だからといって賛成することはできない。それはなぜか、説明しよう。 経済学によると、需要と供給が価格を決定するという。そして、労働価格(賃金)も、労働力の需要と供給で決まる。だから、労働力の需要が増えないまま供給を増やせば、供給過剰で労働者の賃金が下がるのだ。 じっさい、「人気の職業」は低賃金で劣悪な労働環境な場合が多い。そのために人が辞めていっても、入ってくる人がいくらでもいて替わりが利くから人材は使い捨てられ、労働条件は一向に改善されない。そして、「エンジニア」「クリエイター」と呼ぶようなIT職種は既にいくらかは「人気の職業」なのではないか。 「人気の職業」の頂点に近い部分は、収入など理想的な条件が整って

    「人気の職業」化は末端の現場に悲惨な現実をもたらす - 萌え理論ブログ
  • レス:全力でプログラマーを「人気の職業」に押し上げたい - Attribute=51

    思いつきでポロッと書いたことなんですが、たくさんのご意見ありがとうございました。 実は悶々と考えているときにSuicaネタをひらめいちゃったので、 どうしてもそれを書きたくて書いたエントリーだったり、そうでなかったり。いくつかフォローを書いておきます。 スタッフロールについて 動画じゃなくてもよくて、1枚のHTMLでもいいと思ってます。 「総監督:木村一郎」「DB設計:黒井順子」「コーディング:平岩孝」みたいな。 とにかく「こんな人たちが作ったんだよー」っていうのが伝わればいい。 あと、「このレイアウトいいなと思ったら、やっぱこの人か」って通にはわかればいい。 でも、よくよく考えてみるとスタッフブログやなんかでをやっているところって結構ありましたね。ライブドアとか代表的。 教えてもらったR25.jpモバイルにもありました。運用開発スタッフ一覧はちょっと感動した。 他にもこれ(http://

    レス:全力でプログラマーを「人気の職業」に押し上げたい - Attribute=51