タグ

2007年11月2日のブックマーク (3件)

  • IPAフォーラム2007で討論してきた - 東大MOT学生の奮闘記

    10月30日に行われたIPAフォーラム2007の『「学生から見たIT産業」と「IT産業から見た学生」〜IT産業は学生からの人気を回復できるか〜』と題された討論会でしゃべってきた。IPAとは情報処理推進機構の略で、情報処理技術者試験とか、未踏ソフトウェア創造事業をやっているところ。 大学の先生から、討論会に出る学生を求めいているという話を聞いたのが討論会に参加したきっかけ。僕はてっきり、IT産業の未来について語り合うのかと思っていたのだが、「IT産業は3Kのイメージが強く、就職において人気がなくなってきているが、どうすればその人気を回復できるか」というタイトルを聞いて、ちょっとがっかりした。 @ITにこの討論会についての「IT業界不人気の理由は? 現役学生が語るそのネガティブイメージ − @IT」という記事が上がっていた。ちなみに、記事の最初の写真に討論会に参加した学生が写っているが、前列の

    IPAフォーラム2007で討論してきた - 東大MOT学生の奮闘記
    lli
    lli 2007/11/02
  • HTMLのドキュメントから繰り返し部分をみつける - bits and bytes

    RSSを生成していないページからRSSを生成するなんでもRSS 0.1bは、公開されているJSAI2005: なんでもRSS - HTML文書からのRSS自動生成によると、日付情報を目印にしてそのHTMLドキュメントの構造を推測して、各エントリ(item要素)のタイトルと文を単語の統計的に処理して決定し、フィードを生成していると書かれています。 ウェブ上にあるHTMLドキュメントは Ask.jp : "xml" Search results. のように、RSSitem要素に相当する部分に日付が含まれていないものもあります。 その中でも、大量のデータを複数のページにわけて表示しているHTMLドキュメントを対象に、ドキュメント中に含まれる繰り返し部分のXPathを生成するブログラムをjavascriptで作りました。 アプローチ 大量のデータを複数のページわけて表示しているドキュメントを

  • kichikutter

    当然ながら著作権は秀和システムさん、菊地さん、Twitterの投稿者などにあります made by oquno, mozurin

    lli
    lli 2007/11/02