タグ

2014年9月22日のブックマーク (4件)

  • 293日目-Anemoneを学ぶ その3 - 17826日間Webをがんばる日記

    dkfj
    dkfj 2014/09/22
    anemone編その3
  • 大解剖!スクレイピング比較してみた - technica

    はじめまして。14卒の能天気エンジニアです。 これから宜しくお願いします。 今回はスクレイピングの比較についてを題材にしました。 最近は業務だけでなく、私生活でもスクレイピングを使っています。スクレイピングによって今まで見づらかった情報が見やすくなったり、さらにそのデータを使って別のものを作成したりと幸せなことが多いです。 スクレイピング何?どういうこと出来るの?どうやってやるの?などなど、スクレイピングのいろはを順番に説明していきます。 スクレイピングとは 簡単にいうと今見ているこのサイト、そしていつも見ているサイトから情報を抽出することです。 HTTP経由でhtmlを取得し、htmlを解釈、DOMに変換します。任意のタグを指定し、DOMを検索、情報を取得します。あくまでもhtmlを変換するので、FLASHなどのコンテンツなどからはスクレイピングすることは出来ません。 どんなことが

    大解剖!スクレイピング比較してみた - technica
    dkfj
    dkfj 2014/09/22
    いい記事
  • 人月の神話を改めて読もう - プログラマでありたい

    人月の神話は、実に37年前(1975年)に発売されたですが、今でも示唆に富みます。というか、IT業界に入ったらまず読むべきの一冊です。(実際のところは、誰にも読まれず同じ失敗がくりかえされています。)ということで、つべこべ言わずに読めと強要できる数少ないの一冊です。 以下、メモ。 スケジュールの目安 1/3 計画 1/6 コーディング 1/4 単体テストおよび初期システムテスト 1/4 すべてのコンポーネントを統合して行うシステムテスト 各工程の定義は考える必要があるけど、テスト重要という話。テストを品質保証の工程と考えて、開発(コーディング)工程に品質保証の仕組みを組み込むことが大切ですよね。 ブルックスの法則 遅れているソフトウェアプロジェクトへの要因追加はさらに遅らせるだけだ これが解らぬ人が多いんだよなぁ。実際のところ。

    人月の神話を改めて読もう - プログラマでありたい
    dkfj
    dkfj 2014/09/22
  • 作って覚える転置インデックス、「検索エンジン自作入門」 - プログラマでありたい

    先行発売で、検索エンジン自作入門を購入しました。まだペラペラと眺めている状況ですが、これが非常に面白いです。 「検索エンジン自作入門」は、集めた文章をいかに整理するかをテーマとして扱っているです。整理するという意味は、検索エンジンを利用するというライフハック的な意味ではありません。整理する為の検索エンジン自体を自分で作ることで理解するという、極めて硬派なです。 「検索エンジン自作入門」とは? 「検索エンジン自作入門」は、未踏IT人材発掘・育成事業にスーパークリエータに認定された山田浩之氏と、Senna/groongaの開発者の末永匡氏の共著です。検索エンジンについて語らせたら、日でこれ以上の人たちはいないだろうという組み合わせです。ということで、内容は非常に濃いのですが、難しい内容を解りやすく解説されています。 一方で、扱っている内容は非常にマニアックです。下に目次付けておくので見て

    作って覚える転置インデックス、「検索エンジン自作入門」 - プログラマでありたい
    dkfj
    dkfj 2014/09/22
    面白いよ