タグ

ブックマーク / qiita.com/nezuq (2)

  • Webスクレイピングの法律周りの話をしよう! - Qiita

    [2020/09/09追記] 記事の内容は著作権法改正より前に記載されたものです。 最新の情報をご確認下さい。 * 著作権法の一部を改正する法律(平成30年法律第30号)について | 文化庁 * 令和2年通常国会 著作権法改正について | 文化庁 上記に関連して、次の記事を記載致しました。 * 【2020年度版】個人用クローラーの開発手順とその注意点 - Qiita 4日目になるまでに残り1時間なので、急ぎで書きます。 後、私は法律の専門家ではないので記事の正確性は保証できません。自己責任でお願いします。 はじめに Webスクレイピング技術的な情報は多いのですが、法律に関する情報は数少ないです。 その為、技術的にできる事でも遠慮してしまい、インターネット上のデータを利用する事を避けてしまう人もいます。 特にLibraHack事件以降、その傾向が強いです。 これは「モノのインターネット(

    Webスクレイピングの法律周りの話をしよう! - Qiita
  • 徹底攻略PDFオープンデータ。PDFMinerで始めるPDFテキスト分析。 - Qiita

    紹介 オープンデータは、 政府データを、全ての人が自由に加工し、自由に再配布し、自由に商用利用できるようにしていこうとする政治活動です。 現在、政治の透明性や経済の活性化の観点から注目されており、 日政府も実際にデータを出し始めています。 -> 参考サイト:Open DATA METI | 経済産業省のオープンデータカタログサイト ただし、日のオープンデータの問題として、 ☆1のオープンデータが出てくるケースが多い事が挙げられます。 オープンデータは、そのオープン性により5つ星で評価されます。 ☆1のオープンデータ、つまりPDFは、 構造化データではない為に最もクローズドとされています。 しかし、技術に疎い公務員の方に機械可読性の重要性を説くことは難しく、 それを理解して貰えたとしても機械可読性の為の予算を割り振って貰えるかは微妙です。 現実問題として、PDFに対峙する必要があるのです

    徹底攻略PDFオープンデータ。PDFMinerで始めるPDFテキスト分析。 - Qiita
  • 1