並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 8 件 / 8件

新着順 人気順

スクレイピング 禁止の検索結果1 - 8 件 / 8件

  • 読売新聞、Web記事の“生成AIへの学習利用”を禁止に 利用規約を改定 スクレイピングなどもNG

    読売新聞社は1月25日、Webメディア「読売新聞オンライン」の利用規約を改定すると発表した。掲載記事を生成AIなどに学習させる行為などを新たに禁じる。2月1日から適用する。 禁止事項として新たに3点を追加。「データマイニング、テキストマイニングなどのコンピュータによる言語解析行為」「クローリング、スクレイピングなどの自動化した手段でデータ収集や抽出、加工、解析、蓄積などをする行為」「生成AIなどに学習させる行為、生成AIなどを開発する行為」を禁じた。 これらの禁止事項を含めた情報解析のために、同メディアの記事を利用したい場合は、読売新聞とライセンス契約を結ぶ必要があるとしている。 生成AIを巡っては、米The New York Timesは2023年12月に米Microsoftと米OpenAIを著作権侵害で提訴するなど、新聞業界は反発している。The New York Timesは「両社が

      読売新聞、Web記事の“生成AIへの学習利用”を禁止に 利用規約を改定 スクレイピングなどもNG
    • WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー

      Cloudflareは2024年7月3日(米国時間)、同社製品のWebスクレイピングAI bot(クローラー)ブロック機能を使った、ネットワーク全体のトラフィック調査を紹介するブログエントリを公開した。Cloudflareは以下のように説明している。 AI botのトラフィック量や種類、割合 関連記事 Google、Google AIの改良へのサイトコンテンツの使用可否を設定できるWeb管理者向けツールを発表 Googleは、WebパブリッシャーがGoogleの「Bard」や「Vertex AI」の生成API(これらのサービスを支える将来の世代のAIモデルを含む)を改良するために自サイトのコンテンツを使わせるかどうかを設定できるスタンドアロン製品トークン「Google-Extended」を発表した。 OpenAIがWebクローラー「GPTBot」の文書を公開、クロールを禁止するには? Op

        WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー
      • Hiromitsu Takagi on X: "クローリング、スクレイピングあたりも営利性とか関係なく全面禁止とするような媒体には、公務での取材協力は拒否することを義務付ける立法が必要だな。"

        • WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー

          WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー:Cloudflareネットワーク調査 Cloudflareは同社製品のWebスクレイピングAI botブロック機能を使い、AI企業によるWebクローラーの活動状況を調査した結果を紹介した。アクセス数が多いにもかかわらず、あまり禁止されていないAI botがあるなど、現状を分析している。

            WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー
          • 『読売新聞、Web記事の“生成AIへの学習利用”を禁止に 利用規約を改定 スクレイピングなどもNG』へのコメント

            読売新聞社は1月25日、Webメディア「読売新聞オンライン」の利用規約を改定すると発表した。掲載記事を生成AIなどに学習させる行為などを新たに禁じる。2月1日から適用する。 禁止事項として新たに3点を追加。「... 60 人がブックマーク・18 件のコメント

              『読売新聞、Web記事の“生成AIへの学習利用”を禁止に 利用規約を改定 スクレイピングなどもNG』へのコメント
            • 読売新聞の新たな利用規約「AI学習禁止」「スクレイピング等も一切禁止」 - いろいろやってみるにっき

              マジか? togetter.com お知らせはこちら。 www.yomiuri.co.jp 会員になる気は無いので(直球)、非会員用を見てみる。 www.yomiuri.co.jp 第4条禁止事項等を見てみる。 5. 当社の事前の許可を得ずに、記事や写真、図表などのコンテンツ(以下、「当社コンテンツ」といいます)をコピー、転載、インターネット送信などの方法で利用する行為 6. データマイニング、テキストマイニング等のコンピューターによる言語解析行為 7. 当社コンテンツを、クローリング、スクレイピング等の自動化された手段を用いてデータ収集、抽出、加工、解析または蓄積等をする行為 8. 生成AI等(人工知能、検索拡張生成、RPA、ロボット、プログラム、ソフトウェアを含みますが、これらに限られません。以下同じ)に学習させる行為(検索等の利用により検索エンジンの生成AI等が結果的に学習することと

                読売新聞の新たな利用規約「AI学習禁止」「スクレイピング等も一切禁止」 - いろいろやってみるにっき
              • 国内各新聞社の「Web記事の生成AIスクレイピング禁止」について利用規約を読み解いてみた|利用規約ウォッチャー みなしボウイ

                記事の生成AIへのスクレイピングについては、世界的に新聞各社が警戒・反発を強めており、アメリカでは、The New York Timesが2023年12月にMicrosoftとOpenAIを著作権侵害で提訴するなどの動きが見られます。 そこで今回は、「Web記事の生成AIスクレイピング禁止」について国内各新聞社の利用規約をウォッチしてみたいと思います。 最後までよろしくお付き合いください。 全国紙読売新聞(読売新聞オンライン)1. 本サービスの利用に関し、以下の行為を禁止します。 (中略) 6. データマイニング、テキストマイニング等のコンピューターによる言語解析行為 7. 当社コンテンツを、クローリング、スクレイピング等の自動化された手段を用いてデータ収集、抽出、加工、解析または蓄積等をする行為 8. 生成AI等(人工知能、検索拡張生成、RPA、ロボット、プログラム、ソフトウェアを含みま

                  国内各新聞社の「Web記事の生成AIスクレイピング禁止」について利用規約を読み解いてみた|利用規約ウォッチャー みなしボウイ
                • 【悪用禁止】Torで匿名性を確保しながらSeleniumでスクレイピングする

                  About Pythonを使ってスクレイピングするときに匿名性を担保したい。😎 注意 ここではスクレイピングそのものについては詳しく説明しません。 だって優秀な方々が詳しく記事書いてますからそちらを参考にしてください。 使うもの 他の人の記事が詳しいので上記は詳細は割愛 Tor 経路を匿名化してくれるサービス。プロキシとして利用します。 Selenium コードでブラウザを操作するアプリ。 動作環境 今回の動作環境は mac[1], python3, 今回は ブラウザはChromeを使っています。 環境 version

                    【悪用禁止】Torで匿名性を確保しながらSeleniumでスクレイピングする
                  1