並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 19 件 / 19件

新着順 人気順

スクレイピング 禁止の検索結果1 - 19 件 / 19件

  • 読売新聞、Web記事の“生成AIへの学習利用”を禁止に 利用規約を改定 スクレイピングなどもNG

    読売新聞社は1月25日、Webメディア「読売新聞オンライン」の利用規約を改定すると発表した。掲載記事を生成AIなどに学習させる行為などを新たに禁じる。2月1日から適用する。 禁止事項として新たに3点を追加。「データマイニング、テキストマイニングなどのコンピュータによる言語解析行為」「クローリング、スクレイピングなどの自動化した手段でデータ収集や抽出、加工、解析、蓄積などをする行為」「生成AIなどに学習させる行為、生成AIなどを開発する行為」を禁じた。 これらの禁止事項を含めた情報解析のために、同メディアの記事を利用したい場合は、読売新聞とライセンス契約を結ぶ必要があるとしている。 生成AIを巡っては、米The New York Timesは2023年12月に米Microsoftと米OpenAIを著作権侵害で提訴するなど、新聞業界は反発している。The New York Timesは「両社が

      読売新聞、Web記事の“生成AIへの学習利用”を禁止に 利用規約を改定 スクレイピングなどもNG
    • Webスクレイピングとは?違法にならない方法とスクレイピング禁止サイト5選をご紹介 – PigData | ビッグデータ収集・分析・活用ソリューション

      Webには有意な情報が大量に存在しています。例えば、購入したい商品がある場合、ちょっと検索してみるだけで販売している店舗やサイト、おおよその価格や購入した人のレビューまで見ることが可能です。さらに応用することもでき、同じ商品を扱っているWebサイトを探して情報収集、比較することで、最安値や最速到着時期も知ることができるでしょう。継続的に情報を収集すれば、商品の人気の上昇/下降や底値までも知ることができます。 しかし、人間がわざわざWebサイトを巡り情報を集めるのは大変です。そこで、プログラムを使って自動的にWeb上に存在する情報を集めるスクレイピングといわれる技術が開発されました。スクレイピングの有意性は明らかで、サービスとして提供されるようになり活用が広まっています。利便性は非常に高く、用途も幅広いです。 一方で気になるのは、スクレイピングでWebサイトから情報を収集することに問題はない

        Webスクレイピングとは?違法にならない方法とスクレイピング禁止サイト5選をご紹介 – PigData | ビッグデータ収集・分析・活用ソリューション
      • スクレイピング禁止のAmazonからレビューを抜き出す【Python】

        「Amazonはスクレイピング禁止!!」とよく言われていますよね。 みなさん、これを疑問に思いませんか? なぜ、誰でも見れる公開サイトにおいて、スクレイピング禁止なんて言えるのか? また、ブラウザでページを見てコピーするのとどう違うのか? そして、規約を破った場合にどうなるのか? いろいろと疑問が出てきます。 この記事では、Amazonへのスクレイピングの可否について結論を下します。 そして、その結論に基づき、スクレイピングをします。 あ、結論が出ましたね。 でも、安心してAmazonをスクレイピングするために一読をおススメします。 本記事の内容 Amazonがスクレイピング禁止と言われる理由Amazonをスクレイピングしてもいいの?Amazonを堂々とスクレイピングしてレビューを取り出す まずは、「Amazonはスクレイピング禁止!!」と言われる理由からですね。 これについて解説していき

          スクレイピング禁止のAmazonからレビューを抜き出す【Python】
        • WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー

          Cloudflareは2024年7月3日(米国時間)、同社製品のWebスクレイピングAI bot(クローラー)ブロック機能を使った、ネットワーク全体のトラフィック調査を紹介するブログエントリを公開した。Cloudflareは以下のように説明している。 AI botのトラフィック量や種類、割合 関連記事 Google、Google AIの改良へのサイトコンテンツの使用可否を設定できるWeb管理者向けツールを発表 Googleは、WebパブリッシャーがGoogleの「Bard」や「Vertex AI」の生成API(これらのサービスを支える将来の世代のAIモデルを含む)を改良するために自サイトのコンテンツを使わせるかどうかを設定できるスタンドアロン製品トークン「Google-Extended」を発表した。 OpenAIがWebクローラー「GPTBot」の文書を公開、クロールを禁止するには? Op

            WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー
          • スクレイピングが違法に?禁止サイトの確認方法や適切なやり方を解説 | 面倒な単純作業を自動化し、 繰り返しから解放するRPAツール「BizRobo!」

            スクレイピングはWebサイトから効率的に情報収集を行える技術のため、ビジネスの現場で注目が集まっています。一方で「実行してしまうと違法にならないか」と気になる方も多いでしょう。 結論スクレイピング自体に違法性はありませんが、Webサイトによっては禁止されていることもあるため注意しなければなりません。本記事ではスクレイピングが違法でない理由に加え、禁止サイトの確認方法や適切なやり方について詳しく解説します。 1 スクレイピング自体に違法性はない Webサイトから情報を自動的に収集する行為は一般にウェブスクレイピング(Web scraping:scrapeは「かき集める」の意)、略して「スクレイピング」と呼ばれ、さまざまな用途で日常的に行われています。 スクレイピングを実行するソフトウエアは「ボット」と呼ばれ、インターネット上の通信のうち、4割以上がボットによるものであるとの調査結果もあります

              スクレイピングが違法に?禁止サイトの確認方法や適切なやり方を解説 | 面倒な単純作業を自動化し、 繰り返しから解放するRPAツール「BizRobo!」
            • スクレイピング禁止のTwitterからツイートを取得する【Python】

              Twitterのツイートを取得したいと思いませんか? Twitterで過去ツイートを探すのが面倒ではありませんか? そのような場合は、Twitterが用意してくれているAPIの出番です。 でも、このAPIは使えません。 制限が多すぎて、やりたいことができません。 そこで、Twitterをスクレイピングしてしまいましょう。 それが最も効率的です。 「ちょ、Twitterはスクレイピングが禁止だぞ!!」 こういう意見もあるのはわかっています。 この記事では、Twitterはスクレイピング可能であることを解説していきます。 上記の禁止に関する意見を論破します。 論破と言うより、異議主張になりますでしょうかね。 本記事の内容 Twitterがスクレイピング禁止と言われる理由Twitterをスクレイピングしてもいいの?Twitterから実際にスクレイピングしてみる まずは、Twitterのスクレイピ

                スクレイピング禁止のTwitterからツイートを取得する【Python】
              • Twitterからユーザー情報の取得・スクレイピング。API利用で禁止事項をクリア

                TwitterでAPIを用いてスクレイピングを行う方法について、設定例を含めて解説。各APIプランによる過去ツイート検索制限の違いや、サンドボックス環境について、API利用を簡素化してくれるPythonライブラリについても紹介しています。

                  Twitterからユーザー情報の取得・スクレイピング。API利用で禁止事項をクリア
                • Hiromitsu Takagi on X: "クローリング、スクレイピングあたりも営利性とか関係なく全面禁止とするような媒体には、公務での取材協力は拒否することを義務付ける立法が必要だな。"

                  • WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー

                    WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー:Cloudflareネットワーク調査 Cloudflareは同社製品のWebスクレイピングAI botブロック機能を使い、AI企業によるWebクローラーの活動状況を調査した結果を紹介した。アクセス数が多いにもかかわらず、あまり禁止されていないAI botがあるなど、現状を分析している。

                      WebスクレイピングAI bot、最も禁止されているのは「GPTBot」だがアクセス最多は別のクローラー
                    • スクレイピング禁止サイトの確認方法【NG行為・違法性も解説】 | umano-ie.com

                      上記の疑問にお答えします。 この記事では、スクレイピングをする前に確認すべきことを具体的にお伝えします。 この記事を読めば「このサイト、スクレイピングしてもいいのかな。」と思っている方が、スクレイピングするか否かの判断ができるようになります。 具体的には次のことについて解説します。 スクレイピングをする前に確認すること スクレイピングの違法性について 著作権とスクレイピング スクレイピング禁止と判断できるサイト 「偉そうに語るおまえは誰やねん。」と思われるので、私のことも少し紹介させてください。 たいらーのプロフィール 文系四大出身。ソフトウェア開発の経験はなしですが、IT業界に身を置いています。 開発者やユーザーとのパイプ役など、業務にプログラミングスキルを活かす。 Pythonは独学で習得。スクレイピングや作業の自動化などに勤しんでいます。 スクレイピングは便利な技術ですが、使い方次第

                      • スクレイピングを禁止しているサイトを調べてみた【Python】

                        きっかけ Pythonの勉強会のネタとして、Webスクレイピングを企画していました。 が、実際に資料を作っていると、 「あれ、このサイトってスクレイピングOKなんだろうか…」 と疑問に思うことが多くありました。 スクレイピングの禁止事項は調べるといろいろな記事が見つかりますが、禁止しているサイトにどのようなものがあるのか、網羅的な記事はあまりないように思えたので、備忘録的にまとめておきます。 スクレイピングをするにあたっての注意事項 詳しい記事は他にたくさんあるので、そちらを見てもらえればよいのですが、 著作権と利用規約 サイトマップ robots.txtによる指示 Webサイトへの負荷 のあたりを各サイトごとに確認すべきです。 robots.txtとは ロボットに対してどのURLにアクセスして良いか、してはいけないかが書いてあるファイルのことです。 ここでのロボットは、Googleクロー

                          スクレイピングを禁止しているサイトを調べてみた【Python】
                        • 『読売新聞、Web記事の“生成AIへの学習利用”を禁止に 利用規約を改定 スクレイピングなどもNG』へのコメント

                          読売新聞社は1月25日、Webメディア「読売新聞オンライン」の利用規約を改定すると発表した。掲載記事を生成AIなどに学習させる行為などを新たに禁じる。2月1日から適用する。 禁止事項として新たに3点を追加。「... 61 人がブックマーク・18 件のコメント

                            『読売新聞、Web記事の“生成AIへの学習利用”を禁止に 利用規約を改定 スクレイピングなどもNG』へのコメント
                          • 読売新聞の新たな利用規約「AI学習禁止」「スクレイピング等も一切禁止」 - いろいろやってみるにっき

                            マジか? togetter.com お知らせはこちら。 www.yomiuri.co.jp 会員になる気は無いので(直球)、非会員用を見てみる。 www.yomiuri.co.jp 第4条禁止事項等を見てみる。 5. 当社の事前の許可を得ずに、記事や写真、図表などのコンテンツ(以下、「当社コンテンツ」といいます)をコピー、転載、インターネット送信などの方法で利用する行為 6. データマイニング、テキストマイニング等のコンピューターによる言語解析行為 7. 当社コンテンツを、クローリング、スクレイピング等の自動化された手段を用いてデータ収集、抽出、加工、解析または蓄積等をする行為 8. 生成AI等(人工知能、検索拡張生成、RPA、ロボット、プログラム、ソフトウェアを含みますが、これらに限られません。以下同じ)に学習させる行為(検索等の利用により検索エンジンの生成AI等が結果的に学習することと

                              読売新聞の新たな利用規約「AI学習禁止」「スクレイピング等も一切禁止」 - いろいろやってみるにっき
                            • 国内各新聞社の「Web記事の生成AIスクレイピング禁止」について利用規約を読み解いてみた|利用規約ウォッチャー みなしボウイ

                              記事の生成AIへのスクレイピングについては、世界的に新聞各社が警戒・反発を強めており、アメリカでは、The New York Timesが2023年12月にMicrosoftとOpenAIを著作権侵害で提訴するなどの動きが見られます。 そこで今回は、「Web記事の生成AIスクレイピング禁止」について国内各新聞社の利用規約をウォッチしてみたいと思います。 最後までよろしくお付き合いください。 全国紙読売新聞(読売新聞オンライン)1. 本サービスの利用に関し、以下の行為を禁止します。 (中略) 6. データマイニング、テキストマイニング等のコンピューターによる言語解析行為 7. 当社コンテンツを、クローリング、スクレイピング等の自動化された手段を用いてデータ収集、抽出、加工、解析または蓄積等をする行為 8. 生成AI等(人工知能、検索拡張生成、RPA、ロボット、プログラム、ソフトウェアを含みま

                                国内各新聞社の「Web記事の生成AIスクレイピング禁止」について利用規約を読み解いてみた|利用規約ウォッチャー みなしボウイ
                              • スクレイピング禁止のInstagramをPythonで攻略する【Selenium】

                                Instagramの規約を確認する まずは、Instagramの規約を確認しましょう。 主にスクレイピングに関するところですね。 Instagramの利用規約上では、「スクレイピング」というキーワードは見つかりませんでした。 検索しても何も表示されないということです。 スクレイピングに近い意味の内容は、以下が見つかりました。 「自動化された手段」を用いて「情報を取得したりする行為」という箇所です。 それ以外は、見つけることができませんでした。 とりあえず、Instagramはスクレイピングを利用規約で禁止していると言えます。 では、その利用規約に違反していいのでしょうか? はい、問題ありません。 当ブログでは、「スクレイピング自体は問題ではない」と常に主張しています。 問題は、スクレイピングを行う際に短時間で過度なアクセスをすることです。 これが過度になり過ぎると、サーバーへの攻撃へとなり

                                  スクレイピング禁止のInstagramをPythonで攻略する【Selenium】
                                • Amazonはスクレイピングが禁止。seleniumでデータ収集をしてみた | kakashi-blog・カカシブログ・

                                  pythonでコードを書いて、AmazonのサイトからASINコードと金額のデータを、普通にスクレイピングしてみたけど出来なかった。 (バグだと思って何時間も無駄にした) どうやらAmazonのサイトはスクレイピングを禁止しているようだ。 厳密にいうと完全に禁止ではないようだけど、普通にやろうとすると出来ないようになっているので、禁止と認識しておくべきかな。 出品者としてAPIを使用すれば出来るみたいだけど、なんかめんどくさくて・・・ そこで、seleniumを使って 「人が操作してますよ!」 のふりをしてスクレイピングしてみた。 コード from selenium import webdriver from selenium.webdriver.common.keys import Keys from bs4 import BeautifulSoup as bs import re im

                                  • Yahooファイナンス スクレイピング 禁止 法的 - Google 検索

                                    Yahoo! ファイナンスでは、Yahoo! ファイナンスに掲載している株価やその他のデータを、プログラム等を用いて機械的に取得する行為(スクレイピング等)について、システムに過度の負荷がかかり、安定したサービス提供に支障をきたす恐れがあることから禁止しています。

                                    • 【悪用禁止】Torで匿名性を確保しながらSeleniumでスクレイピングする

                                      About Pythonを使ってスクレイピングするときに匿名性を担保したい。😎 注意 ここではスクレイピングそのものについては詳しく説明しません。 だって優秀な方々が詳しく記事書いてますからそちらを参考にしてください。 使うもの 他の人の記事が詳しいので上記は詳細は割愛 Tor 経路を匿名化してくれるサービス。プロキシとして利用します。 Selenium コードでブラウザを操作するアプリ。 動作環境 今回の動作環境は mac[1], python3, 今回は ブラウザはChromeを使っています。 環境 version

                                        【悪用禁止】Torで匿名性を確保しながらSeleniumでスクレイピングする
                                      • 禁止されているYahooファイナンスのWebスクレイピング【銘柄コード抽出】

                                        第1弾の記事は、スクレイピングをする上での心得を書いてます。 何度でも言いますが、スクレイピングは危険な技術になり得ます。 やり方次第でDos攻撃のように、相手方サイトへの嫌がらせになりかねません。 最悪、威力業務妨害で逮捕される可能性すらあります。 だからこそ、何度も当ブログ内でスクレイピングの危険性を述べています。 同時に、スクレイピングの正当性(違法ではない)も主張しています。 結局、知らないから恐れるのです。 正体がわからないから、恐れの対象になってしまいます。 スクレイピングの正体を知れば、その危険性を認識して恐れないようになれます。 あとは、Yahooファイナンスをスクレイピングするための準備に関して説明しています。 そのため、準備が整っていない場合は、スクレイピングするための環境を整えてください。 では、スクレイピングするための準備が整ったら、次へ進みましょう。 銘柄一覧ペー

                                          禁止されているYahooファイナンスのWebスクレイピング【銘柄コード抽出】
                                        1