並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 3 件 / 3件

新着順 人気順

クローリングの検索結果1 - 3 件 / 3件

  • OpenAI、Webデータ収集クローラー「GPTBot」のブロック方法を説明

    米OpenAIは、Webサイト管理者が同社のWebクローラー「GPTBot」によるサイトのデータ収集を回避する方法を紹介した。紹介する文書に日付はないが、米AI専用オンラインメディアMaginativeなどが8月7日(現地時間)、文書を見つけて報じた。 GPTBotは、同社のAIモデルをトレーニングするために公開データを収集するためのWebクローラー。OpenAIはこの文書で、GPTBotのクローリングをブロックする手順を説明している。 Webオーナーがrobots.txtにGPTBotを追加したり、IPアドレスを直接ブロックしたりしないと、ユーザーがWebサイトに入力するデータを含むWebサイトのデータがAIモデルのトレーニングデータとして収集される。 ブロックしなくても、ペイウォールアクセスを必要とするソース、個人を特定できる情報を収集することが知られているソース、ポリシーに違反するテ

      OpenAI、Webデータ収集クローラー「GPTBot」のブロック方法を説明
    • OpenAIがインターネット上のコンテンツ収集に用いるウェブクローラー「GPTBot」をブロックする試みが進行中

      対話型AIのChatGPTを開発するOpenAIは2023年8月に、大規模言語モデルの学習に必要なデータセットをインターネット上から収集するためのウェブクローラー「GPTBot」に関する詳細を公開しました。GPTBotに関するオンラインドキュメントには、GPTBotによるコンテンツの収集を防ぐための方法も記載されており、一部のウェブサイトは早速GPTBotのブロックに乗り出していることが報じられています。 Now you can block OpenAI’s web crawler - The Verge https://www.theverge.com/2023/8/7/23823046/openai-data-scrape-block-ai OpenAI launches web crawling GPTBot, sparking blocking effort by website

        OpenAIがインターネット上のコンテンツ収集に用いるウェブクローラー「GPTBot」をブロックする試みが進行中
      • ニュースサイト向けテクニカルSEOやGoogle Discoverに関するノウハウが満載! 「News & Editorial SEO Summit 2023」参加レポート | アユダンテ株式会社

        TOP » コラム » SEO » ニュースサイト向けテクニカルSEOやGoogle Discoverに関するノウハウが満載! 「News & Editorial SEO Summit 2023」参加レポート ニュースサイト向けテクニカルSEOやGoogle Discoverに関するノウハウが満載! 「News & Editorial SEO Summit 2023」参加レポート 米国時間2023年10月11日-12日、ニュースSEOに特化したカンファレンス「News & Editorial SEO Summit 2023」がオンラインで開催されました。 代理店側のSEO専門家や、大手新聞社のインハウスSEO専門家が集まり、様々な視点から新聞・雑誌に関するSEOの知見や経験が共有されました。 本コラムでは、セッションの中から非常に興味深いと感じたテクニカルSEOやインハウスSEO、Goog

          ニュースサイト向けテクニカルSEOやGoogle Discoverに関するノウハウが満載! 「News & Editorial SEO Summit 2023」参加レポート | アユダンテ株式会社
        1