並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 15 件 / 15件

新着順 人気順

Robotsの検索結果1 - 15 件 / 15件

  • X(Twitter)のrobots.txtがおかしい(このミスはちょっと恥ずかしいかも)【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ

    robots.txtでは正規表現は使えない――改めて技術を正しく理解したいと心から思うミスがX(Twitter)のサイトに見付かった。今回のピックアップでは、この件に加えて、複数サイトを管理している人向けの便利なrobots.txt管理術をお届けする。 もちろん、ほかにもSEO情報をしっかりまとめている。ローカルSEOのテクニックと基本情報、デスクトップ用Googlebot終了、著者情報とSEO、生成AIなどなど、今回もあなたのSEO力アップに役立つ情報をお届けする。 X(Twitter)のrobots.txtがおかしい(このミスはちょっと恥ずかしいかも)複数サイト管理者に朗報: robots.txtはリダイレクトでまとめて管理できるローカルSEOで上位表示するためのTIPS×8ローカルSEOスターターガイド(基本版)2024年6月のグーグル検索オフィスアワー: コピーコンテンツが正規UR

      X(Twitter)のrobots.txtがおかしい(このミスはちょっと恥ずかしいかも)【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
    • 生成AI検索エンジンのPerplexityはクローラーを防ぐ「robots.txt」を無視してウェブサイトから情報を抜き出している

      Perplexityは生成AIを利用した検索エンジンであり、ユーザーの質問に対してAIが直接回答を生成できるほか、ユーザーのプロンプトに基づいたウェブページを生成する「Pages」という機能を提供しています。そんなPerplexityが、検索エンジンやAIトレーニングなどのボット(クローラー)を制御するテキストファイル「robots.txt」の指示を無視し、管理者がPerplexityの巡回を禁止したウェブサイトにもアクセスしていることが判明しました。 Perplexity AI Is Lying about Their User Agent • Robb Knight https://rknight.me/blog/perplexity-ai-is-lying-about-its-user-agent/ GoogleやBingなどの検索エンジンやChatGPTをはじめとする生成AIは、ク

        生成AI検索エンジンのPerplexityはクローラーを防ぐ「robots.txt」を無視してウェブサイトから情報を抜き出している
      • robots.txtによるクローリング禁止が急増 — AIがWeb全体をクローズドにしつつある

        9月1日、海外のテックメディアIEEE Spectrumで「AIがウェブクローリングをめぐる戦いを巻き起こす(AI Has Created a Battle Over Web Crawling)」と題した記事が公開された。この記事では、ジェネレーティブAIの進化とそれに伴うウェブクローリングに関する論争について、AI研究者グループ「Data Provenance Initiative」のリードリサーチャーであるシェイン・ロングプレ(Shayne Longpre)氏へのインタビューを通じて詳しく解説されている。 ジェネレーティブAIとデータ収集の問題 ジェネレーティブAIは、膨大なデータセットを使用して訓練されることで、驚異的なパフォーマンスを発揮するが、そのデータセットの大部分は、私たちが日常的にインターネット上に公開している情報で構成されている。これには、ブログ投稿、ビデオコンテンツ、S

          robots.txtによるクローリング禁止が急増 — AIがWeb全体をクローズドにしつつある
        • WebサイトのAI学習利用を拒否するrobots.txt拡張の議論 - ASnoKaze blog

          WebページがAIにより学習されないように、拒否できるようにしようという議論があります。 具体的には、ai.txtやrobots.txtなどを使って拒否する提案が出ています。 ai.txt (spawing) https://spawning.ai/ai-txt で 定義されている。 ai.txtの形で配置する 例: User-Agent: * Disallow: *.txt Disallow: *.pdf Disallow: *.doc Disallow: *.docx Disallow: *.odt (略) robots.txt のAI向け拡張 (Microsoft) Microsoftの方らが『Robots Exclusion Protocol Extension to manage AI content use』という提案をIETFに提出している という目的ベースで許可・拒否が出来

            WebサイトのAI学習利用を拒否するrobots.txt拡張の議論 - ASnoKaze blog
          • 「PerplexityのAIがクローラーをブロックするrobots.txtを無視している」との指摘に対しCEOが「無視しているわけではないがサードパーティーのクローラーに依存している」と主張

            生成AIを利用した検索エンジンの「Perplexity」に対して、検索エンジンやAIトレーニングなどのボット(クローラー)を制御できるテキストファイル「robots.txt」の指示を無視し、管理者がPerplexityの巡回を禁止したウェブサイトにもアクセスしていることが指摘されています。これに対し、Perplexityのアラヴィンド・スリニヴァスCEOが、「robots.txtの指示を無視しているわけではない」「自社のクローラーだけでなく、サードパーティーのクローラーにも依存している」と釈明しました。 Perplexity AI CEO Aravind Srinivas on plagiarism accusations - Fast Company https://www.fastcompany.com/91144894/perplexity-ai-ceo-aravind-sriniv

              「PerplexityのAIがクローラーをブロックするrobots.txtを無視している」との指摘に対しCEOが「無視しているわけではないがサードパーティーのクローラーに依存している」と主張
            • 【ロボットに倫理を教える(Moral Machines Teaching Robots Right from Wrong)】レビュー - sugarless time

              前書き 目次 レビュー まとめ おまけ 前書き 以前【ロボット法】についてのレビューを投稿しました。 www.sugarless-time.com 今回もそっち関係の書籍レビューになります。 【ロボット法】は2017年に初版発行、こちらの初版(翻訳版)は2019年発行ですが、翻訳前の初版は2009年に発行されており、今から15年も前のものになります。 目次 すべての章についてレビューしたいくらいなのですが、そんな大作を書くのも大変なので、本書の目次を掲載します。目次を追うだけでどのような本かは想像できると思いますので参考にしてください。 序章 第1章 なぜ機械道徳なのか? 路面電車の運転手とロボットのエンジニア 倫理的な殺人機械? 差し迫った危険 第2章 道徳の工学 それはエンジニアの義務なのか? ムーアによる倫理的エージェントの分類 第3章 人類はコンピュータに道徳的な意思決定をしてほし

                【ロボットに倫理を教える(Moral Machines Teaching Robots Right from Wrong)】レビュー - sugarless time
              • Anthropicによるサイトのスクレイピングを防ぐrobots.txtの内容がすでに古くなっているという指摘、クローラーは24時間で100万アクセスしている事例も

                生成AIの流行により、ネット上にコンテンツを公開している企業や組織が、トレーニングデータとして使われないように対策を行う事例が出てきています。対策の1つはサイトのクローラーに対してアクセスを許すページとアクセスを許さないページを示す「robots.txt」を用いた方法ですが、実態として、Anthropicのクローラーを防ぐための内容はすでに使われていないクローラーの名前になっていて、使用中のクローラーは防げていない状況になっているそうです。 Websites are Blocking the Wrong AI Scrapers (Because AI Companies Keep Making New Ones) https://www.404media.co/websites-are-blocking-the-wrong-ai-scrapers-because-ai-companies-

                  Anthropicによるサイトのスクレイピングを防ぐrobots.txtの内容がすでに古くなっているという指摘、クローラーは24時間で100万アクセスしている事例も
                • OpenAI's Rules for Model Behavior, Better Brain-Controlled Robots, and more

                  Dear friends, In the last couple of days, Google announced a doubling of Gemini Pro 1.5's input context window from 1 million to 2 million tokens, and OpenAI released GPT-4o, which generates tokens 2x faster and 50% cheaper than GPT-4 Turbo and natively accepts and generates multimodal tokens. I view these developments as the latest in an 18-month trend. Given the improvements we've seen, best pra

                    OpenAI's Rules for Model Behavior, Better Brain-Controlled Robots, and more
                  • Are Japanese anime robots isometric or allometric?

                    Sangjin Ryu1 & Kiyotaka Obunai2 1Department of Mechanical and Materials Engineering, University of Nebraska-Lincoln, Lincoln, NE, USA. 2Department of Mechanical and Systems Engineering, Doshisha University, Kyoto, Japan. Emails: sryu2 (at) unl (dot) edu; kiobunai (at) mail (dot) doshisha (dot) ac (dot) jp Download PDF Robots have been a very popular theme of Japanese animation, or anime, since the

                      Are Japanese anime robots isometric or allometric?
                    • 8 Common Robots.txt Issues And How To Fix Them

                      GUIDE How To Meet The Challenges of Modern Search Marketing Get your copy and clear away the noise of a crowded search marketing world. Stand out and boost your visibility for your ideal audience. Download Now Webinar AI Overviews Explained: Expert Embedding Techniques For SEO Success With Scott Stouffer from MarketBrew, we’ll show you their AI Overviews Visualizer, a tool that deconstructs AI Ove

                        8 Common Robots.txt Issues And How To Fix Them
                      • Googleクローラーの技術ドキュメントが再構成される、robots.txtブロックの影響範囲を追加

                        [レベル: 上級] クローラーについて解説する検索セントラルの技術ドキュメントを Google は再構成しました。 独立したページにセクションを分割 全体的な内容に大きな変更はありませんが、複数のページに分割しました。 ドキュメントが長くなり過ぎて、情報をこれ以上追加するのが難しくなってきたからです。 次の3ページを新たに新設しました。 Google’s common crawlers(一般的なクローラー) Google Special-Case Crawlers(特殊なケース用のクローラー) Google User-Triggered Fetchers(ユーザー トリガー フェッチャー) これらのページは以前は、概要ページのセクションとして 1 ページにまとまっていましたが独立したページに移動しました。 なお、この記事を書いている時点では、日本語ページは未更新でまだ分割されていません。

                          Googleクローラーの技術ドキュメントが再構成される、robots.txtブロックの影響範囲を追加
                        • Googleがrobots.txtでサポートするフィールドは4つだけ、それ以外は無視

                          [レベル: 中級] robots.txt のドキュメントに記載されていないフィールドはサポートされていないことを Google は明確化しました。 Google がサポートする robots.txt フィールドは 4 つだけ robots.txt ドキュメントの「Syntax(構文)」セクションに次の注釈が追加されました。 Google supports the following fields (other fields such as crawl-delay aren’t supported): 太字強調した部分です。 日本語ドキュメントはまだ更新されていません。 日本語に訳すとこうなります。 Google は次のフィールドをサポートしています(crawl-delay などその他のフィールドはサポートされていません)。 Google が robots.txt でサポートするフィールドは

                            Googleがrobots.txtでサポートするフィールドは4つだけ、それ以外は無視
                          • Tiny living robots made from human cells surprise scientists | CNN

                            Scientists have created tiny living robots from human cells that can move around in a lab dish and may one day be able to help heal wounds or damaged tissue, according to a new study. A team at Tufts University and Harvard University’s Wyss Institute have dubbed these creations anthrobots. The research builds on earlier work from some of the same scientists, who made the first living robots, or xe

                              Tiny living robots made from human cells surprise scientists | CNN
                            • GitHub - ai-robots-txt/ai.robots.txt: A list of AI agents and robots to block.

                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                GitHub - ai-robots-txt/ai.robots.txt: A list of AI agents and robots to block.
                              • US Micro Robots Market

                                ✉ info@marketresearchfuture.com 📞 +1 (855) 661-4441(US) 📞 +44 1720 412 167(UK) Global Market Outlook In-depth analysis of global and regional trends Analyze and identify the major players in the market, their market share, key developments, etc. To understand the capability of the major players based on products offered, financials, and strategies. Identify disrupting products, companies, and tr

                                1