タイトル「robots」を検索 - はてなブックマーク

1 - 40 件 / 50件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

robotsの検索結果1 - 40 件 / 50件

辻正浩 | Masahiro Tsuji on Twitter: "よくあるrobots.txtの誤りで、致命的なトラブルになる事もあるのにあまり知られていない仕様の紹介で連ツイート。誤りは表に出ることが少ないので日本語で実例紹介を見たことが無いのですが、公共の面も持つサイトでの誤りを発見したので注意喚起意図で実例を紹介します。(続く"
- 443 users
- twitter.com/tsuj
- テクノロジー
- 2022/10/29
- SEO
- あとで読む
- web
- robots.txt
- 開発
- web制作
- トラブル
- google
- webサービス
AIによるスパイクアクセスを受けたので、 robots.txtの調整など極力AIを排除しない対策を試みてみた | DevelopersIO
- 161 users
- dev.classmethod.jp
- テクノロジー
- 2025/02/24
AWS WAF のBotControlルールにおいて、AIカテゴリに分類されるスパイクアクセスが発生。動的生成される記事ページへのリクエストが、1時間あたり5万件、ピーク時には1分間に1500件記録されていました。当サイトで公開中の5万件強の全記事数に匹敵するリクエストが発生した原因の調査と、実施した対策について紹介します CloudWatchメトリクス確認原因を特定するため、AWS WAFのメトリクスを分析しました bot:category AI の急増 AIカテゴリのリクエスト数が、1時間あたり5万件まで顕著に増加しました。他のカテゴリ（search_engine: Google、Bing など、social_media: X、Facebook など）には大きな変動は見られませんでした。 LabelNamespace="awswaf:managed:aws:bot-contr
- aws
- あとで読む
- AI
- security
- セキュリティ
- WAF
- ネットワーク
- web
- network
X（Twitter）のrobots.txtがおかしい（このミスはちょっと恥ずかしいかも）【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
- 104 users
- webtan.impress.co.jp
- テクノロジー
- 2024/07/12
robots.txtでは正規表現は使えない――改めて技術を正しく理解したいと心から思うミスがX（Twitter）のサイトに見付かった。今回のピックアップでは、この件に加えて、複数サイトを管理している人向けの便利なrobots.txt管理術をお届けする。もちろん、ほかにもSEO情報をしっかりまとめている。ローカルSEOのテクニックと基本情報、デスクトップ用Googlebot終了、著者情報とSEO、生成AIなどなど、今回もあなたのSEO力アップに役立つ情報をお届けする。 X（Twitter）のrobots.txtがおかしい（このミスはちょっと恥ずかしいかも）複数サイト管理者に朗報： robots.txtはリダイレクトでまとめて管理できるローカルSEOで上位表示するためのTIPS×8ローカルSEOスターターガイド（基本版）2024年6月のグーグル検索オフィスアワー：コピーコンテンツが正規UR
- !!
- Twitter
- あとで読む
- web
- 情報
検索結果に表示させない技術 robots.txt と X-Robots-Tag を正しく組み合わせよう - Techtouch Developers Blog
- 89 users
- tech.techtouch.jp
- テクノロジー
- 2025/02/27
はじめに robots.txt robots.txt の基本 robots.txt の限界 X-Robots-Tag X-Robots-Tag の仕様 X-Robots-Tag と robots.txt の組み合わせに注意 X-Robots-Tag の限界さいごに参照はじめにこんにちは。SRE マネージャーの izzii です。最近会社でオフィスの引越しがありました。前のオフィスはコワーキングスペースで複数社で空間を分割するようなオフィスだったのですが、フロア丸々テックタッチというのが新鮮です！エレベーターを上がると会社のロゴが大きく見えるのが嬉しい！さて、私は一年ほど前にウェブセキュリティの文脈でクローラーについて調査することがありました。そこで robots.txt や meta tag に関する不正確であったり古い記事が、検索の上位に紛れ込んでいることに気がつきました。同
- 検索
- あとで読む
- web
- blog
- Web制作
- 技術
- google
生成AI検索エンジンのPerplexityはクローラーを防ぐ「robots.txt」を無視してウェブサイトから情報を抜き出している
- 62 users
- gigazine.net
- テクノロジー
- 2024/06/17
Perplexityは生成AIを利用した検索エンジンであり、ユーザーの質問に対してAIが直接回答を生成できるほか、ユーザーのプロンプトに基づいたウェブページを生成する「Pages」という機能を提供しています。そんなPerplexityが、検索エンジンやAIトレーニングなどのボット(クローラー)を制御するテキストファイル「robots.txt」の指示を無視し、管理者がPerplexityの巡回を禁止したウェブサイトにもアクセスしていることが判明しました。 Perplexity AI Is Lying about Their User Agent • Robb Knight https://rknight.me/blog/perplexity-ai-is-lying-about-its-user-agent/ GoogleやBingなどの検索エンジンやChatGPTをはじめとする生成AIは、ク
- 人工知能
- AI
- 倫理
- techfeed
- あとで読む
- Web
- gigazine
- search
- 検索
あなたも同じミスをするかも？ robots.txtのミスで予想外のページをクロール禁止していた悲劇【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
- 44 users
- webtan.impress.co.jp
- テクノロジー
- 2022/11/04
最強級のSEOと最上級のコンテンツすら台無しにする、robots.txtの予想と違う挙動を、あなたは知っているだろうか？知らなければうっかりハマってしまい、「コンテンツがインデックスされない！」となってしまうかも。「実際の挙動の根拠は？」「どうすればこの落とし穴を避けられるの？」を含めて、詳しく解説する。ほかにも、モバイル検索でのサイト名表示や、SERPでのCTR向上事例、Google検索にとってのAIの意味などなど、今回はちょっと濃いめのSEOトピックをお届けする。グーグルのモバイル検索でサイト名が表示されるようになったスニペット改善でCTR向上・検索トラフィック約2倍に⬆UP！2022年10月のスパムアップデートをグーグルが実施10月のグーグルオフィスアワー：サイトマップのlastmod、MFIに移行しない、サイト名が表示されないなど人間が書いたコンテンツをグーグルがスパム判
- SEO
- あとで読む
- 情報
- google
- サイト
- techfeed
飲酒し、路上に寝込む on Twitter: "デジタル庁の note の robots.txt、官公庁なのでちゃんとクロールできるようにしといてほしいですね https://t.co/J47LFvg5nZ https://t.co/v4txJkUXqG"
- 36 users
- twitter.com/fuba
- 政治と経済
- 2021/05/13
デジタル庁の note の robots.txt、官公庁なのでちゃんとクロールできるようにしといてほしいですね https://t.co/J47LFvg5nZ https://t.co/v4txJkUXqG
- hoge
- 安倍晋三
- politics
- news
- あとで読む
robots.txtによるクローリング禁止が急増 — AIがWeb全体をクローズドにしつつある
- 36 users
- techfeed.io
- テクノロジー
- 2024/09/06
9月1日、海外のテックメディアIEEE Spectrumで「AIがウェブクローリングをめぐる戦いを巻き起こす(AI Has Created a Battle Over Web Crawling)」と題した記事が公開された。この記事では、ジェネレーティブAIの進化とそれに伴うウェブクローリングに関する論争について、AI研究者グループ「Data Provenance Initiative」のリードリサーチャーであるシェイン・ロングプレ（Shayne Longpre）氏へのインタビューを通じて詳しく解説されている。ジェネレーティブAIとデータ収集の問題ジェネレーティブAIは、膨大なデータセットを使用して訓練されることで、驚異的なパフォーマンスを発揮するが、そのデータセットの大部分は、私たちが日常的にインターネット上に公開している情報で構成されている。これには、ブログ投稿、ビデオコンテンツ、S
Twitter、Google以外の検索エンジンを締め出しへ？ robots.txtが大幅改変され話題に【やじうまWatch】
- 34 users
- internet.watch.impress.co.jp
- テクノロジー
- 2023/07/28
- search
- 検索
- Twitter
- Yahoo!
- 話題
- 資料
- neta
- google
- これはひどい
WebサイトのAI学習利用を拒否するrobots.txt拡張の議論 - ASnoKaze blog
- 33 users
- asnokaze.hatenablog.com
- テクノロジー
- 2024/10/24
WebページがAIにより学習されないように、拒否できるようにしようという議論があります。具体的には、ai.txtやrobots.txtなどを使って拒否する提案が出ています。 ai.txt (spawing) https://spawning.ai/ai-txt で定義されている。 ai.txtの形で配置する例: User-Agent: * Disallow: *.txt Disallow: *.pdf Disallow: *.doc Disallow: *.docx Disallow: *.odt (略) robots.txt のAI向け拡張 (Microsoft) Microsoftの方らが『Robots Exclusion Protocol Extension to manage AI content use』という提案をIETFに提出しているという目的ベースで許可・拒否が出来
- 人工知能
- AI
- Microsoft
- Google
- あとで読む
「PerplexityのAIがクローラーをブロックするrobots.txtを無視している」との指摘に対しCEOが「無視しているわけではないがサードパーティーのクローラーに依存している」と主張
- 33 users
- gigazine.net
- テクノロジー
- 2024/06/24
生成AIを利用した検索エンジンの「Perplexity」に対して、検索エンジンやAIトレーニングなどのボット(クローラー)を制御できるテキストファイル「robots.txt」の指示を無視し、管理者がPerplexityの巡回を禁止したウェブサイトにもアクセスしていることが指摘されています。これに対し、Perplexityのアラヴィンド・スリニヴァスCEOが、「robots.txtの指示を無視しているわけではない」「自社のクローラーだけでなく、サードパーティーのクローラーにも依存している」と釈明しました。 Perplexity AI CEO Aravind Srinivas on plagiarism accusations - Fast Company https://www.fastcompany.com/91144894/perplexity-ai-ceo-aravind-sriniv
- AI
- 人工知能
- illust
- trouble
- search
SEOの知識にクイズで挑戦！あなたは正解できる？ robots.txt初級＋中級【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
- 24 users
- webtan.impress.co.jp
- テクノロジー
- 2020/07/17
知っておいて損はない（でもちょっとマニアック）SEOの知識にクイズで挑戦！あなたは仕様を理解してrobots.txtを書き、Googlebotをちゃんとコントロールできるか！？ほかにも、JavaScriptレンダリング最新情報、SEOでの重要度が高まっている構造化データ、SEOの「ペナルティ」、グーグルのAMPの扱いなどなど、今週もSEOやサイト運営に役立つ、次のような情報をまとめてお届けする。 GooglebotのJavaScriptレンダリングに関する2つの最新豆知識リッチリザルトテストが正式版になり構造化データテストツールは引退へ動画の構造化データに関するアップデートグーグルに送ったスパムレポートはどのように使われるのか？SEOの「ペナルティ」は古い考え方!?グーグルが新型コロナ対策に新型ツールで尽力グーグルがAMPを捨てる日は来るのか？7月のオフィスアワー開催――ネイティブL
GIANT ROBOTS 日本の巨大ロボット群像
- 16 users
- artne.jp
- テクノロジー
- 2023/06/28
1963年のテレビアニメ『鉄人28号』放映から60年。日本では脈々と「巨大ロボット」が登場するアニメーションが制作されてきました。その魅力とは何なのか？歴代巨大ロボットのデザインと映像表現の特質に迫ります。
- robot
- ロボット
- event
- イベント
Watch an army of Spot and Pepper robots cheerlead a baseball game in an empty stadium | TechCrunch
- 11 users
- techcrunch.com
- テクノロジー
- 2020/07/08
AI Watch an army of Spot and Pepper robots cheerlead a baseball game in an empty stadium NPB games are known for engaging antics that extend well beyond the play on the field. But what’s to be done in the era of COVID-19, when baseball is played in front of an empty stadium? For many — including Korea’s KBO League and the upcoming shortened MLB season — cardboard cutouts are an attempt to bring so
- あとで読む
グーグルのAIに自社コンテンツを学習させたくない！ Bardをブロックするrobots.txt指定【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
- 10 users
- webtan.impress.co.jp
- テクノロジー
- 2023/10/13
「ChatGPTにもBardにも、生成AIの学習にウチのコンテンツを使わせない！」そんなあなたに朗報。GPTBotに加えて、グーグルのAIによる学習を防ぐ方法が公開された。 ChatGPTとBard（とVertex AI）による学習をまとめて禁止するrobots.txtの指定も紹介する。ピックアップ意外にも、今回も良ネタが多数。 9月のヘルプフルコンテンツアップデートの特徴「広告UX」と「実経験」、10月のコアアップデートとスパムアップデートなど、グーグル情報が3件。さらに検索結果でのサイト名表示、Googleビジネスプロフィールの新機能などなど、グーグル最新事情から、SEO以外にも役立つ情報まで、今週もあなたに役立つネタを吸収していただきたい。グーグルのAIに自社サイトのコンテンツを学習させたくない！ Bardをブロックするrobots.txt指定2023年9月のヘルプフル
- web
robots meta タグを省略したページをGoogleはどのように処理するのか？ noindexがないとどうなる？ nofollowがないとどうなる？
- 9 users
- www.suzukikenichi.com
- テクノロジー
- 2021/03/19
[レベル: 初級] robots meta タグに関する技術ドキュメントを Google は更新しました。次の 2 点の追加です。各 robots meta タグがないときの Google のデフォルトの処理 max-snippet robots meta タグの具体例この記事を書いている時点で、日本語ページはまだ更新していないので、先取りで紹介します。各 robots meta タグがないときの Google のデフォルトの処理 noindex や nofollow など十数種類の robots meta タグを Google 検索はサポートします。しかし、すべての robots meta タグを 1 つのページに記述しているサイトはないでしょう。それぞれの robots meta タグがない場合の既定の処理がドキュメントに追加されました。次のようになります。 noinde
- seo
- Google
GitHub - ai-robots-txt/ai.robots.txt: A list of AI agents and robots to block.
- 9 users
- github.com/ai-robots-txt
- テクノロジー
- 2024/03/28
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
AWS empowers SEQSENSE to build Autonomous Security Robots | Amazon Web Services
- 8 users
- aws.amazon.com
- テクノロジー
- 2023/03/02
AWS Robotics Blog AWS empowers SEQSENSE to build Autonomous Security Robots Introduction According to national institute of population and social security research, the working population in Japan is expected to decrease by 30% in the next 30 years. A rapidly aging population in Japan causes a shortage of labor in the security space. SEQSENSE, a robotics startup company in Japan, aims to solve thi
- reInvent
- Robotics
- Golang
- AWS
- ロボット
【ロボットに倫理を教える（Moral Machines Teaching Robots Right from Wrong）】レビュー - sugarless time
- 8 users
- www.sugarless-time.com
- 暮らし
- 2024/09/20
前書き目次レビューまとめおまけ前書き以前【ロボット法】についてのレビューを投稿しました。 www.sugarless-time.com 今回もそっち関係の書籍レビューになります。【ロボット法】は2017年に初版発行、こちらの初版(翻訳版)は2019年発行ですが、翻訳前の初版は2009年に発行されており、今から15年も前のものになります。目次すべての章についてレビューしたいくらいなのですが、そんな大作を書くのも大変なので、本書の目次を掲載します。目次を追うだけでどのような本かは想像できると思いますので参考にしてください。序章第1章なぜ機械道徳なのか？路面電車の運転手とロボットのエンジニア倫理的な殺人機械？差し迫った危険第2章道徳の工学それはエンジニアの義務なのか？ムーアによる倫理的エージェントの分類第3章人類はコンピュータに道徳的な意思決定をしてほし
昨日、Twitterはrobots.txtを更新。 Googleだけに許可を出して、他のbotを基本的にブロック。Microsoft Bingなど多くの検索エンジンはTwitterをまともに検索できなくなった。
- 7 users
- twitter.com
- テクノロジー
- 2023/07/26
- Microsoft
- twitter
- Google
- web
Reza Zadeh on Twitter: "It's pretty awesome how dancing makes robots less intimidating. Looking forward to seeing more nontrivial Machine L… https://t.co/GqLNDidBMe"
- 7 users
- twitter.com/Reza_Zadeh
- 世の中
- 2020/12/30
It's pretty awesome how dancing makes robots less intimidating. Looking forward to seeing more nontrivial Machine L… https://t.co/GqLNDidBMe
- technology
ジェイムス・ブレイクとブライアン・イーノによる対話『Talking Robots Into Heaven』が公開！ | indienative
- 6 users
- www.indienative.com
- エンタメ
- 2023/09/20
ジェイムス・ブレイクとブライアン・イーノによる対話『Talking Robots Into Heaven』が公開！ James Blake (ジェイムス・ブレイク) と Brian Eno (ブライアン・イーノ) の対話した映像『Talking Robots Into Heaven』が公開！ジェームズ・ブレイクとブライアン・イーノは、音楽制作に関する洞察と音楽の進化についての興味深い議論を展開しています。イーノは、音楽制作プロセスとしてのループに疑念を抱き、予測可能なコード進行に対する考えを共有します。また、音楽のジャンルや性別に関する固定観念に挑戦し、男性の音楽の幅広さと感情表現の多様性について議論も行います。彼らはアートの力と、音楽が共通の経験を提供する方法についても話し合います。イーノはループ音楽に疑念を抱き、予測可能なコード進行から逃れようと努力している。音楽制作において、他の
Google’s Plan for the Future of Work: Privacy Robots and Balloon Walls (Published 2021)
- 6 users
- www.nytimes.com
- テクノロジー
- 2021/05/03
MOUNTAIN VIEW, Calif. — Google’s first office was a cluttered Silicon Valley garage crammed with desks resting on sawhorses. In 2003, five years after its founding, the company moved into a sprawling campus called the Googleplex. The airy, open offices and whimsical common spaces set a standard for what an innovative workplace was supposed to look like. Over the years, the amenities piled up. The
- ロボット
Googleの親会社Alphabet、「X」のロボット部門を「Everyday Robots」としてスピンアウト
- 6 users
- www.itmedia.co.jp
- テクノロジー
- 2021/11/21
米Googleを傘下に持つAlphabetは11月19日（現地時間）、“ムーンショット”プロジェクト事業Xのロボットプロジェクトを新企業「Everyday Robots」としてスピンアウトしたと発表した。LinkedInの概要欄には「より良い毎日のためのヘルパーロボット」とある。 2016年にロボット部門の責任者に就任し、現在は「CRO」（最高ロボット責任者）という肩書のハンス・ピーター・ブロンドモ氏は公式ブログで「われわれはGoogleのチームと協力して新タイプのロボットを構築している。人間の日常生活をサポートするために、自分で学ぶロボットだ。われわれのビジョンは、コンピュータがデジタル世界に変革をもたらしたように、リアルでフィジカルな世界に変革をもたらすロボットだ」と語った。同社のロボットのプロトタイプは既にGoogleの本社キャンパス内を動き回っており、カフェのテーブルを拭いたり、
- ロボット
AI haters build tarpits to trap and trick AI scrapers that ignore robots.txt
- 5 users
- arstechnica.com
- テクノロジー
- 2025/01/29
View of an insect dissolving in a carnivorous pitcher plant, which inspired an AI tarpit called Nepenthes. Credit: Jerry Redfern / Contributor | LightRocket View of an insect dissolving in a carnivorous pitcher plant, which inspired an AI tarpit called Nepenthes. Credit: Jerry Redfern / Contributor | LightRocket Last summer, Anthropic inspired backlash when its ClaudeBot AI crawler was accused of
「お前ら全部ゆるさん」Xのrobots.txtを覗いてみたけど、AI学習ふくめて汎用クローラー片っ端からはじいてるね
- 5 users
- posfie.com
- テクノロジー
- 2024/11/16
のうめん🏗️👺 @nomen_machine Xのrobots.txtを覗いてみたけど、AI学習含めて汎用クローラー片っ端から弾いてるね Xに投稿されたポストは完全にGrokだけに活かすつもりだ pic.x.com/qGyq7AK5et 2024-11-15 17:49:14
- AI
- セキュリティ
Anthropicによるサイトのスクレイピングを防ぐrobots.txtの内容がすでに古くなっているという指摘、クローラーは24時間で100万アクセスしている事例も
- 5 users
- gigazine.net
- テクノロジー
- 2024/07/30
生成AIの流行により、ネット上にコンテンツを公開している企業や組織が、トレーニングデータとして使われないように対策を行う事例が出てきています。対策の1つはサイトのクローラーに対してアクセスを許すページとアクセスを許さないページを示す「robots.txt」を用いた方法ですが、実態として、Anthropicのクローラーを防ぐための内容はすでに使われていないクローラーの名前になっていて、使用中のクローラーは防げていない状況になっているそうです。 Websites are Blocking the Wrong AI Scrapers (Because AI Companies Keep Making New Ones) https://www.404media.co/websites-are-blocking-the-wrong-ai-scrapers-because-ai-companies-
- 人工知能
- ai
- web
SEQSENSE Relies on AWS to Build Autonomous Security Robots
- 5 users
- www.robotics247.com
- テクノロジー
- 2023/03/02
ISD unveils advanced WCS software for UltraStore mid-load AS/RS
- ロボット
- AWS
Google、クロールの統計情報レポートのヘルプ記事を更新。Googlebot がサイトをクロールする際に robots.txt ファイルをリクエストして使用する仕組みをより詳細に説明
- 4 users
- www.suzukikenichi.com
- テクノロジー
- 2022/06/28
[レベル: 上級] クロールの統計情報レポートについて解説するヘルプ記事を Google は更新しました。 Googlebot がサイトをクロールする際に robots.txt ファイルをリクエストして使用する仕組みの説明がより詳細になりました。最後のレスポンスが不成功か、24 時間以上経過している場合の挙動 Google がサイトをクロールする際に robots.txt ファイルをリクエストして使用する仕組みを解説するセクションの更新前です。更新後は次のようになりました。文字量が増えていることに気付くはずです。特に注目したいのは、robots.txt をリクエストしたときの最後のレスポンスが不成功か、24 時間以上経過している場合の Googlebot の挙動です。 3. 最後のレスポンスが不成功であるか、24 時間以上経過している場合、Google は robots.txt f
- SEO
- google
robots.txt の置き忘れで１万円を失った話
- 4 users
- pistatium.dev
- 学び
- 2021/12/03
Are Japanese anime robots isometric or allometric?
- 4 users
- jgeekstudies.org
- 学び
- 2024/04/27
Sangjin Ryu1 & Kiyotaka Obunai2 1Department of Mechanical and Materials Engineering, University of Nebraska-Lincoln, Lincoln, NE, USA. 2Department of Mechanical and Systems Engineering, Doshisha University, Kyoto, Japan. Emails: sryu2 (at) unl (dot) edu; kiobunai (at) mail (dot) doshisha (dot) ac (dot) jp Download PDF Robots have been a very popular theme of Japanese animation, or anime, since the
OpenAI's Rules for Model Behavior, Better Brain-Controlled Robots, and more
- 4 users
- www.deeplearning.ai
- テクノロジー
- 2024/05/17
Dear friends, In the last couple of days, Google announced a doubling of Gemini Pro 1.5's input context window from 1 million to 2 million tokens, and OpenAI released GPT-4o, which generates tokens 2x faster and 50% cheaper than GPT-4 Turbo and natively accepts and generates multimodal tokens. I view these developments as the latest in an 18-month trend. Given the improvements we've seen, best pra
- あとで読む
PLEN.D(プレン.ディー) - 運動神経抜群！小型ロボット - DMM.make ROBOTS
- 4 users
- robots.dmm.com
- テクノロジー
- 2020/06/01
どこへでも一緒にお出かけできる、小さなお友達。� あなたの操作でバツグンの運動神経を披露すれば、一躍人気者に。� 子供も大人もみんなで楽しめる、高性能なロボットです。お子様と、仲間と、一人でもくもくと。ロボットを自分で組み立てられる楽しさドライバー1本で、簡単に組み立てられるのでお子様とも気軽に楽しみながらロボットの構造を知ることができます。自分で作ったロボットが、自分の手によって動く感動をぜひ味わってみてください！ダンスやサッカー、ローラースケートなど PLEN.Dを操作してみんなで楽しもう一人でももちろん楽しめるPLEN.Dですが、仲間とPLEN.Dを持ち寄れば、みんなでサッカーやパイルアップゲームを楽しんだり、ローラースケートで競争したりとさらに楽しみが広がります。その動画をアップすれば、あなたのPLEN.Dも人気動画として話題になるかも？
- ロボット
- Make
- HotEntry
- 欲しい
ChatGPTのウェブクローラはGPTBot。robots.txtでブロック可能
- 4 users
- www.suzukikenichi.com
- テクノロジー
- 2023/08/08
[レベル: 上級] 管理するサイトのコンテンツを ChatGPT に利用されるのを防ぐために、ChatGPT が運用するクローラの GPTBot を robots.txt でブロックできます。 ChatGPT のウェブクローラは GPTBot ChatGPT の開発/提供元である OpenAI は、ウェブクローラに関係する技術ドキュメントを最近新たに公開しました。 OpenAI が使用するクローラのユーザーエージェント (UA: User Agenet) は GPTBot です。完全な UA 文字列は次のとおりです。 Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot) GPTBot の用途は次のとおりです。 Web pages craw
- 人工知能
- techfeed
- seo
- ai
基本プレイ無料PvPロボットシューター『War Robots: Frontiers』発表。カスタマイズした重量ロボで6v6バトル - AUTOMATON
- 4 users
- automaton-media.com
- アニメとゲーム
- 2022/11/11
パブリッシャーのMY.GAMESは11月10日、『War Robots: Frontiers』を発表した。対応プラットフォームはPC（Steam/Windows）およびPS4/PS5/Xbox One/Xbox Series X|S。2023年に正式リリース予定で、基本プレイ無料にて提供される見込みだ。 PC版ではPioneer Pack購入者向けに、現地時間11月24日から早期アクセス配信が開始予定。『War Robots: Frontiers』は三人称視点のマルチプレイ対戦シューターだ。プレイヤーはWar Robotと呼ばれる戦闘ロボットを操縦し、6対6のチーム戦を繰り広げる。War Robotはカスタマイズ可能で、武器やパーツのほか、アビリティやパイロットを変更することもできるそうだ。武器は4種類装備可能で、実弾だけでなく電撃を放つ武装の存在も確認できる。またSpecial Cos
- ロボット
- ゲーム
8 Common Robots.txt Issues And How To Fix Them
- 4 users
- www.searchenginejournal.com
- テクノロジー
- 2024/04/14
Partner Resource How to Build a Successful SEO Consultancy. Watch this exclusive episode of MozPod for strategies that can transform your consultancy, from defining your branding to finding your first clients. Download Now Guide How AI Can Reshape Your Ecommerce Marketing in 2025 In this on-demand webinar, discover how AI can unlock scalable growth and automate key processes in your ecommerce busi
- あとで読む
『https://note.digital.go.jp/robots.txt』へのコメント
- 4 users
- b.hatena.ne.jp
- 暮らし
- 2021/05/13
note本家のrobots.txtと同一ではない。megalodon（ウェブ魚拓）、ia_archiver（Internet Archive）がDisallowに設定されているのは意図的と思われる。 https://note.com/robots.txt / 日経のrobots.txtと同一だった。 https://comemo.nikkei.com/robots.txt <blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4702568062960124290/comment/stp7" data-user-id="stp7" data-entry-url="https://b.hatena.ne.jp/entry/s/note.dig
WordPress 5.7 で導入された Robots API で meta robots 関連の出力が改善された話＆新しいフックの使い方
- 3 users
- mypacecreator.net
- テクノロジー
- 2021/10/30
新 Robots API の個人的に嬉しい点その2. サイト内検索結果がnoindexになった！ WordPressのサイト内検索結果ページに <meta name='robots' content='noindex, follow' /> が出力されるようになりました。これまでは、WordPressのサイト内検索結果ページはnoindexではなかったため、検索結果ページを狙ったスパム行為というものがしばしば見られました。 WordPressでは、特にカスタマイズをしていない場合、サイト上に検索フォームを設置している・いないにかかわらず、設置サイトのURLに ‘?s=検索ワード’ というパラメータをつければ、サイト内検索結果が表示されます。たとえば、このブログであれば https://mypacecreator.net/?s=WordPress にアクセスすることで、ウィジェットにあ
- WordPress
- api
robots.txtはインデックス拒否に使える？使えない？
- 3 users
- www.suzukikenichi.com
- テクノロジー
- 2021/03/10
[レベル: 初級] robots.txt は、検索エンジンのクロールを拒否する仕組みであって、インデックスを拒否する仕組みではありません。そうかと言って、インデックス拒否にまったく役立たないということでもありません。 robots.txt でブロックしたページでも検索結果に表示される robots.txt でクロールをブロックしたページでも検索結果に出てくることがあります。たとえば、Twitter カードのバリデーションを検証するツールのページは robots.txt でブロックされています。にもかかわらず、検索結果には出てきます。このツールを公開している cards-dev.twitter.com の robots.txt はサイト全体のクロールをブロックしています。ただし、クロールしないためページの内容を検索エンジンは読み取ることができません。 meta descriptio
Robotcop: enforcing your robots.txt policies and stopping bots before they reach your website
- 3 users
- blog.cloudflare.com
- テクノロジー
- 2024/12/11
Cloudflare’s AI Audit dashboard allows you to easily understand how AI companies and services access your content. AI Audit gives a summary of request counts broken out by bot, detailed path summaries for more granular insights, and the ability to filter by categories like AI Search or AI Crawler. Today, we're going one step further. You can now quickly see which AI services are honoring your robo
- ai