並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 124件

新着順 人気順

.txtの検索結果1 - 40 件 / 124件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

.txtに関するエントリは124件あります。 セキュリティwebsecurity などが関連タグです。 人気エントリには 『辻正浩 | Masahiro Tsuji on Twitter: "よくあるrobots.txtの誤りで、致命的なトラブルになる事もあるのにあまり知られていない仕様の紹介で連ツイート。 誤りは表に出ることが少ないので日本語で実例紹介を見たことが無いのですが、公共の面も持つサイトでの誤りを発見したので注意喚起意図で実例を紹介します。(続く"』などがあります。
  • 辻正浩 | Masahiro Tsuji on Twitter: "よくあるrobots.txtの誤りで、致命的なトラブルになる事もあるのにあまり知られていない仕様の紹介で連ツイート。 誤りは表に出ることが少ないので日本語で実例紹介を見たことが無いのですが、公共の面も持つサイトでの誤りを発見したので注意喚起意図で実例を紹介します。(続く"

      辻正浩 | Masahiro Tsuji on Twitter: "よくあるrobots.txtの誤りで、致命的なトラブルになる事もあるのにあまり知られていない仕様の紹介で連ツイート。 誤りは表に出ることが少ないので日本語で実例紹介を見たことが無いのですが、公共の面も持つサイトでの誤りを発見したので注意喚起意図で実例を紹介します。(続く"
    • DNS前史:HOSTS.TXTとドメイン名ができるまで

      こんにちは、技術開発室の滝澤です。 先月(2022年7月)、『Software Design 2022年8月号』の特集記事『WebエンジニアのためのDNS速習講座』に『第2章:DNSの構成要素と名前解決のしくみ』という記事を寄稿しました。第1章でも滝澤が趣味で作成した資料『ドメイン名の歴史』が参考文献として掲載されていました。よい機会なので、ドメイン名ができるまでの歴史について文章としてまとめようと思い、この本ブログ記事を書きました。 なお、筆者自身はインターネットの原型であるARPANETや80年代のインターネットをリアルタイムには体験してはいないため、RFC(Request for Comments)やインターネット上にある当時のホストのアーカイブを元に調査した内容をまとめたものになります。 ARPANETの時代 1969年から1980年代初期にかけてのインターネットの原型となったAR

      • 【追記あり】はてなブログでは2024年7月1日以降にads.txtの配信を開始する予定です。また、ads.txtの配信開始に先立ち、ユーザーのads.txtを保存する機能の提供を開始しました - はてなブログ開発ブログ

        本記事にはご自身で広告を設置されているユーザー様が行うべき対応を記載しています。対応を行わなかった場合は、ご自身の広告が表示されなくなるなど不利益が発生する場合があります。 はてなブログでは、広告詐欺を減らすための仕組み「ads.txt*1」の配信を2024年7月1日以降を目処に開始する予定です。また、ads.txtの配信開始に先立ち、ユーザーが利用する ads.txt を保存する機能の提供を開始しました。ads.txtの配信開始以前に設定していただくことで、配信開始とともに有効なads.txtを配信することができます。 はてなの広告を掲載しているブログでは、はてなが利用する ads.txt の配信を開始する予定です。そのため「無料プランではてなブログの広告を表示しつつ、ご自身の広告も表示している」という場合*2、ads.txt の設定を行わなければご自身の広告が表示されなくなる可能性があ

          【追記あり】はてなブログでは2024年7月1日以降にads.txtの配信を開始する予定です。また、ads.txtの配信開始に先立ち、ユーザーのads.txtを保存する機能の提供を開始しました - はてなブログ開発ブログ
        • 画像・PDF・TXT・メールなどの中身を読み取って検索できるようにするオープンソースのドキュメント整理ツール「Teedy」レビュー

          Teedyはさまざまな種類のファイルの中身を読み取って検索できる状態にしてくれるドキュメント整理ツールです。受信したメールを自動で取り込む設定もできるとのことなので、実際にセルフホストして使い勝手を確かめてみました。 sismics/docs: Lightweight document management system packed with all the features you can expect from big expensive solutions https://github.com/sismics/docs TeedyのインストールにDockerを利用するので、下記のリンクから自分の環境に合った方法でDockerをインストールします。 Install Docker Engine | Docker Documentation https://docs.docker.com

            画像・PDF・TXT・メールなどの中身を読み取って検索できるようにするオープンソースのドキュメント整理ツール「Teedy」レビュー
          • 楽天が「security.txt」を導入

            楽天グループがWebサーバーに「security.txt」と呼ぶテキストファイルを置き、脆弱性▼情報の受付窓口としてVDP(Vulnerability Disclosure Program、脆弱性開示プログラム)を開始したことがSNSで話題になった。2023年10月2日のことだ。同社広報はこれを事実だと認めた。 security.txtは、米Apple(アップル)や米Google(グーグル)、米GitHub(ギットハブ)、米IBMなど、海外IT大手は既に導入している。一方、日本では少ない。security.txtとは何か、国内でなぜ普及しないのか、脆弱性情報の受け付けとの関連性は――。順に見ていこう。 セキュリティーが高まる理由 security.txtとは、当該企業が提供する製品やサービスの脆弱性情報を見つけた人が通知する窓口を示すためのファイルだ。その仕様は、インターネット関連技術の標

              楽天が「security.txt」を導入
            • Bashで$(cat foo.txt)していませんか?$(< foo.txt)しよう - Lambdaカクテル

              以下の文書はBashを使う前提の話。 Bashにはコマンド置換(Command substitution)というのがある。$(another-command)のように、$()でコマンドを括る記法だ。これを利用すると、括弧で括られたコマンドが実行され、その標準出力が文字列として取り出され、$()全体を置き換える。シェルスクリプトでは非常によく見る技術だ。 この$()でファイルの内容を読み出すというのを最近見た。このような用法は非常によく見る。 foo-command $(cat params.txt) しかし、より良い書き方があるのでこれを提唱したい。$(< params.txt)と書くことで全く同等のことができる。しかも速いのでこちらのほうが完全に上位互換となる。 foo-command $(< params.txt) この方法はBashのドキュメントのコマンド置換のコーナーにちゃんと書か

                Bashで$(cat foo.txt)していませんか?$(< foo.txt)しよう - Lambdaカクテル
              • ChatGPTにgitのリポジトリ渡すと全ソースコード.txtをダウンロードさせてくれるやつ〜〜〜〜(AIに食わせるコード一覧が欲しい時用)

                クレデンシャル含むソースコードをChatGPT等のクラウドLLMサービスにアップロードしないでください。 今回のプロンプトはオープンなリポジトリのみを対象としており、シェルスクリプトが実行される環境もChatGPT側のクラウド上のサンドボックス内のみを想定しています。 ローカル環境では以下のシェルスクリプトをそのまま実行せずに、ご自身が作成したシェルスクリプトを利用してください。 以下はソースコードのプロジェクトルートで実行することで、ソースコードのダンプを.txt形式でダンプするシェルスクリプトです。 \`\`\` #!/bin/bash # バイナリファイルかどうかを判定する関数 is_binary_file() { local file="$1" local file_output file_output=$(file "$file") if [[ "$file_output" ==

                  ChatGPTにgitのリポジトリ渡すと全ソースコード.txtをダウンロードさせてくれるやつ〜〜〜〜(AIに食わせるコード一覧が欲しい時用)
                • branch を寝かせるときは TODO.txt を置いている - id:onk のはてなブログ

                  タイトルがすべて。 思いついたら手を動かしてしまう性質なので、秘蔵のブランチを大量に持っている。 秘蔵のブランチというのは、動いたけどチームメンバーを説得するのが面倒とか、テスト書くのが面倒とか、だいたい動いているけどやりきるのが面倒とかで main にマージしていないヤツ。 例えばフレームワークのメジャーバージョン上げるブランチとか、依存ライブラリをより一般的/現代的なものに交換するブランチや、より良い設計を思いついたのでガッと書き換えてしまうブランチが多いかな。 だいたい 1 年所属していると 80 ブランチぐらい溜まるので、週 1 つ以上は何か作りかけてる計算になる。 ローカルブランチの数、プロンプトに出しておくかな……。(秘蔵のブランチが溜まってる— Takafumi ONAKA (@onk) March 28, 2017 もちろん自分でいいアイディアだと思っているから実装している

                    branch を寝かせるときは TODO.txt を置いている - id:onk のはてなブログ
                  • FizzBuzz.txt(8エクサバイト)

                    FizzBuzzFS FizzBuzz問題といえば定期的にSNSで話題になっては変な解法が発明されることでおなじみですが(?)、ファイルシステムを使った事例が見当たらなかったのでやってみました。 まあ見ての通りというか…… /mnt/FizzBuzz に FizzBuzz.txt(8エクサバイト)があって、FizzBuzzが書いてあります。 どこまでも…… 容量の続く限り…… 以上!!!!!!! 技術解説 FUSE FUSE(Filesystem in USEr space)というソフトウェアを使うことで、簡単に新しいファイルシステムを実装することが可能です。 Rustにおいては、fuse crateの更新が停止した結果フォークが複数存在するようですが、利用者数と更新頻度的にfuser crateを使うのがよさそうです。 FileSystem traitが実装された値をmount2関数に渡

                      FizzBuzz.txt(8エクサバイト)
                    • X(Twitter)のrobots.txtがおかしい(このミスはちょっと恥ずかしいかも)【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ

                      robots.txtでは正規表現は使えない――改めて技術を正しく理解したいと心から思うミスがX(Twitter)のサイトに見付かった。今回のピックアップでは、この件に加えて、複数サイトを管理している人向けの便利なrobots.txt管理術をお届けする。 もちろん、ほかにもSEO情報をしっかりまとめている。ローカルSEOのテクニックと基本情報、デスクトップ用Googlebot終了、著者情報とSEO、生成AIなどなど、今回もあなたのSEO力アップに役立つ情報をお届けする。 X(Twitter)のrobots.txtがおかしい(このミスはちょっと恥ずかしいかも)複数サイト管理者に朗報: robots.txtはリダイレクトでまとめて管理できるローカルSEOで上位表示するためのTIPS×8ローカルSEOスターターガイド(基本版)2024年6月のグーグル検索オフィスアワー: コピーコンテンツが正規UR

                        X(Twitter)のrobots.txtがおかしい(このミスはちょっと恥ずかしいかも)【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
                      • "security.txt" についてまとめみた

                        CISSPの継続学習で知ったので忘却録としてまとめました。 security.txtとは security.txtとは、IETFが提唱している、ウェブサイトにセキュリティポリシーやサイトの脆弱性を発見したときの連絡先を記載するための標準で、robots.txt、ads.txt、humans.txtと同じようにテキスト形式で記載します。 投稿当時(2021/10/22)では、第12版のドラフトまで完成していますが、近くRFC化される見込みです。 (2023/11/1:更新) RFC 9116としてRFC化されました。 設定の効果 独自開発したWebサイトなどの脆弱性(XSSやSQLインジェクション等)の報告先を独自に設定することができます。したがって、いままでJPCERT/CCなどに報告する必要がある情報を作り手に直接連絡できるため、スピード感がある対応できると見込まれています。 ただし、表

                          "security.txt" についてまとめみた
                        • pdf2txt.py 便利すぎる(PDF表をテキスト化) | ず@沖縄

                          SARS-COV-2関連情報を集めていると、国や自治体、企業が公開している情報がPDFなのにムカついてしまう。ExcelをPDF化したものもあって、素直にxlsも出せよと思う。 (それでも画像データで公開している組織に比べればかなりマシなのが悲しい) 例えば、沖縄県のワクチン接種率の情報がPDFだ。「沖縄県のワクチン接種進捗状況/沖縄県」に掲載されている「県内市町村ごとの新型コロナワクチン接種件数」がPDFだ。タイトルは .xlsx になっているので、元々はExcelであったのだろう。 ご丁寧なことに情報が更新されると過去のPDFが消されてしまうので、接種率の変化を追っかけたい場合はPDFを手元に保存しておかないといけない。沖縄県の情報公開はこういうところがダメダメだと思う。消すなよ。 表から情報を抜き出す情報を抜き出すツールとしては adobeの【無料】PDFをExcelに変換 – Ad

                            pdf2txt.py 便利すぎる(PDF表をテキスト化) | ず@沖縄
                          • Google Search Console、「robots.txt によりブロックされましたが、インデックスに登録しました」への対処方法

                            Googleがrobots.txtを無視する robots.txtというファイルをブログに設置すると、特定のURLをGoogleがクロールしないように制御できます。 ttps://u-ff.com/korona-kannikensakitto-part1/?replytocom=64 ttps://u-ff.com/korona-kannikensakitto-part3/?replytocom=81 ttps://u-ff.com/crawl-budget/?replytocom=162 ttps://u-ff.com/crawl-budget/?replytocom=166 上記のようなURLへクロールしてほしくなかったので、robots.txtに Disallow: /*?replytocom=* という設定を追加しました。 詳しい設定手順は下記をご参照ください。

                              Google Search Console、「robots.txt によりブロックされましたが、インデックスに登録しました」への対処方法
                            • 生成AI検索エンジンのPerplexityはクローラーを防ぐ「robots.txt」を無視してウェブサイトから情報を抜き出している

                              Perplexityは生成AIを利用した検索エンジンであり、ユーザーの質問に対してAIが直接回答を生成できるほか、ユーザーのプロンプトに基づいたウェブページを生成する「Pages」という機能を提供しています。そんなPerplexityが、検索エンジンやAIトレーニングなどのボット(クローラー)を制御するテキストファイル「robots.txt」の指示を無視し、管理者がPerplexityの巡回を禁止したウェブサイトにもアクセスしていることが判明しました。 Perplexity AI Is Lying about Their User Agent • Robb Knight https://rknight.me/blog/perplexity-ai-is-lying-about-its-user-agent/ GoogleやBingなどの検索エンジンやChatGPTをはじめとする生成AIは、ク

                                生成AI検索エンジンのPerplexityはクローラーを防ぐ「robots.txt」を無視してウェブサイトから情報を抜き出している
                              • 楽天が公開サーバーにテキスト設置、セキュリティー向上に役立つ「security.txt」

                                楽天グループが2023年10月2日、Webサーバーにsecurity.txtを設置し、脆弱性情報の受付窓口としてVDP(脆弱性開示プログラム)を開始したことがSNSで話題になった。同社広報はこれを事実だと認めた。 日本有数のIT企業である楽天グループが「Webサーバーにテキストファイルを設置?」「脆弱性情報の受け付けがなぜ関係するの」と思った人もいるだろう。このsecurity.txtは、米Apple(アップル)や米Google(グーグル)、米GitHub(ギットハブ)、米IBMなど、IT関連の製品やサービスを提供する海外企業はすでに導入しているものだ。 一方、国内企業でsecurity.txtを導入している企業は少ない。security.txtとは何か、脆弱性情報の受け付けとの関連性、国内企業ではなぜ普及していないのか、順番に見ていこう。 security.txtがセキュリティー向上につ

                                  楽天が公開サーバーにテキスト設置、セキュリティー向上に役立つ「security.txt」
                                • 11/13:16bitセンセーションAnotherLayer #6.TXT | HoneyDipped

                                  第6話でした! 描くのが難しい新冬夜の髪型。 なんか堀江由衣さんが「うぐぅ、すごいこすられてるね〜」みたいなことをおっしゃってたとか何とか…。はわわ…すみません。プロット書いた時はもちろんキャストも何にも決まってなかったので、まさか堀江さん本人がいらっしゃるとは思わず調子乗ってました!まあ、決まってから、さらに足したんですけど…。 click↑ プロットはちょっと違いました。 ・コンシューマーとテレビアニメ ボクが1999年に上京して来た、という話を前回のブログ後書きでやりましたね。 1999年の秋葉原は、思えばまだ今のような感じではなく、ぱっと見はまだ普通に電気街だったように思います。下宿先の洗濯機や電子レンジも秋葉原でも買いましたし。しかし、オタクの街への変貌というものは確実に、大々的に行われていました。 そして、世間一般の方でも、徐々に変化が訪れていました。 またしても「ToHear

                                    11/13:16bitセンセーションAnotherLayer #6.TXT | HoneyDipped
                                  • あなたも同じミスをするかも? robots.txtのミスで予想外のページをクロール禁止していた悲劇【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ

                                    最強級のSEOと最上級のコンテンツすら台無しにする、robots.txtの予想と違う挙動を、あなたは知っているだろうか? 知らなければうっかりハマってしまい、「コンテンツがインデックスされない!」となってしまうかも。 「実際の挙動の根拠は?」「どうすればこの落とし穴を避けられるの?」を含めて、詳しく解説する。 ほかにも、モバイル検索でのサイト名表示や、SERPでのCTR向上事例、Google検索にとってのAIの意味などなど、今回はちょっと濃いめのSEOトピックをお届けする。 グーグルのモバイル検索でサイト名が表示されるようになったスニペット改善でCTR向上・検索トラフィック約2倍に⬆UP!2022年10月のスパムアップデートをグーグルが実施10月のグーグルオフィスアワー: サイトマップのlastmod、MFIに移行しない、サイト名が表示されないなど人間が書いたコンテンツをグーグルがスパム判

                                      あなたも同じミスをするかも? robots.txtのミスで予想外のページをクロール禁止していた悲劇【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
                                    • 「DNSを使わなくなる未来」もあり得る? HOSTS.TXTから続く「DNS」本来の役割と進化の歴史、明日のカタチ【Internet Week 2021】

                                        「DNSを使わなくなる未来」もあり得る? HOSTS.TXTから続く「DNS」本来の役割と進化の歴史、明日のカタチ【Internet Week 2021】
                                      • Googleアドセンス、ads.txtのメールが来たけど [今すぐ修正] の警告が見つからない

                                        Google AdSenseからメールが来た Googleアドセンス(adsense-noreply@google.com)からメールが来た。 件名: [ご対応ください] 広告収益を守るために ads.txt をご使用ください 本文: 広告収益を守るために ads.txt をご使用ください お客様 平素より Google のサービスをご利用いただきありがとうございます。 「ads.txt ファイル」の件につきまして、ご連絡いたします。弊社で確認しましたところ、お客様の AdSense アカウントの [自分のサイト] タブに含まれるサイトの中に、ads.txt ファイルが公開されていないサイトがあるようです。 ads.txt を使用すると、お客様の広告スペースの販売者をお客様が認定した相手 (AdSense など)のみに限定できるようになります。この方法で自サイトの広告枠の販売者を管理すれば

                                          Googleアドセンス、ads.txtのメールが来たけど [今すぐ修正] の警告が見つからない
                                        • a21_txt01 - essen-wiki

                                          (註)「.exeの大きさ」はWindows向けにgcc(MinGW)でコンパイルした時の大きさです。 しかしここで扱う言語処理系は、Windows専用というわけではなく、他のOSでも問題なく動作するようになっています。 純粋に言語処理系の規模の目安を示すために書いてあります。 基本的には小さければ小さいほどシンプルで、教材として理解しやすいと思っています(可読性を下げてまでのコンパクト化をやらないとして)。 行数を書いているのも同じ意図です。行数だけだと、1行の文字数をうんと増やすことで、見かけ上の行数を減らすことができますが、そんなことをしても実行ファイルサイズは減らないので、 この二つを併記すれば、規模感の目安としては十分だと思っています。 「速度のめやす」は、C言語で10億回ループさせた場合と、この言語で10億回ループさせた場合の処理時間の比を書いています。数が大きいほうが遅いです。

                                          • Stable Diffusionで画質を爆上げするテクニック【txt2imghd】を紹介 - Qiita

                                            txt2imgの基本についてはこちらをご覧ください。 はじめに Stable diffusionのイカしたテクニック、txt2imghdの仕組みを解説します。 簡単に試すことのできるGoogle Colabも添付しましたので、是非お試しください。 ↓の画像は、通常のtxt2imgとtxt2imghdで生成した画像を拡大して並べたものです。明らかに綺麗になっていることがわかります。 TL;DR txt2imghdとは、通常のtxt2imgにimg2imgと超解像技術を組み合わせることでStable diffusionで作成した画像のクオリティーを大幅に上昇させるテクニックです。 ※既に作成した画像に用いることも可能です。 実際のコードはこちらのリポジトリから確認できます。 またこちらから私が作成したGoogle Colabバージョンにアクセスできます。 txt2imghdの仕組み Stabl

                                              Stable Diffusionで画質を爆上げするテクニック【txt2imghd】を紹介 - Qiita
                                            • 10/23:16bitセンセーションAnotherLayer #3.TXT | HoneyDipped

                                              16bitセンセーションAL。第3話でした。 みなさん、お祭りを楽しんでいますか? どんどんつぶやいてくださいね。 今回はコノハは1996年にやってきました。 郄橋さんが、こないだおっしゃってたんです。「なんだかんだ言ってみんなアニメ16bit観るでしょ!って若木さんが仰ってたの聞いてボクは本当に? って思ってたんですけど、その通りでしたね」と。そりゃ見ますでしょ…。世の中には想像以上にエロゲを通っている人が多いんですよ。想像の16倍多い。なのになぜ今まで同じものがなかったのか。 ゼロ年代エロゲで同じことやったらもっとバズるかも知れないな…。まあ、そんな近い時代(ボク基準)やってもあんまり面白くないけどね!!ボクは、「痕」と「Piaキャロ」が同じ日に出てたよ。ということを今改めて知ってもらいたかった。在りし日のメッセサンオーを画面に映したかったん。これでこのアニメはもう役割を果たしましたよ

                                                10/23:16bitセンセーションAnotherLayer #3.TXT | HoneyDipped
                                              • 11/6:16bitセンセーションAnotherLayer #5.TXT | HoneyDipped

                                                第5話でした。 今回は「Kanon」でタイムスリップ。しかし、kanonもパカっと開けるタイプのパッケージで良かったですね!これが「Natural」みたいに箱から取り出して開けるタイプだったら、まどろっこしくてたまらん。そもそもあの紙箱めっちゃ開けにくいんだよ。なのにめちゃ定着してしまった。 ・エロゲの成長痛 今回の舞台は1999年です。 ボクはこの年、東京に上京しました。サンデーの連載アシスタントとして採用されたからです。「これで人生変わるかな」と思って。 まあ、そんなにすぐには人生変わらなかったんですが、一つ変わったことがありました。秋葉原で友達ができたことです。しかも何人も。ボクは京都にいる頃はずっと一人でゲームをやっていたのですが、上京して初めてゲームのことを話す相手が登場したのです。 ボクらは毎週、中央通りのとらのあなの下にあった喫茶店に集まっては話をしていました。で、そこで何を

                                                  11/6:16bitセンセーションAnotherLayer #5.TXT | HoneyDipped
                                                • 飲酒し、路上に寝込む on Twitter: "デジタル庁の note の robots.txt、官公庁なのでちゃんとクロールできるようにしといてほしいですね https://t.co/J47LFvg5nZ https://t.co/v4txJkUXqG"

                                                  デジタル庁の note の robots.txt、官公庁なのでちゃんとクロールできるようにしといてほしいですね https://t.co/J47LFvg5nZ https://t.co/v4txJkUXqG

                                                    飲酒し、路上に寝込む on Twitter: "デジタル庁の note の robots.txt、官公庁なのでちゃんとクロールできるようにしといてほしいですね https://t.co/J47LFvg5nZ https://t.co/v4txJkUXqG"
                                                  • robots.txtによるクローリング禁止が急増 — AIがWeb全体をクローズドにしつつある

                                                    9月1日、海外のテックメディアIEEE Spectrumで「AIがウェブクローリングをめぐる戦いを巻き起こす(AI Has Created a Battle Over Web Crawling)」と題した記事が公開された。この記事では、ジェネレーティブAIの進化とそれに伴うウェブクローリングに関する論争について、AI研究者グループ「Data Provenance Initiative」のリードリサーチャーであるシェイン・ロングプレ(Shayne Longpre)氏へのインタビューを通じて詳しく解説されている。 ジェネレーティブAIとデータ収集の問題 ジェネレーティブAIは、膨大なデータセットを使用して訓練されることで、驚異的なパフォーマンスを発揮するが、そのデータセットの大部分は、私たちが日常的にインターネット上に公開している情報で構成されている。これには、ブログ投稿、ビデオコンテンツ、S

                                                      robots.txtによるクローリング禁止が急増 — AIがWeb全体をクローズドにしつつある
                                                    • RFC 9116「security.txt」の紹介(2022年8月)の続報 - JPCERT/CC Eyes

                                                      早期警戒グループの戸塚です。昨年(2022年)8月に「A File Format to Aid in Security Vulnerability Disclosure - 正しくつながる第一歩」[1]で、同年4月に公開された「RFC 9116:A File Format to Aid in Security Vulnerability Disclosure」[2]を紹介しました。本記事では、その続報を2つお届けします(RFC 9116自体や私の業務との関係に関しては、2022年8月の記事をご確認ください)。 1つ目は、RFC 9116のおかげで開発者との脆弱性関連情報のコーディネーション(調整)が大変スムーズにできた事例です。 開発者との調整では、連絡しても応答がもらえないケースが少なくないことは昨年8月の記事でも書きました。このような場合、別の連絡先があればそちらにも連絡を試みます。今

                                                        RFC 9116「security.txt」の紹介(2022年8月)の続報 - JPCERT/CC Eyes
                                                      • Webサイトのバグの報告先を示す contributing.txt - ASnoKaze blog

                                                        Webサイトのバグを見つけたとしても、その報告先を知る統一的な方法は現状ありません。 たとえば、脆弱性についてはsecurity.txt があります。https://www.facebook.com/security.txt などで使われています。 asnokaze.hatenablog.com 同様の仕組みで、contributing.txt という形式でバグの報告先を示せるようにする仕組みが提案されています。提案仕様は「a simple way to provide informations for contributors」としてIETFに提出されています。 例 contributing.txtをWebページの最上位階層に配置します (例: https://example.com/contributing.txt ) そのファイルは次の情報を含めることが出来ます。 Admin: Va

                                                          Webサイトのバグの報告先を示す contributing.txt - ASnoKaze blog
                                                        • Twitter、Google以外の検索エンジンを締め出しへ? robots.txtが大幅改変され話題に【やじうまWatch】

                                                            Twitter、Google以外の検索エンジンを締め出しへ? robots.txtが大幅改変され話題に【やじうまWatch】
                                                          • GitHub - asg017/sqlite-lines: A SQLite extension for reading large files line-by-line (NDJSON, logs, txt, etc.)

                                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                              GitHub - asg017/sqlite-lines: A SQLite extension for reading large files line-by-line (NDJSON, logs, txt, etc.)
                                                            • 「PerplexityのAIがクローラーをブロックするrobots.txtを無視している」との指摘に対しCEOが「無視しているわけではないがサードパーティーのクローラーに依存している」と主張

                                                              生成AIを利用した検索エンジンの「Perplexity」に対して、検索エンジンやAIトレーニングなどのボット(クローラー)を制御できるテキストファイル「robots.txt」の指示を無視し、管理者がPerplexityの巡回を禁止したウェブサイトにもアクセスしていることが指摘されています。これに対し、Perplexityのアラヴィンド・スリニヴァスCEOが、「robots.txtの指示を無視しているわけではない」「自社のクローラーだけでなく、サードパーティーのクローラーにも依存している」と釈明しました。 Perplexity AI CEO Aravind Srinivas on plagiarism accusations - Fast Company https://www.fastcompany.com/91144894/perplexity-ai-ceo-aravind-sriniv

                                                                「PerplexityのAIがクローラーをブロックするrobots.txtを無視している」との指摘に対しCEOが「無視しているわけではないがサードパーティーのクローラーに依存している」と主張
                                                              • 10/9:16bitセンセーションAnotherLayer #1.TXT | HoneyDipped

                                                                第1話が終わりました。 いやぁ〜楽しそうな始まり方ですねぇ〜。 なんて、内心ドキドキですよ。あのプロットがどうなってるのかなって。でもとても楽しい、第1話だったと思います。ネタ的にも一杯あったしね。 ・ストーリー まあ、これをご覧ください。1話目の最後のシーン。そこにあたるボクのプロットです。 アニメを見てください。ほとんどまんまです。実はこの1話目は、プロットがほぼそのままアニメになっているんですねぇ。なぜなら、この時点では、メインライターがいなかったからです。まあ、なぜそうなったかは致し方ない部分も大いにあるのですが、現場に脚本家がいない!でも、ライターいなくてもアニメちゃんとできちゃうんですよね。 オリジナルストーリーをやるに当たって、ボクが1話目に作ったプロットはかなり長尺で、ペラ(原稿用紙)で言うと100枚を大幅に越える分量(1話分のペラは今は大体70〜80枚ぐらいのようです)が

                                                                  10/9:16bitセンセーションAnotherLayer #1.TXT | HoneyDipped
                                                                • Google Search Console、robots.txtでクロールを禁止する方法

                                                                  Google Search Consoleで、 インデックス > カバレッジ > 除外 を確認すると、以下のようなURLが多数インデックスから除外されていました。 ttps://u-ff.com/korona-kannikensakitto-part1/?replytocom=64 ttps://u-ff.com/korona-kannikensakitto-part3/?replytocom=81 ttps://u-ff.com/crawl-budget/?replytocom=162 ttps://u-ff.com/crawl-budget/?replytocom=166 調べてみると、「replytocom」というURLパラメーターはコメントの返信先を制御するためのものでした。 以下の3つのURLはページの見た目としてはまったく同じものです。 ttps://u-ff.com/craw

                                                                    Google Search Console、robots.txtでクロールを禁止する方法
                                                                  • 「打」で始まるTXTファイルを「Word」で開くと不思議な現象が…… X(Twitter)で話題に/今後も修正されることはないでしょう【やじうまの杜】

                                                                      「打」で始まるTXTファイルを「Word」で開くと不思議な現象が…… X(Twitter)で話題に/今後も修正されることはないでしょう【やじうまの杜】
                                                                    • SEOの知識にクイズで挑戦! あなたは正解できる? robots.txt初級+中級【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ

                                                                      知っておいて損はない(でもちょっとマニアック)SEOの知識にクイズで挑戦! あなたは仕様を理解してrobots.txtを書き、Googlebotをちゃんとコントロールできるか!? ほかにも、JavaScriptレンダリング最新情報、SEOでの重要度が高まっている構造化データ、SEOの「ペナルティ」、グーグルのAMPの扱いなどなど、今週もSEOやサイト運営に役立つ、次のような情報をまとめてお届けする。 GooglebotのJavaScriptレンダリングに関する2つの最新豆知識リッチリザルト テストが正式版になり構造化データテストツールは引退へ動画の構造化データに関するアップデートグーグルに送ったスパムレポートはどのように使われるのか?SEOの「ペナルティ」は古い考え方!?グーグルが新型コロナ対策に新型ツールで尽力グーグルがAMPを捨てる日は来るのか?7月のオフィスアワー開催――ネイティブL

                                                                        SEOの知識にクイズで挑戦! あなたは正解できる? robots.txt初級+中級【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ
                                                                      • Google AdSense(アドセンス)で収益に重大な影響が出ないよう、ads.txt ファイルの問題を修正してください(ロリポップレンタルサーバー編)

                                                                        GoogleAdsenseの収益に重大な影響が出ないよう、ads.txt ファイルの問題を修正してくださいというエラーを修正する方法が知りたいです GoogleAdsense(アドセンス)広告を設置してから 定期的に収益に重大な影響が出ないよう、ads.txt ファイルの問題を修正してくださいと表示されるようになりはてなブログで運用している時はヘルプデスクページには 現在のところ、はてなが提供しているドメイン ( *.hatenablog.com 等) か独自ドメインを設定しているブログかに関わらずads.txt を配信する機能は提供していませんと書かれている為 特に修正しなくてもいいのかなと? WordPressに移行後も放置していましたが定期的に収益に重大な影響が出ないよう、ads.txt ファイルの問題を修正してくださいと表示されるようになったのでエラーがでないように修正する方法を調

                                                                        • Google Search Console、「robots.txt テスター」の使い方

                                                                          robots.txtを変更した後にすること robots.txtを設定すると、特定のURLに対してクロールを禁止にしたり、許可したりできます。 robots.txtを変更後は 「果たして、このやり方であっているんだろうか?」 と心配になると思います。 そういうときは、「robots.txt テスター」を使うと動作確認が行えます。 「robots.txt テスター」はGoogle Search Consoleの付属機能です。 Google Search Consoleへ未登録の人は、先に登録しておきましょう。

                                                                            Google Search Console、「robots.txt テスター」の使い方
                                                                          • 画像生成AI「Stable Diffusion」で画像の部分修正を行うマスクを文字列から自動で作成してくれる「txt2mask for Stable Diffusion」の導入&使い方まとめ

                                                                            画像生成AI「Stable Diffusion」をウェブブラウザから簡単に操作できる「AUTOMATIC1111版Stable Diffusion web UI」用のアドオンで、画像から画像を生成する「img2img」モードで文字列に応じて自動的に画像を部分修正するためのマスクを作成してくれるのが「txt2mask for Stable Diffusion」です。このアドオンを導入することで、ブラシツールで画像を選択してマスクを作成する必要がなくなります。 GitHub - ThereforeGames/txt2mask: Automatically create masks for Stable Diffusion inpainting using natural language. https://github.com/ThereforeGames/txt2mask AUTOMATIC

                                                                              画像生成AI「Stable Diffusion」で画像の部分修正を行うマスクを文字列から自動で作成してくれる「txt2mask for Stable Diffusion」の導入&使い方まとめ
                                                                            • RFC 9116 から読み解く正しい security.txt の書き方

                                                                              security.txt は非常にシンプルな text/plain ファイルであり、既成のものをコピペして .well-known/security.txt として配置するだけであれば、ものの数分で対応できることでしょう。 また、自動で作成してくれる Web アプリも公式で用意されています。 ですが、例えば「Preferred-Languages に優先順位はあるの?」、「攻撃者によって security.txt が改ざんされたらどうなるの?」といったことは気にならないでしょうか。 私はとても気になります。 というわけで、早速 RFC9116 を読んでいきましょう。 tl;dr はこちら Abstract Section 1 は割愛すると書きましたが、概要にだけは最初に触れておきます。security.txt は第三者であるセキュリティリサーチャーのために書かれたものであり、この RFC

                                                                                RFC 9116 から読み解く正しい security.txt の書き方
                                                                              • chat-censorship/olympics/illegalwords.txt at master · citizenlab/chat-censorship

                                                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                                  chat-censorship/olympics/illegalwords.txt at master · citizenlab/chat-censorship
                                                                                • Humans TXT: We Are People, Not Machines.

                                                                                  Humans TXT logos You can download the official humansTXT logos and include them in your sites. Please remember you should ask for permission if you are not the owner of the site. How can I use it? We encourage placing the logo in the footer, and don’t forget to add a link to your humans.txt file! About humans.txt What is humans.txt? It's an initiative for knowing the people behind a website. It's

                                                                                  新着記事