並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 456件

新着順 人気順

文字列とはの検索結果1 - 40 件 / 456件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

文字列とはに関するエントリは456件あります。 プログラミングprogrammingブラウザ などが関連タグです。 人気エントリには 『新卒向け研修資料「テスト文字列に”うんこ”と入れるな」を公開しました』などがあります。
  • 新卒向け研修資料「テスト文字列に”うんこ”と入れるな」を公開しました

    新卒向け研修資料「テスト文字列に”うんこ”と入れるな」を公開しました 代表の松井です。 弊社インフィニットループでは、近年「新卒ファースト」を合言葉に社内教育に力を入れています。 先日、主に新卒向け(それ以外の参加者も多くいましたが)に、「テスト文字列に”うんこ”と入れるな」という講義を行いましたので、その資料を公開します。 なぜ人は入力欄に「うんこ」と入れてしまうのでしょうか。 それはどういう経路で社外に漏れ、防ぐには何をすべきなのでしょうか。 タイトルはアレですが、内容は至って真面目に書いています。 悲しい事故を防ぐために「仕事中にはふざけないこと」など、新社会人に必要なメッセージを強く込めたつもりですので、ぜひ本資料をあなたの会社での研修にも役立てていただければと思います。 ツイート

      新卒向け研修資料「テスト文字列に”うんこ”と入れるな」を公開しました
    • 日付、住所、文字列、辞書、翻訳……なんでもござれの「ExcelAPI」がスゴい/「Excel 2013」以降で利用できる「WEBSERVICE」関数と組み合わせて使う無料のWeb API【やじうまの杜】

        日付、住所、文字列、辞書、翻訳……なんでもござれの「ExcelAPI」がスゴい/「Excel 2013」以降で利用できる「WEBSERVICE」関数と組み合わせて使う無料のWeb API【やじうまの杜】
      • 【Excel】大量のセルを「&」で連結するのは非効率!? 区切り文字や改行にもスマートに対応できる文字列連結テク【いまさら聞けないExcelの使い方講座】

          【Excel】大量のセルを「&」で連結するのは非効率!? 区切り文字や改行にもスマートに対応できる文字列連結テク【いまさら聞けないExcelの使い方講座】
        • 【脱sed】いい加減シェルスクリプトで文字列をsedで置換するなんてやめよう - Qiita

          はじめに もう文字列の置換で sed コマンド使うの禁止して良いんじゃないですかね? 言いすぎだとわかってあえて言っていますが。 悪い書き方(外部コマンドに頼る方法) # 変数 line に入ってる文字列を echo コマンドで出力して sed コマンドに渡し、 # sed の s コマンドで "from" を "to" に置換して出力したものを ret 変数で受け取る ret=$(echo "$line" | sed "s/from/to/")

            【脱sed】いい加減シェルスクリプトで文字列をsedで置換するなんてやめよう - Qiita
          • ユーザーエージェント(UA)文字列は時代遅れ? ~「Google Chrome」で凍結・非推奨に/早ければ「Google Chrome 81」から警告【やじうまの杜】

              ユーザーエージェント(UA)文字列は時代遅れ? ~「Google Chrome」で凍結・非推奨に/早ければ「Google Chrome 81」から警告【やじうまの杜】
            • プログラミングの原則:構造化テキストを文字列結合で作らない、置換でいじらない - Uzabase for Engineers

              こんにちは、ソーシャル経済メディア「NewsPicks」のむとうです。 先日から『Ghost of Tsushima』の開発者が書いた『ルールズ・オブ・プログラミング』という本をちょっとずつ読み進めていて、プログラミング熱が高まっています。この本は大きな指針を示すだけで具体の話をするものではないのですが、読み物として面白いので私も似たようなことをやってみたくなりました。 何年もこういう仕事をしているとバグが入るパターンというのが見えてきます。そしてだいたいどこに行っても何の仕事でも似たようなことをすることになるのですが、今回の話もその一つです。 構造化テキストを文字列結合で作らない、置換でいじらないというのはこれだけみると何のことか分かりづらいかも知れませんがSaaS Product Team セキュアコーディングの啓蒙 第2回 (SQL インジェクション編)の内容とある面では同じ話です。

                プログラミングの原則:構造化テキストを文字列結合で作らない、置換でいじらない - Uzabase for Engineers
              • 文字列を反転させたい|nona

                こんにちは。徒然なるままにTweetを眺めていたら、Tanakaさんがこのようなことを呟いていました。 そういやRustのStringにreverseメソッドないなと思ったけど、まあよく考えたらUTF-8で文字逆転させるとか地獄のような話になるしそもそも長さが変わるケースとかあったりしそうで怖いわな・・・(´・_・`) — Hideyuki Tanaka (@tanakh) May 1, 2021 背景等はよくわからないですが、文字列の反転というのは確かに難しい問題ですし、どう難しいのかというのを、ちょっと真面目に考えて解説してみました。というノートです。 本文での表記についてこれから文字とそのバイト表現の話をしていきます。文字のエンコードの方式で同じ数値でも色々意味が分かれてしまいますので、本文では以下のように表記することにします。 Unicodeコードポイント(以下、単にコードポイント

                  文字列を反転させたい|nona
                • [JavaScript] URLを文字列結合で組み立てないために、url-cheatsheetを作った

                  [JavaScript] URLを文字列結合で組み立てないために、url-cheatsheetを作った URLを文字列結合で組み立てると色々問題が起きやすいので、それを避けるためにURL APIやURLSearchParams APIでURLを組み立てるパターンをまとめたチートシートを作りました。 azu/url-cheatsheet: URL manipulation cheatsheet for JavaScript URLにユーザーが入力した文字列を含めるときはencodeURIComponentでエスケープする URLはプレーンな文字列ではなく構造化された文字列(文字の並びに意味がある文字列)として扱わないと、さまざまな問題を抱えやすいです。 たとえば、次のように文字列結合でURLを組み立てるとパストラバーサルの問題があります。 name に ../../adminのような文字列が

                    [JavaScript] URLを文字列結合で組み立てないために、url-cheatsheetを作った
                  • 平成ネットスケベ文化の終焉 5ch(旧2ch)の半角文字列板、半角二次元板、アイドル画像板、等が閉鎖に

                    2020年11月4日、5ちゃんねる(旧2ちゃんねる)の姉妹板、BBS PINKの人気カテゴリだった半角文字列板、半角二次元板、半角かな板、アイドル画像板、スポーツ画像板が閉鎖した。事前告知のない突然の閉鎖だった。 半角文字列板は、エロ画像やエロサイトのURLの情報を交換するための板だった。https://phoebe.bbspink.com/ascii/ 半角二次元板は、半角文字列の二次元版で、アニメや漫画のエロ画像の話を扱う板。https://mercury.bbspink.com/ascii2d/ 半角かな板は、アクセス分散のために派生した板である。https://phoebe.bbspink.com/ascii2kana/ アイドル画像板は、アイドルのグラビア画像を扱う板として誕生したが、今ではグラドルの情報交換スレとしてアクセスを集めていた。https://mercury.bbsp

                      平成ネットスケベ文化の終焉 5ch(旧2ch)の半角文字列板、半角二次元板、アイドル画像板、等が閉鎖に
                    • 今は、もう、動かない、その User-Agent 文字列

                      ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、広告エンジニアの中山です。 唐突ですが、みなさまの Web アプリケーションに User-Agent 文字列を参照する処理はありますか? User-Agent: Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.1234.56 Safari/537.36例えば User-Agent 文字列を解析して内容に応じて制御を分岐させたり、機械学習の特徴量として用いたり、さらには一般に悪しきユースケースとされていますが IP アドレスと組み合わせて fingerprinting に活用する … と

                        今は、もう、動かない、その User-Agent 文字列
                      • 今度はAppleが「Firefox」を拒絶、サポート対象外にする動きに歯止めがかからず/UA文字列を書き換えで回避はできるが……【やじうまの杜】

                          今度はAppleが「Firefox」を拒絶、サポート対象外にする動きに歯止めがかからず/UA文字列を書き換えで回避はできるが……【やじうまの杜】
                        • 話題の画像生成AI「Stable Diffusion」で使える呪文のような文字列を実際の画像から見つけられる「Lexica」の使い方まとめ

                          テキストから高クオリティの画像を生成できるAI・Stable Diffusionが話題になる様子を見て、「自分も何か画像を作らせてみたい!」と興味を持っている人は多いはず。Stable Diffusionで画像を生成する際に重要になるのが「どんなテキストを入力するのか」という点で、AIの動作を調べて有効だと判明した文字列は「呪文」とも呼ばれています。そんなStable Diffusionで使える呪文のような文字列を、実際に生成された画像から見つけることができるサービス「Lexica」が登場していたので、実際に使ってみました。 Lexica https://lexica.art/ Stable DiffusionはNVIDIA製GPUを搭載したマシンのローカル環境で実行できるほか、デモページからでも使用できます。しかし、NVIDIA製GPUを所有していない人やデモページの待ち時間が長すぎると

                            話題の画像生成AI「Stable Diffusion」で使える呪文のような文字列を実際の画像から見つけられる「Lexica」の使い方まとめ
                          • 謎の文字列「1qaz2wsx」 漏えいした日本のパスワードに頻出するワケ

                            ソリトンシステムズが発表した「日本人のパスワードランキング2021」。2021年に発生した209の情報漏えい事件から日本人が利用するパスワードを分析したもので、1位は「123456」、他は「password」や「000000」などよく見掛けるものだが、少し変わったものとして、4位に「1qaz2wsx」がランクインしている。 一見ランダムに生成されたものに思えるが、実際にキーボードをタイプしてみれば納得がいく。QWERTY配列のキーボードを左から縦2列打ち込むと「1qaz2wsx」となるわけだ。「qwerty」の亜種みたいなものだが、ランキングを見るとこの手の配列に沿ったパスワードが多いことが分かる。

                              謎の文字列「1qaz2wsx」 漏えいした日本のパスワードに頻出するワケ
                            • sangmin.eth @ChoimiraiSchool on Twitter: "ChatGPTに指示を出す際に「テンプレート文字列(${文字列})」を利用すれば、より複雑なタスクを依頼することもできる。下記の例↓ではテンプレート文字列を使って、3つの質問を繋げている😊。… https://t.co/NpqhEWZa3d"

                              ChatGPTに指示を出す際に「テンプレート文字列(${文字列})」を利用すれば、より複雑なタスクを依頼することもできる。下記の例↓ではテンプレート文字列を使って、3つの質問を繋げている😊。… https://t.co/NpqhEWZa3d

                                sangmin.eth @ChoimiraiSchool on Twitter: "ChatGPTに指示を出す際に「テンプレート文字列(${文字列})」を利用すれば、より複雑なタスクを依頼することもできる。下記の例↓ではテンプレート文字列を使って、3つの質問を繋げている😊。… https://t.co/NpqhEWZa3d"
                              • シンプルかつ高速な文字列照合アルゴリズムを紹介します - エムスリーテックブログ

                                こんにちは! エンジニアリンググループ マルチデバイスチーム 新卒1年目の小林です。 エムスリーでは、2週間に1度、Tech Talkという社内LT会(現在はリモートで)が開催されています。これは、とある回の発表テーマリストです。 Tech Talkのとある回の発表テーマリスト このように、最近エムスリーでは文字列が流行っている(?)ようなので、その勢いに乗って私も文字列照合アルゴリズムについて書きたいと思います!(業務とは全然関係ない話です) Knuth-Morris-PrattやBoyer-Mooreアルゴリズムは解説記事がたくさん出ていると思うので、この記事ではシンプルかつ高速なQuick-SearchとQuite-Naiveアルゴリズムについて説明し、速度比較を行った結果についてご紹介します。 文字列照合アルゴリズムとは テキストとパターンという文字列が与えられたときに、中に出現す

                                  シンプルかつ高速な文字列照合アルゴリズムを紹介します - エムスリーテックブログ
                                • Pythonで省メモリに大量の文字列を扱う工夫 - MNTSQ Techブログ

                                  たくさんの文字列(や離散的な符号列)をメモリに載せないといけないんだけど、いろんな制約があって通常のList[str]では載らない…ということありませんか?(まぁあんまりなさそうですね) たまたまそういうことがあったので、その際に検討した内容をまとめておきます TL;DR メモリをもっと増やしましょう 富豪的に解決できるならいつでもそれが最高です しかし、世の中それでなんとかならんこともたくさんあります 用途があうのであれば専用のデータ構造を採用する 例えばもし共通のprefixやsuffixが存在し、順序に興味がなければtrie treeなどが使えます 例えば、弊社であれば、法人名をメモリに持ちたいなんてときもあります。そういうときに法人名の辞書をtrieで持ったりすることがあります 「株式会社」「一般財団法人」や「銀行」といった共通語がたくさんでてくるのでtrie treeでごりごり削

                                    Pythonで省メモリに大量の文字列を扱う工夫 - MNTSQ Techブログ
                                  • 画像ファイルやデータベースの文字列を「grep」のように検索できる「ripgrep-all」

                                    Linuxのコマンドラインで文字列を検索する際に必要不可欠なコマンドといえば「grep」です。しかし、grepは動画ファイルやPDFファイルの文字列を検索できないのが弱点。そんなgrepの弱点を克服し、動画ファイルのメタデータやデータベースのレコード、画像ファイル内の文字列まで検索可能なコマンドが「ripgrep-all(rga)」です。 GitHub - phiresky/ripgrep-all: rga: ripgrep, but also search in PDFs, E-Books, Office documents, zip, tar.gz, etc. https://github.com/phiresky/ripgrep-all rgaはLinuxに限らずWindowsやmacOSでも利用することが可能。今回はUbuntu 20.04でrgaを利用してみます。以下のコマンドを

                                      画像ファイルやデータベースの文字列を「grep」のように検索できる「ripgrep-all」
                                    • 「詐欺メールが来たからサーバーを攻撃しといた」禁断の文字列を入力する攻撃が発想の勝利→「これが現代の呪詛返しか…」

                                      ヨシフ・スターリン料理長.zip @Stalin_Bot_JP これは 「お客様のお支払い方法が承認されません」 というフィッシング詐欺メールが来たので、サイトを落とそうとするぼく pic.twitter.com/K8BtkKofBV 2022-07-02 23:05:47

                                        「詐欺メールが来たからサーバーを攻撃しといた」禁断の文字列を入力する攻撃が発想の勝利→「これが現代の呪詛返しか…」
                                      • 【Excel】文字列の連結や分割に便利な新関数が登場! 「&」演算子やLEFT関数はもう古い?【いまさら聞けないExcelの使い方講座】

                                          【Excel】文字列の連結や分割に便利な新関数が登場! 「&」演算子やLEFT関数はもう古い?【いまさら聞けないExcelの使い方講座】
                                        • 愛されて23万View!新卒向け研修資料「テスト文字列に”うんこ”と入れるな(2024年版)」を公開しました|技術ブログ|北海道札幌市・宮城県仙台市のVR・ゲーム・システム開発 インフィニットループ

                                          ホーム 技術ブログ 愛されて23万View!新卒向け研修資料「テスト文字列に”うんこ”と入れるな(2024年版)」を公開しました 愛されて23万View!新卒向け研修資料「テスト文字列に”うんこ”と入れるな(2024年版)」を公開しました こんにちは松井です。今は会長になりました。 遡ること3年前、2021年の新卒研修向けに「テスト文字列に”うんこ”と入れるな」という資料を作成しました。 おかげさまで多くの方に読んでいただいたようで、SlideShareのView数は「23.6万View(2024年4月現在)」にまで達しました。 わたし的にはもうこれで満足していたのですが、 「会長、今年も例のうんこの話をしていただけませんか」 というオファーがあり、またこのクソみたいな話をすることになったという次第です。 せっかく話をするならばということで、事例やTIPSのページを新たに加え、「2024年

                                            愛されて23万View!新卒向け研修資料「テスト文字列に”うんこ”と入れるな(2024年版)」を公開しました|技術ブログ|北海道札幌市・宮城県仙台市のVR・ゲーム・システム開発 インフィニットループ
                                          • Webページのリンクになっている文字列をコピーするスマートな方法/選択するつもりがリンク先にジャンプしてイライラしてませんか?【やじうまの杜】

                                              Webページのリンクになっている文字列をコピーするスマートな方法/選択するつもりがリンク先にジャンプしてイライラしてませんか?【やじうまの杜】
                                            • CSSだけでモーフィングを実装できる!文字列を違う文字列に滑らかに変化させるCSSのテクニック

                                              文字列を違う文字列に滑らかに変化させるモーフィングをCSSで実装するテクニックを紹介します。 モーフィングは人が別の人に変化するのを映画やテレビで見かけますが、文字ならCSSだけでそれっぽく簡単に実装できます。 仕組みは、CSSのblurとcontrastで文字をぼかして変化の間をつなげています。 実際の動作は、下記でお楽しみください。 「Run Pen」をクリックすると動作します。「0.5x」にするとちょうどいいかも。 See the Pen CSS morphing by Amit Sheen (@amit_sheen) on CodePen. 実装コードは、下記の通りです。 デモでは7つのワードをモーフィングしています。ワードの数は増減もOKで、その際はCSSを少し変更します。 <div class="morphing"> <div class="word">Pure&nbsp;CS

                                                CSSだけでモーフィングを実装できる!文字列を違う文字列に滑らかに変化させるCSSのテクニック
                                              • 全年齢向け同人誌をネット販売しようとしたら「ロリ」という文字列が含まれているので販売出来ないと怒られた話→「ツナ缶のいかかがわしい本…」「カロリーwww」

                                                長井ずみ @zumix30contacts ツナ缶が好きです。個人でツナ缶を開発製造したほか、国産ツナ缶を中心に200種くらい食べました。ツナ缶のことだけ書いて128万PVのブログ「zu-mix3.0」公開してます お仕事はzumix30contacts@gmail.comまで jp.bloguru.com/zumix

                                                  全年齢向け同人誌をネット販売しようとしたら「ロリ」という文字列が含まれているので販売出来ないと怒られた話→「ツナ缶のいかかがわしい本…」「カロリーwww」
                                                • プログラミングを始めた人に「"文字列" の 42 と "整数" の 42 ってなにが違うんですか? そのまま足し算とかしようとするとエラーになるんですけど」と聞かれた話

                                                  Dai MIKURUBE @dmikurube むかし実際、プログラミングを始めた人に「"文字列" の 42 と "整数" の 42 ってなにが違うんですか? そのまま足し算とかしようとするとエラーになるんですけど、でも 42 って書いてあるんだから足せればよくないですか」と聞かれてわりと回答に詰まった記憶がある。それできる言語も実在するしな… 2024-05-19 01:01:26

                                                    プログラミングを始めた人に「"文字列" の 42 と "整数" の 42 ってなにが違うんですか? そのまま足し算とかしようとするとエラーになるんですけど」と聞かれた話
                                                  • 理想のExcel「0には意味があるはず、文字列と扱おう」→今のExcel「001は1に直してあげよ!」

                                                    筒井.xls@エクセル関数擬人化本著者 @Tsutsui0524 今のExcel 「001は1なのに、ニンゲンはどうして無意味なことするの?1に直してあげよ」 理想のExcel 「わざわざ0から入力したということは何か意味があるはずなので、文字列の001として扱おう」 2022-09-29 13:35:56

                                                      理想のExcel「0には意味があるはず、文字列と扱おう」→今のExcel「001は1に直してあげよ!」
                                                    • User Agent文字列を使ったブラウザ判定の事例 2022年版 - yigarashiのブログ

                                                      やむを得ず、User Agent文字列を使って特定のブラウザ向けにJavaScriptの処理を分岐する必要が生まれてしまったので、調査・検討のログを記事にまとめます。 基本的にはバッドプラクティスである ユーザーエージェント文字列を用いたブラウザーの判定 - HTTP | MDN まずはMDNがドキュメントを公開しているので読みましょう。要点は以下です。 基本的にUser Agent文字列に基づいて処理を出し分けるのはバッドプラクティス 多くのケースではUser Agent文字列を使うよりも良い手段がある 例えば特定の機能の実装状況に基づく分岐を行いたければそれを直接検出する それでもやむを得ない場合、User Agent文字列からブラウザ名、レンダリングエンジン、バージョン、OS、端末といった情報を取得することができる ただし各ブラウザのUser Agent文字列は嘘をついていることもあ

                                                        User Agent文字列を使ったブラウザ判定の事例 2022年版 - yigarashiのブログ
                                                      • 「Firefox」が「IE 11」と誤認されてしまう悲劇発生……開発チームが対応に追われる/期間限定でUA文字列が「凍結」【やじうまの杜】

                                                          「Firefox」が「IE 11」と誤認されてしまう悲劇発生……開発チームが対応に追われる/期間限定でUA文字列が「凍結」【やじうまの杜】
                                                        • 「残業するな」という文字列がVtuberキャラ名に見えたと言ったら色々設定が固まり、ついには仮想(バーチャル)Vtuber『残業スルナ』ちゃん爆誕!

                                                          中の魂は先にあってもデザインがまだみたいなのはよくある話?ですが、空目からガワが出来上がるというのもスゴイ展開です…! …んで、スルナちゃんのチャンネルはどこです?配信開始日は?

                                                            「残業するな」という文字列がVtuberキャラ名に見えたと言ったら色々設定が固まり、ついには仮想(バーチャル)Vtuber『残業スルナ』ちゃん爆誕!
                                                          • grepでは困難な、特定文字列の存在行から別の文字列が存在する行までの抽出 (Perlのflip-flop演算子の使い方) - 理系学生日記

                                                            特定の文字列がある行から、別の特定の文字列がある行までを抽出したいということがよくあります。 これgrep等を使うと苦労する話なんですが、flip-flop演算子を使ったPerlのone-linerで可能です。 例えば昨日の記事ではgit help commitの中から--no-edit/オプションの説明を抽出しました。 これは--no-editという文字列が出てくるところから空行までを抽出すれば良い。これは以下のようにすれば可能です。 $ git help commit | perl -nle 'print if /--no-edit/ ... /^\s*$/' 解説自体に空行が混じるケースでは以下のようにすれば良いでしょう。 この例では、--cleanupという文字列が出現してから、次のオプション(-文字列形式)が出るまでを抽出しています。 $ git help commit | pe

                                                              grepでは困難な、特定文字列の存在行から別の文字列が存在する行までの抽出 (Perlのflip-flop演算子の使い方) - 理系学生日記
                                                            • 生成AI版キンタマウィルス『モリス2』、画像や文字列に埋め込まれたプロンプトから、データ流出、スパム送信、マルウェア拡散、研究者がgoogleなどに警告

                                                              banshee(おおかみ) @higan_wafu winnyの時もなかなか規制進まなかったのでAntinnyというウイルスがばら撒かれた ワームってどっちも書いてるし似た構造じゃないかな 日本だと2007年に警視庁の個人情報データ流出。被害届の内容とか捜査リストとかいう一般人に知られたらダメなのが出回った 警視庁がwinny使うなよって思うが、生成AIも同じ道辿るのかな 詐欺師を食うクロサギってのがあるが、誰かを食い物にする悪人は誰かに食われる危険性もあるって覚悟すべきなんだろうな 気軽な気持ちで人の道を外れちゃいけないと思う 2024-03-12 15:32:43

                                                                生成AI版キンタマウィルス『モリス2』、画像や文字列に埋め込まれたプロンプトから、データ流出、スパム送信、マルウェア拡散、研究者がgoogleなどに警告
                                                              • ChatGPT API で区切り線を表現する最適な文字列を見つけた件

                                                                TL;DR ChatGPT API のメッセージに区切り線を入れる場合、何文字同じ文字を続ければ良いか実験・考察を行いました。 Translate this text into Japanese. ==================== (←これが区切り線) I am a student.

                                                                  ChatGPT API で区切り線を表現する最適な文字列を見つけた件
                                                                • あの無料API「ExcelAPI」が「Google スプレッドシート」に正式対応/Web上のさまざまなデータをインポート、日時・数値の計算や文字列加工なども

                                                                    あの無料API「ExcelAPI」が「Google スプレッドシート」に正式対応/Web上のさまざまなデータをインポート、日時・数値の計算や文字列加工なども
                                                                  • 高速な文字列探索:Daachorseの技術解説 - LegalOn Technologies Engineering Blog

                                                                    こんにちは。LegalForce Researchで研究員をしている神田 (@kampersanda) です。 LegalForce Researchでは現在、高速なパターンマッチングマシン Daachorse(ダークホース)を開発・運用しています。文字列処理の基礎である複数パターン検索を提供するRust製ライブラリです。以下のレポジトリで公開されています。 github.com 本記事はDaachorseの技術仕様を解説します。具体的には、 複数パターン検索に関係する基礎技術(トライ木・Aho–Corasick法・ダブル配列) Daachorseの実装の工夫と性能 を解説します。 以下のような方を読者として想定します。 文字列処理アルゴリズムやデータ構造に興味のある方 自然言語処理の要素技術に興味のある方 Rustライブラリに興味がある方 Daachorseについて 複数パターン検索の基

                                                                      高速な文字列探索:Daachorseの技術解説 - LegalOn Technologies Engineering Blog
                                                                    • 「テスト文字列にうんこと入れるな」──ゲーム会社の新卒向け資料“2024年版”が公開 テスト環境で悪ふざけするリスク説く

                                                                      「テスト文字列に”うんこ”と入れるな」──そんなふうに訴える新入社員向けの研修資料の2024年版が公開された。公開したのは、ゲーム開発などを手掛けるインフィニットループ(北海道札幌市)。軽い気持ちで入れたテスト文字列が社外に漏えいした際のリスクについて説明した資料で、新たに事例などを加筆し、21年に公開したものをバージョンアップしている。 同社がこの資料で訴えたいのは「テスト文字列には無難な文字列を使うこと」。Webエンジニアが入力フォームを作る際に使うテスト文字列に「うんこ」などのふざけた文言を入れる行為のリスクを説明。資料内では実際にテスト文字列が漏えいしたことで起きた不祥事の事例などを紹介している。

                                                                        「テスト文字列にうんこと入れるな」──ゲーム会社の新卒向け資料“2024年版”が公開 テスト環境で悪ふざけするリスク説く
                                                                      • 人生を豊かにする文字列diff入門 | フューチャー技術ブログ

                                                                        春の入門祭りの8日目です。 文字列の新旧の違いを表現する時によくdiffをとるとか言いますよね。そこで実行されるのが差分アルゴリズムです。差分のアルゴリズムって結構知れば知るほど難しいやつです。「より良い差分」という基準が、状況によって変わるからです。ヒューリスティックなやつです。例えば、HTMLの説明の文章を書いていたとします。タイトルをテーブルに書き換えてみたとします。 どちらも間違ってはおらず、この差分を元にパッチを当てたりも可能です。ただ、読んだ時の読みやすさが違います。 これはもちろん前者と答える人の方が多いでしょう。だって、タグという意味の塊が維持されていますからね。 これは究極的にはわかりやすいdiffというのは「意味」を理解しないと作れないということを意味します。これがdiffは簡単なようで難しいと書いた理由です。もちろん、ほどほどの工数で、ほどほどの見た目のdiffも作成

                                                                          人生を豊かにする文字列diff入門 | フューチャー技術ブログ
                                                                        • Chrome の User-Agent 文字列削減に関する最新情報

                                                                          .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                                            Chrome の User-Agent 文字列削減に関する最新情報
                                                                          • UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま

                                                                            Shift_JIS の CSV で連携する外部サービスがあり、DB では UTF-8 でテキストを持っていたため文字コードを変換する必要が生じた。 ところが UTF-8 に存在する多くの文字は Shift_JIS に対応がないため変換することができない1。 そこで、事前に NFKC 形式で Unicode 正規化することで変換可能な文字を増やすことを試みた。 まずは Unicode 正規化の前提として、Unicode の正準等価と互換等価について説明する。 以降の U+16進数 という表記は Unicode のコードポイント (文字に ID のようなものが割り当てられている) を示す。 また、コードポイントに対応する文字の詳細は https://codepoints.net/ といったサイトで確認することができる。 正準等価 例として、ひらがなの「が」について考える。Unicode では「

                                                                              UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま
                                                                            • 怪しいサイコロゲーム『んこダイス』Steamで配信開始。6つの文字列を組み合わせたセンシティブワードでハイスコアを狙え - AUTOMATON

                                                                              個人開発者のksym氏は5月29日、サイコロゲーム『んこダイス(NKODICE)』をリリースした。対応プラットフォームはPC(Steam)。価格は1000円。ローンチセールとして、6月5日までは40%オフの600円で購入できる。 『んこダイス』は、椀の中に振った複数個のサイコロの出目で役をつくり、ハイスコアを目指すダイスゲームだ。“チンチロリン風のゲーム”といえば分かりやすいだろうか。本作最大の特徴となるのが、使用するサイコロだ。各面は点で1~6の数を示すのでなく、ひらがなの「お」「ち」「う」「こ」「ん」「ま」のように見える文字列が描かれている。同作は日本語非対応のため、ひらがなではないのかもしれない。 メインとなるアーケードモードはラウンド形式で進行。1ラウンドに複数個のサイコロを1回振って、計3ラウンドのスコア合計を競う。1ラウンド目は椀の中に5つのサイコロを投入する。投入後はサイコロ

                                                                                怪しいサイコロゲーム『んこダイス』Steamで配信開始。6つの文字列を組み合わせたセンシティブワードでハイスコアを狙え - AUTOMATON
                                                                              • Operaの元CEOによる高機能ブラウザ・Vivaldiが「ユーザーエージェント文字列をChromeに見せかける」ことを余儀なくされた理由とは?

                                                                                by StartupStockPhotos ブラウザのユーザーエージェント文字列とは、アクセスするウェブサイトのホストサーバーに対してブラウザが送信する、使用しているOSやデバイスのアーキテクチャ、ブラウザの情報などを含んだテキストです。ノルウェー発のブラウザ・Operaを開発するオペラ・ソフトウェアの元CEOであるヨン・スティーブンソン・フォン・テッツナー氏らが開発するブラウザの「Vivaldi」は、このユーザーエージェント文字列を「Chromeと同じものに変更する」と発表しました。 User Agent Changes | Vivaldi Browser https://vivaldi.com/ja/blog/user-agent-changes/ ユーザーエージェント文字列は本来、ウェブサイトがユーザーに対してよりよいエクスペリエンスを提供するために用いられます。たとえばユーザーエー

                                                                                  Operaの元CEOによる高機能ブラウザ・Vivaldiが「ユーザーエージェント文字列をChromeに見せかける」ことを余儀なくされた理由とは?
                                                                                • メモリの上に置かれているRubyの文字列を覗く - ローファイ日記

                                                                                  これもフィヨルドブートキャンプの生徒さんの質問からふと思いついた、ちょっとした遊びですが。 (そして、書いてある内容に誤解があったら優しく教えてください) p Object.new => #<Object:0x000055959ddf1910> Rubyのオブジェクトのinspect表示のデフォルトで出てくる、この16進数は、このオブジェクトが置かれているメモリアドレスのことだと知られている。 では、実際にこのメモリアドレスにオブジェクトが置かれていることを確かめるには? さて、以下のコードはLinuxで動かすことにする。 String オブジェクトで試してみる。と言っても、StringのinspectはObjectに定義されたものではなく、自分のクラスで定義しているので、まずはそれを「無効にする」。以下のような方法で Object#inspect を呼ぶように変更できる。 class S

                                                                                    メモリの上に置かれているRubyの文字列を覗く - ローファイ日記

                                                                                  新着記事