並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 270件

新着順 人気順

UTF-8の検索結果1 - 40 件 / 270件

  • 【2025年】zip圧縮・展開(解凍) おすすめソフト12選まとめ+解説、文字化けよさらば!【Win・Mac】 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 2025年現在でのおすすめの zip ファイル形式の圧縮・展開(解凍)ソフトについてまとめました。本記事はファイル名を文字化けせずにやり取りできるかを重視しており、使い勝手や対応形式の多さや機能については評価の対象にしていません(__MACOSX などは無視すれば十分)。一部を除きフリー(無料)で使えます。Lhaplus のような未だに Shift JIS にしか対応していない古いソフトウェアは非推奨としています。今どき Shift JIS を使う必要はありませんし、Shift JIS では一部の漢字や絵文字などを扱えず、Wi

      【2025年】zip圧縮・展開(解凍) おすすめソフト12選まとめ+解説、文字化けよさらば!【Win・Mac】 - Qiita
    • MacではReturnキーとEnterキーを区別しましょう|usagimaru

      テキストの改行や何かのコマンドを実行するためのキーとしてEnterとReturnがありますが、日本ではそれを「Enterキー」と呼ぶことが慣例化しています。広く普及しているWindows PCがそのキーにEnterを採用しているためか、主にReturnを採用しているMacを使っているユーザーでさえもそれを「Enterキー」と呼ぶ人が多くいらっしゃいます。 現代においてReturnキーとEnterキーの機能的差異はほとんど見られないため、仮にMac環境でそれを「Enterキー」と呼んだとしても、現実的には何かの支障が生じることはほとんどありません。しかし、これら2つのキーを厳密に区別するソフトウェアや機能が存在する場合があることや、MacではReturnキーとEnterキーの両方を別々に備えている場合があること、そもそも刻印されているキーの名称を間違った呼び方をすることはよろしくない姿勢であ

        MacではReturnキーとEnterキーを区別しましょう|usagimaru
      • どうしてこうなった!? 波ダッシュをめぐる考察|『人文×社会』の中の人

        どうも、『人文×社会』の中の人です。 今回は、WindowsとMacで起こった「波ダッシュ」をめぐるドタバタ劇をご紹介したいと思います。 波ダッシュといえば、「〜」という記号。どこにもドタバタする要素がないように思えますが、実は今でも組版業界で問題となっている大混乱があります。 波ダッシュと全角チルダ「それ、不等号ですよ! 紛らわしい約物3連発!」の記事でもご紹介したように、見た目が「〜」に見える約物には、2種類あります。 「波ダッシュ」と「全角チルダ」です。 「波ダッシュ」は、日本語で範囲を表すときに使われる約物です。「明治〜大正」みたいな感じで使います。 「全角チルダ」は、半角チルダ(~)の全角版です。チルダは「漸近的に等しい」ことを表す数学記号として使われます。つまり、全角イコール(=)の仲間です。(他にも半角チルダは、コンピュータ上のホームディレクトリを表したり、プログラミング言語

          どうしてこうなった!? 波ダッシュをめぐる考察|『人文×社会』の中の人
        • サイトウさんに「お名前の漢字をお伺いしてよろしいですか?サイトウさんのサイは.....」と言ったら、「難しいほうのサイです 真ん中がYの」と返され、宇宙猫状態に陥った話

          現 実 @giiiiiitu 私「お名前の漢字をお伺いしてよろしいですか? サイトウさんのサイは.....」 「難しいほうのサイです 真ん中がYの」 私「難しいほう....真ん中....Yの....」 pic.x.com/Yw7Ry15tg7 2025-06-12 08:39:13

            サイトウさんに「お名前の漢字をお伺いしてよろしいですか?サイトウさんのサイは.....」と言ったら、「難しいほうのサイです 真ん中がYの」と返され、宇宙猫状態に陥った話
          • 誤解の多い「NFD問題とUTF-8-MAC問題」を解説する - macOSの濁点を含むファイル名の扱い - Qiita

            はじめに macOS では濁点や半濁点が含まれるファイル名でたびたび問題が発生しています。この問題は NFD 問題と言われたり UTF-8-MAC 問題と言われることがありますが、必要な情報が正確に書かれているところは少なく、正しく解説してある所でも情報が古く(主に HFS+ 時代の話に)なっており、読むと逆に混乱してしまう場合があります。 macOS 標準アプリや誰かが作ったアプリであればバグが修正されるまで待つだけですが、自分が作ったアプリやシェルスクリプトなどではこれがどういう問題なのかを理解しなければバグが修正できません。この記事ではそれらを整理し直して、(可能な限り正確に)解説したいと思います。検証は macOS 15.3(補助的に 15.5)で行っています。 この問題は、Mac で作成した zip ファイルを Windows で展開したときに、濁点や半濁点を含むファイルに Wi

              誤解の多い「NFD問題とUTF-8-MAC問題」を解説する - macOSの濁点を含むファイル名の扱い - Qiita
            • 1999年をテーマとしたものに 繝ヲ繝九さ繝 みたいな文字化けが描かれており、UTF-8はまだそんなに普及してないだろ!当時っぽさなら ホ・ニ・ュ・ケ・ネ、ホハクセマ みたいなやつだろ!とか反射的に老害ムーブをした

              Kenji Iguchi @needle English Account:@needle_e 腱鞘炎と戦うVRエンジニア。GREE、Oculus(現Meta)を経てフリーランス。興味範囲はインタラクション・VR・AI・EV・ローカリゼーション・知的財産権・表現規制等。 @needle@misskey.io / Unrelated to Needle Inc. heistak.com Kenji Iguchi @needle 1999年をテーマとしたものに 繝ヲ繝九さ繝 みたいな文字化けが描かれており、UTF-8はまだそんなに普及してないだろ!当時っぽさなら ホ・ニ・ュ・ケ・ネ、ホハクセマ みたいなやつだろ!とか反射的に老害ムーブをした 2025-06-07 00:15:40

                1999年をテーマとしたものに 繝ヲ繝九さ繝 みたいな文字化けが描かれており、UTF-8はまだそんなに普及してないだろ!当時っぽさなら ホ・ニ・ュ・ケ・ネ、ホハクセマ みたいなやつだろ!とか反射的に老害ムーブをした
              • 「圧倒的シェアの一因だった」――終了する“ドコモ絵文字”への思い、生みの親・ニコニコ栗田代表が明かす

                NTTドコモは5月21日、1999年から独自に提供してきた「ドコモ絵文字」の提供を、6月下旬以降の発売機種から順次終了すると発表した。開発者であるニコニコの栗田穣崇代表はこれを受けて同日、自身のXアカウント(@sigekun)で「提供終了記念」としてユーザーからの質問を募り、ドコモ絵文字への思いや開発時のエピソードを次々と明かした。 ドコモ絵文字の開発にかかった期間について、栗田代表は「構想は数カ月、開発は1カ月弱」だったと説明。最初に完成したのは「雨」の絵文字だったという。開発当初は、約200個近くを1カ月弱で作ったとのこと。 「一番作るのが面倒だった絵文字」を問われると、「コンビニ」「ガソリンスタンド」を挙げた。「12×12ドットの制約内での表現が難しく、結局文字になった」という。

                  「圧倒的シェアの一因だった」――終了する“ドコモ絵文字”への思い、生みの親・ニコニコ栗田代表が明かす
                • Detecting malicious Unicode

                  In a recent educational trick, curl contributor James Fuller submitted a pull-request to the project in which he suggested a larger cleanup of a set of scripts. In a later presentation, he could show us how not a single human reviewer in the team nor any CI job had spotted or remarked on one of the changes he included: he replaced an ASCII letter with a Unicode alternative in a URL. This was an ey

                    Detecting malicious Unicode
                  • ドコモからのお知らせ : ドコモ絵文字の提供終了について | お知らせ | NTTドコモ

                    お客さまの設定により、お客さま情報が「非表示」となっております。お客さま情報を表示するにはdアカウントでログインしてください。 お客さま情報表示についてへ お客さま情報表示についてへ ドコモからのお知らせ ドコモ絵文字の提供終了について 2025年5月21日 平素はNTTドコモのサービス・商品をご利用いただき、誠にありがとうございます。 昨今の端末の絵文字の利用状況を鑑みドコモ絵文字の提供を2025年6月下旬以降に発売する機種から終了いたします。長らくのご愛顧をありがとうございました。 ご利用の機種により、提供終了時期および継続利用可否が異なります。 ■対象機種および提供終了時期 Samsung Galaxy以外のドコモ Android 製品、ドコモケータイ 2025年6月下旬以降に発売する機種から、ドコモ絵文字をご利用いただけません。 Google が提供する絵文字(Noto Color

                    • Mari Imaizumiさん「Ruby Taught Me About Under the Hood」 〜RubyKaigi 2025 1日目キーノート | gihyo.jp

                      RubyKaigi 2025 キーノートレポート Mari Imaizumiさん「Ruby Taught Me About Under the Hood」 〜RubyKaigi 2025 1日目キーノート 2025年4月16日から18日まで、愛媛県県民文化会館にてRubyKaigi 2025が開催されました。1日目は、ima1zumiさんことMari Imaizumiさんによる基調講演からスタートしました。タイトルは「Ruby Taught Me About Under the Hood」です(発表スライド⁠)⁠。 今回の会場の特徴として、メインホールに毎日違う緞帳《どんちょう》が掛けられていました。1日目は、青く輝く波の緞帳です(第一緞帳「波響く」東山魁夷⁠)⁠。 緞帳が上がると「おはようございます!」と笑顔のima1zumiさんが登場しました。 文字コード愛好家のima1zumiさん

                        Mari Imaizumiさん「Ruby Taught Me About Under the Hood」 〜RubyKaigi 2025 1日目キーノート | gihyo.jp
                      • 行政事務標準文字検索α

                        単一漢字 辺, 斉, 藤 単一かな あ, か, を 読み ヘン 部首 しんにょう, 辶, 辵 部首番号 B162など 部首一覧 総画数 5 (絞込にも対応) 文字図形番号 MJ025758 UCS U+8FBA, G+7E8A, J+307E JIS X 0213 1-42-53 戸籍統一文字 437640 登記統一文字 00437640 入管正字/外字 0x8FBA, 0xE5C9

                        • 「Windows11でファイル名に絵文字が使えることを知って、1つ賢くなった」便利と思われる機能が追加→情シスがバールを担いで暴れ出す案件

                          ヤギ@アザースジャパン合同会社 @athers_japan アザースジャパン合同会社の社員。秘書・ITエンジニア。N/W・DB・セキュリティ・ちょっとデキル。秘書検定2級。社畜ではありません、家畜です。 athers-japan.wixsite.com/website-1

                            「Windows11でファイル名に絵文字が使えることを知って、1つ賢くなった」便利と思われる機能が追加→情シスがバールを担いで暴れ出す案件
                          • 英語圏で「—」「–」「-」はどう使い分けられているのか?

                            英文におけるエムダッシュ「—」と、エンダッシュ「–」と、ハイフン「-」の用法について、辞典の出版社であるMerriam-Websterがまとめました。 How to Use Em Dashes (—), En Dashes (–) , and Hyphens (-) | Merriam-Webster https://www.merriam-webster.com/grammar/em-dash-en-dash-how-to-use ◆エムダッシュ エムダッシュはカンマやコロン、あるいは括弧のように機能し、例や説明、補足事項などの区切りに使われます。 ・文の構造の突然の変化や中断を示すのに使われるケース Mabel the Cat was delighted with the assortment of pastries the new bakery featured, but Harry

                              英語圏で「—」「–」「-」はどう使い分けられているのか?
                            • Branchless UTF-8 Encoding

                              Can you encode UTF-8 without branches? Yes. Note: I added a coda section incorporating some feedback. The question In a Recurse chat, Nathan Goldbaum asked: I know how to decode UTF-8 using bitmath and some LUTs (see https://github.com/skeeto/branchless-utf8), but if I want to to go from a codepoint to UTF-8, is there a way to do it without branches? To start with, is there a way to write this C f

                                Branchless UTF-8 Encoding
                              • WorstFit: Unveiling Hidden Transformers in Windows ANSI!

                                <?php $url = "https://example.tld/" . $_GET['path'] . ".txt"; system("wget.exe -q " . escapeshellarg($url)); You can have a quick try on your own. The PHP code uses a secure way to spawn the command. Looks a bit hard, right? Well, today, we would like to present a new technique to break through it! Outline Outline Decoding the Windows Encodings The Early Days: ANSI and Code Pages The Unicode Era:

                                  WorstFit: Unveiling Hidden Transformers in Windows ANSI!
                                • デジタル庁、氏名の文字7万に集約 行政システム効率化 - 日本経済新聞

                                  市区町村の基幹的な業務で使う文字の基準が2026年度をメドに統一される。今まで様々な氏名や住所の漢字に対応するため各自治体が独自ルールを定めており、デジタル化の障害になっていた。デジタル庁は国として策定した標準ルールの普及に力を入れる。政府は自治体システムの仕様統一を進めており、その前提として、基幹業務システムにおける共通化した文字ルールの適用を促す。アルファベットを使う欧米と異なり、日本語

                                    デジタル庁、氏名の文字7万に集約 行政システム効率化 - 日本経済新聞
                                  • 絵文字を自由に作れるアップルの新機能「ジェン文字」の使い方

                                    スマートフォンで絵文字のリストをスクロールしながら、「どうして今欲しい絵文字がないんだ!」と叫びたくなったことはないだろうか?家族に食事の準備ができたことを知らせたいとき、その日のメニューがワッフルなら適切な絵文字が見つかるが、フレンチトーストだった時には残念な気持ちになる。どのOSでも公式の絵文字は追加されており、毎年少しずつ増えているのだが、絵文字が作成されて承認されるまでのプロセスはかなり複雑だ。 しかし、読者がiPhone(またはiPad)を使っており、「Apple Intelligence」を使用できるなら、自分だけのカスタム絵文字である「ジェン文字」を作ることができる。ジェン文字はほとんどどんなものでも絵文字にすることができ、これにはユーザー自身の姿も含まれる。 しかしいざジェン文字を使おうとすると、アート作品を生成する作業に付きものの問題にぶつかる。それは、何でも作れる道具が

                                      絵文字を自由に作れるアップルの新機能「ジェン文字」の使い方
                                    • N 文字以上なら省略表示 - Object.create(null)

                                      「N 文字以上 / 以内」みたいなことを言われたときに考えること. 「文字」とは? 単に「文字」と言っても, それが指しているものが何かは自明ではない. 符号単位 (code unit) JavaScript の場合, 文字列は UTF-16 としてエンコードされている*1ので, そのエンコードの単位である 16 bit ごとに分割するというのがこの方法. .length で取得できるのはこの符号単位の数で, .slice() に与えるのも符号単位で数えたインデックスとなっている. > "あいうえおABCDE".length 10 > "あいうえおABCDE".slice(0, 5) "あいうえお" ところで Unicode には 16 bit で表せる数以上の「文字」 (U+0000 〜 U+10FFFF) が含まれるので, UTF-16 では 1 つの符号単位で表せない「文字」は 2

                                        N 文字以上なら省略表示 - Object.create(null)
                                      • ISO-2022-JPの自動判定によるクロスサイト・スクリプティング(XSS)

                                        サマリ ISO-2022-JPという文字エンコーディングの自動判定を悪用したクロスサイト・スクリプティング(XSS)攻撃について説明する。これは、文字エンコーディングを適切に指定していないウェブコンテンツに対して、文字エンコーディングをISO-2022-JPと誤認させることでバックスラッシュが円記号と解釈されることによりエスケープ処理を回避する攻撃である。本稿で紹介する攻撃は、従来からのセキュリティベストプラクティスである「文字エンコーディングの明示」に従っていれば影響を受けることはない。 はじめに クロスサイト・スクリプティング対策として、記号文字のエスケープ処理に加えて、コンテンツの文字エンコーディングをレスポンスヘッダやmetaタグで明示しましょうと言われてきました(参照)。その背景として、UTF-7という文字エンコーディングを悪用したXSSの存在がありました。この攻撃については以下

                                          ISO-2022-JPの自動判定によるクロスサイト・スクリプティング(XSS)
                                        • 1人 Intl Advent Calendar 2024 - Adventar

                                          JavaScript(ECMAScript)の国際化API、「Intl」について紹介する1人 Advent Calendar です。 2024末時点でのIntl仕様と提案されているProposalを広く紹介することをゴールとしています。合わせてIntlに関連する仕様についても端端で紹介できたらなと思っています。 機能・ドメイン的に関連する話題をまとめて紹介していくので、「既存仕様→関連するProposal」の順で繰り返す流れになる予定です。基本的な機能だけ知りたいよと言う方は適宜読み飛ばしてください。

                                            1人 Intl Advent Calendar 2024 - Adventar
                                          • 人名用漢字「凜」「凛」並立の経緯は衝撃的 – 毎日ことばplus

                                            明治安田生命保険による生まれ年別の「名前ランキング」が発表され、「凛」が女の子の名前人気トップ3の座を維持しました。一方「凜」の字は……。本来同じ字のはずの両者が人名用漢字に選ばれた経緯を調べると、衝撃に次々と見舞われました。 。 片岡凜(りん)さんという役者をご存じでしょうか。その名は知らなくても、NHK連続テレビ小説「虎に翼」を見た方なら、後半に登場し主人公の寅子を恐れさせた美少女「美佐江」と言えば、「ああ、あの怖い子」と強烈な印象とともに思い出すのではないでしょうか。 芸達者ぞろいの出演陣を差し置いて「『虎に翼』一番の怪演」「ラスボス」という声も出たとのこと。このコラムはその片岡凜さんについて……ではなく名前の「凜」の字について。ファンの方ごめんなさい。 「凜」と「凛」の違いとは 片岡凜さんはプロフィルによると2003年10月生まれ。本名らしいです。名前の「凜」は1990年に子の名前

                                              人名用漢字「凜」「凛」並立の経緯は衝撃的 – 毎日ことばplus
                                            • レスポンスが文字化けしたのでエンコードについて調べた - iimon TECH BLOG

                                              はじめに こんにちは!株式会社iimonでフロントエンドエンジニアをしているかとうです! 本記事はiimonアドベントカレンダー13日目の記事となります!✨ サーバーから送信されたデータがShift_JISでエンコードされている場合、そのままだとJavaScriptで扱えないことがありました。 そこで、本記事では以下の内容についてお話しします! エンコードについて レスポンスがShift_JISレスポンス形式の場合のデコード方法 JavaScriptエンコード/デコードメソッド はじめに エンコードを理解する エンコードとは 文字コード 文字コード規格 ASCII Unicode エンコーディング形式 Unicode(UTF-8/UTF-16) Shift_JIS 文字化けの原因 Shift_JISのレスポンスを扱う 困ったこと 解決した方法 JSのエンコードメソッド encodeURI(

                                                レスポンスが文字化けしたのでエンコードについて調べた - iimon TECH BLOG
                                              • 令和版ポケベル!? 絵文字だけでコミュニケーションする「emojam」をセガ フェイブが発売【やじうまWatch】

                                                  令和版ポケベル!? 絵文字だけでコミュニケーションする「emojam」をセガ フェイブが発売【やじうまWatch】
                                                • Python 3.13 から「兆」が 10 の 6 乗になっている - マグマグ (起動音)

                                                  この記事は 2024 TSG Advent Calendar 3日目の記事です。昨日の記事は @__dAi00 さんの記事 AivisSpeechを使ったDiscordボットの作成 ①AivisSpeechをGoogle Cloud Runにデプロイする でした。12/5 公開予定の続編も楽しみです。 今回は、初日に公開した以下の記事の副産物です。 import unicodedata # Python 3.12 まで 1000000000000.0 # Python 3.13 から 1000000.0 print(unicodedata.numeric("兆")) 大変だ。Python 3.13 から「5000 兆円」が 50 億円になってしまう(?) unicodedata.numeric メソッドと Unicode 例によって Unicode が関係してきます。前編でも触れたとおり、

                                                    Python 3.13 から「兆」が 10 の 6 乗になっている - マグマグ (起動音)
                                                  • Python の isnumeric() の謎を追う:"兆" は True、"垓" は False? - マグマグ (起動音)

                                                    この記事は 2024 TSG Advent Calendar 初日の記事です。 …………🤔❓ Python の数値文字列判定ロジックを探る str.isnumeric() メソッドとは? Python の str.isnumeric() メソッドは、文字列内のすべての文字が数値を表すものであれば True を、そうでなければ False を返します。*1 まず、このメソッドの基本的な動作を見てみましょう。 # Python の isnumeric() の動作例 print("123".isnumeric()) # True; 1, 2, 3 は数字 print("123a".isnumeric()) # False; a は数字ではない print("五千万".isnumeric()) # True; 五、千、万 は数値 漢数字にも対応しており、一見よさそうに見えます。ところが…… pr

                                                      Python の isnumeric() の謎を追う:"兆" は True、"垓" は False? - マグマグ (起動音)
                                                    • macOS の sort コマンドでカタカナとひらがなのソート順が崩れる原因は?

                                                      macOS 上でこの 3 行のファイルを LC_COLLATE=ja_JP.UTF-8 でソートすると予期せぬ結果になります。 入力 なにわ男子の逆転男子 アニメ おじゃる丸 アニメ「烏は主を選ばない」 ソート結果 アニメ おじゃる丸 なにわ男子の逆転男子 アニメ「烏は主を選ばない」 アニメ というカタカナの prefix をもっている 2 行の間に、なにわというひらがなの行が入っています。 ロケールごとに文字列の比較の仕方が異なるというのはわかるのですが「sort コマンドが行頭以外も比較してソートする」という理解で正しいのでしょうか? デバッグログをつけて実行 $ LC_ALL=ja_JP.UTF-8 sort --debug --ignore-nonprinting <<__TXT__ なにわ男子の逆転男子 アニメ おじゃる丸 アニメ「烏は主を選ばない」 __TXT__ Memory

                                                        macOS の sort コマンドでカタカナとひらがなのソート順が崩れる原因は?
                                                      • Unicodeには大文字でも小文字でもないアルファベットがある

                                                        大規模文字セットのUnicodeは世界中のあらゆる文字を収録することを目指しており、個性的な絵文字も数多く登録されているほか、正体不明の記号もいくつか含まれています。さらに、Unicodeに存在する「大文字でも小文字でもないアルファベット」について、ソフトウェアデベロッパーであるレイモンド・チェン氏がMicrosoftの開発者ブログで解説しています。 What has case distinction but is neither uppercase nor lowercase? - The Old New Thing https://devblogs.microsoft.com/oldnewthing/20241031-00/?p=110443 Unicodeにはラテン文字をはじめいろいろな言語の文字が収録されていますが、その中に「大文字」「小文字」とともに別の種類が登録されている文字が

                                                          Unicodeには大文字でも小文字でもないアルファベットがある
                                                        • Fossil: CRLF Is Obsolete And Should Be Abolished

                                                          Update 2024-10-14 It seems that (1) there is still more software in circulation that depends on archaic CRLF line endings than I originally thought and (2) many people do not share my enthusiasm for creating a CRLF-free world. Alas. This makes me sad, but it is what it is. Thanks to everyone who was willing to give the idea a test run. It almost worked! I hereby withdraw the proposal and have reve

                                                          • ついにその日が! iPhoneで「ビャンビャン麺」の漢字表示が可能になりマニア狂喜【やじうまWatch】

                                                              ついにその日が! iPhoneで「ビャンビャン麺」の漢字表示が可能になりマニア狂喜【やじうまWatch】
                                                            • 濁点付きの「あ゙」や「お゙」を正しく入力する方法は?(「あ"」「お"」ではなく)/入力システム(IME)で変換するか、「RichEdit」の機能を活用しよう【やじうまの杜】

                                                                濁点付きの「あ゙」や「お゙」を正しく入力する方法は?(「あ"」「お"」ではなく)/入力システム(IME)で変換するか、「RichEdit」の機能を活用しよう【やじうまの杜】
                                                              • ユニコードで文字数を数える方法 (1/2)

                                                                ユニコードでは複数の絵文字を結合させて 別の絵文字を表現することもある Unicodeが一般的になって、日本語を含めて、さまざまな言語の文字を自由に使えるようになったが、「文字」を取り出す、あるいは数えるのが面倒になったのも確かだ。というのも、1つの文字が必ずしも1つのコードポイントで表現されるとは限らないからだ。 たとえば絵文字では、複数の絵文字をゼロ幅接合子(Zero Width Joiner:ZWJ、U+200D)で結合することで、別の絵文字を表現することがある。たとえば、「🐦 鳥(bird)」(U+1F426)と「🔥 火」(U+1F525)をゼロ幅接合子でつなげたものは、「🐦‍🔥フェニックス」(Unicode Emoji 15.1で定義)の絵文字になる。 コードだと「U+1F426」「U+200D」「U+1F525」なのだが、表示上は1つの文字に見える。なお、こうした組み合

                                                                  ユニコードで文字数を数える方法 (1/2)
                                                                • 【やじうまPC Watch】 42へぇ。Wordで「打」から始まるテキストファイルを開くとコンバーターが要求される

                                                                    【やじうまPC Watch】 42へぇ。Wordで「打」から始まるテキストファイルを開くとコンバーターが要求される
                                                                  • Word で「打」で始まるテキスト ファイルを開くとコンバーターを要求される

                                                                    こんにちは、Office サポート チームの中村です。 今回の記事では、Word でテキスト ファイルを開くとき、一部の内容においてコンバーターが要求される動作について説明します。 1. 現象以下の条件を満たすテキスト ファイルを Windows デスクトップ アプリの Word で開くと、「このファイルは新しいバージョンの Microsoft Word で作成されているため、このファイルを開くにはコンバーターが必要です。」というメッセージが表示されます。 <ファイルの条件> ファイル内容の先頭が Shift-JIS の「打」 (0x91C5) で始まること 2 文字目以降に文字が続くこと (制御コードを含め、何らかのデータがあること) 2. 原因多くのファイル形式では、先頭数バイトでそのファイル形式を表します。このため Word でファイルを開くとき、ファイルのバイナリ データの先頭数バ

                                                                      Word で「打」で始まるテキスト ファイルを開くとコンバーターを要求される
                                                                    • 「Unicode 16.0」が公開 ~エジプト象形文字、レガシーコンピューティング記号を大量追加/5,185の新たな文字が追加。総計で154,998文字に

                                                                        「Unicode 16.0」が公開 ~エジプト象形文字、レガシーコンピューティング記号を大量追加/5,185の新たな文字が追加。総計で154,998文字に
                                                                      • 「住所は英数字もすべて全角で入力してください」はなぜそうなったのか - Qiita

                                                                        Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Webサービスのフォームに住所を入力するとき、丁目や番地などを入れる欄について、数字やハイフンを全角で書かなければいけない「全角縛り」をやっているフォームをよく見ます。半角文字を入力してしまってエラーになったり、咄嗟に変換方法を思い出せなかったり、全角と半角の見分けが付きづらかったり、「全角縛り」であることが明示されていなかったり、「ハイフン」としてどの文字を使うべきかわからなかったり……と、鬱陶しさを感じることが多くあります。 「住所は全角のみ」(数字やハイフンも絶対に半角を受け付けない)という仕様がどういう経緯で生まれて、どう広まっ

                                                                          「住所は英数字もすべて全角で入力してください」はなぜそうなったのか - Qiita
                                                                        • X、Twitter時代の2018年から水鉄砲にしていた銃の絵文字をリアルに戻す

                                                                          関連記事 世界絵文字デー Googleが「目の下にくま」「指紋」などの新絵文字披露 Googleは7月17日の世界絵文字デーにちなんで、今秋公開予定の新絵文字の一部を披露した。9月リリース予定のUnicode 16.0で追加される見込みだ。 イーロン・マスク氏、トランプ氏支持表明 銃撃事件30分後からXに100件以上の関連ポスト Xのオーナーで1.8億人のフォロワーを持つイーロン・マスク氏は、「トランプ大統領を全面的に支持する」と明言した。トランプ氏が銃撃された30分後のことだった。その後、マスク氏は関連ポストを100件以上投稿している。 「Android P」のBeta 2公開でUnicode 11.0の新絵文字追加 8月に正式版公開予定のGoogleの次期モバイルOS「Android P」のBeta 2が公開された。APIが最終版になり、多数の絵文字が追加された。 関連リンク Emoj

                                                                            X、Twitter時代の2018年から水鉄砲にしていた銃の絵文字をリアルに戻す
                                                                          • 【JS体操第3問ヒント②】「コードポイント」と「コードユニット」 - KAYAC Engineers' Blog

                                                                            こんにちは!面白プロデュース事業部のおばらです。 本記事はJS体操第3問「Zalgo Text の生成」の問題のヒントにもなるかもしれないシリーズ第2弾。 第1弾は 「Zalgo Text のできるまで」でした。 今回は「コードポイント」、そして「コードポイント」と似ているけれどちょっと違う概念の「コードユニット」についてざっくりおさらいしてみます。 techblog.kayac.com hubspot.kayac.com 目次 「Unicode」とは 「コードポイント」とは 「文字」を「コードポイント」に変換する 「コードポイント」を「文字」に変換する 「コードユニット」とは 「UTF-8」「UTF-16」「UTF-32」 「コードユニット」とは 「文字」を「コードユニット」に変換する 「コードユニット」を「文字」に変換する 「コードポイント」と「コードユニット」の違い 文字数とは? ま

                                                                              【JS体操第3問ヒント②】「コードポイント」と「コードユニット」 - KAYAC Engineers' Blog
                                                                            • 【JS体操第3問ヒント①】Zalgo Text のできるまで - KAYAC Engineers' Blog

                                                                              こんにちは!面白プロデュース事業部のおばらです。 今回は、先日スタートしたJS体操第3問のテーマでもある「Zalgo Text(ザルゴ・テキスト)」の作り方を JavaScript のサンプルコードと併せて簡単にご紹介します。 hubspot.kayac.com 目次 Zalgo とは Zalgo Text とは Zalgo Text を作ってみる 「結合文字」 「ダイアクリティカルマーク」 「Unicode エスケープシーケンス」と「コードポイント」 「A」という文字に「ダイアクリティカルマーク」を加えてみる 「ダイアクリティカルマーク」の数を増やしてみる 「基底文字」も増やしてみる まとめ Zalgo とは まず、Zalgo ってなんでしょう? Zalgo(ザルゴ)とは、Flash アニメータ Dave Kally によって生み出された架空の生物。インターネット上の人々を狂気に陥れ破滅

                                                                                【JS体操第3問ヒント①】Zalgo Text のできるまで - KAYAC Engineers' Blog
                                                                              • 世界絵文字デー Googleが「目の下にくま」「指紋」などの新絵文字披露

                                                                                世界絵文字デーを開始した絵文字リファレンスサイトの英Emojipediaは同日、絵文字で遊べる新サイト「Emoji Playground」を開設した。Emojipediaでは、Unicode 16.0で承認される見込みの他の絵文字も紹介している。 関連記事 「世界絵文字デー」はなぜ7月17日なのか AppleもFacebookも祝う「World Emoji Day」は2014年に始まったばかり。なぜ7月17日になったのだろう? 絵文字×絵文字=カオス? 「Emoji kitchen」がSNSで話題 X上では大喜利状態に 2つの絵文字をミックスして新しい絵文字を生み出す機能「Emoji kitchen」がSNSで話題だ。Google検索からも利用可能になり、X(元Twitter)ではカオスな絵文字を投稿するユーザーが相次いでいる。 Google、絵文字を組み合わせた「ハート付きうんち」などを

                                                                                  世界絵文字デー Googleが「目の下にくま」「指紋」などの新絵文字披露
                                                                                • UTF-8 の BOM について - 将棋プログラミング

                                                                                  1.はじめに UTF-8 の文字コードのファイルには、BOM (Byte Order Mark) がある場合とない場合がある。 Unicode の規格では、BOM は、推奨されないが、許容されている。 ja.wikipedia.org 今回、必要があり、色々な OS や言語で、UTF-8 の文字コードのファイルを作成した時、BOM が記録されるか、されないか、を調べた。 2.色々な OS や言語での BOM 2.1 Windows 10, Visual Studio, C++, _wfopen (_tfopen) // Visual Studio 2005 以降 保存 FILE *fp = _wfopen(name, _ L"w, ccs=UTF-8"); if (fp == NULL) { // エラー処理 } fwprintf_s(fp, L"ABC漢字123\n"); fclose(

                                                                                    UTF-8 の BOM について - 将棋プログラミング