並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 415件

新着順 人気順

unicodeの検索結果281 - 320 件 / 415件

  • 【図解】【3分解説】UnicodeとUTF-8の違い!【今さら聞けない】 - Qiita

    UTF-16のことをUnicodeと記しているソフトウェア(Windowsのメモ帳など)もありますのでUnicodeとあったらそれはUTF-16を使って変換したものなのだな、というふうに理解してください。 そうなってしまっている理由はこちらで解説されていました。 これでUnicodeとUTF-8の違いはバッチリですね!おわり。 読んで分かりやすかったり少しでも何か学べたと思えたら いいね や コメント をもらえるとこれからの励みになります! もう少し時間がある方へ 手計算で文字をUTF-8での符号まで計算してみましょう。 理解が一気に深まります。手順は以下。 1. 文字のコードポイントをUnicodeから見つけてくる。 2. コードポイントをUTF-8の方式で変換してみる。 Omiitaの「お」をUTF-8による符号まで変換してみます。 文字「お」のコードポイントをUnicodeから見つけ

      【図解】【3分解説】UnicodeとUTF-8の違い!【今さら聞けない】 - Qiita
    • ritsuka on Twitter: "鬼滅の刃に禰󠄀豆子というキャラがいるらしいけど、禰+異体字セレクタU+E0100を使わないと表現出来ない字なのか。 それでデフォルトではUTF-8は3バイトまでと決め打ちしてたMySQLとかそれを使うWordPressでトラブル起こすらしい"

      鬼滅の刃に禰󠄀豆子というキャラがいるらしいけど、禰+異体字セレクタU+E0100を使わないと表現出来ない字なのか。 それでデフォルトではUTF-8は3バイトまでと決め打ちしてたMySQLとかそれを使うWordPressでトラブル起こすらしい

        ritsuka on Twitter: "鬼滅の刃に禰󠄀豆子というキャラがいるらしいけど、禰+異体字セレクタU+E0100を使わないと表現出来ない字なのか。 それでデフォルトではUTF-8は3バイトまでと決め打ちしてたMySQLとかそれを使うWordPressでトラブル起こすらしい"
      • The Invisible JavaScript Backdoor – Certitude Blog

        A few months ago we saw a post on the r/programminghorror subreddit: A developer describes the struggle of identifying a syntax error resulting from an invisible Unicode character hidden in JavaScript source code. This post inspired an idea: What if a backdoor literally cannot be seen and thus evades detection even from thorough code reviews? Just as we were finishing up this blog post, a team at

        • 波ダッシュ・全角チルダ問題 - とほほのWWW入門

          波ダッシュは「上がって下がる」字形で中国や日本では長音符や「~から」を示す文字として使用されます。 しかし Unicode 7.0 以前では「上がって下がる」ではなく「下がって上がる」字形として定義されていました(字形誤り)。 これは Unicode 8.0 で「下がって上がる」字形から「上がって下がる」に修正されました。 Windows XP 以前では「下がって上がる」表記、Windows Vista 以降では「上がって下がる」表記となります。 上記の理由からか Windows では今でも「~から」を示す文字として波ダッシュではなく全角チルダを用いています。 JIS準拠の Shift_JIS では 0x81 0x60 を U+301C とみなします。 Windows版シフトJISの CP932 では 0x81 0x60 を U+FF5E とみなします。 0x81 0x60 を U+301

          • UAX31: Unicode Identifier の話

            今日はまた去年の作業が元ネタで、プログラミング言語の識別子に使える文字に関する話です。 レターか数字 「1文字目にはアルファベットか _、2文字目以降にはそれに加えて数字を使えます。」 30年くらい前にはこれが「プログラミング言語の識別子(変数名など)に使える文字列」の定義でした。 _ の部分はプログラミング言語次第ですが、「1文字目にアルファベット、2文字目以降に数字」の部分は結構いろんな言語でそうだったんじゃないかと思います。 まあ、昔のプログラミング言語は ASCII コードで書く物だったので、上記の条件は [a-zA-Z] とか [0-9] みたいな正規表現で書けたんですが。 Unicode の時代になると「アルファベットだけでいいのか」とか「アルファベットって何だ」という話になります。 レター まず、「アルファベット(alphabet)」というと母音と子音が分かれてる文字のことで

              UAX31: Unicode Identifier の話
            • クメール文字が書けない - Helpfeel社のCosenseを一部公開

              書いたrakusai.icon クメール文字を徹底的に解説する split-graphemesとして実装した 国旗の絵文字に対応してほしいと同じ問題なのかなakix.icon 合字? ほぼ同じ問題だが、クメール文字のほうが難しいrakusai.icon これをコピペすると こうなる ខ្ញុំមិនអាចនីយាយភាសាខ្មែរបានទេ។ この化けたLigatureをコピーしてTextEdit.appにペーストすると、元の文字列になるshokai.icon むずい...rakusai.icon タイ語も似てる気がする。 ภาษาไทย วันนี้ฉันได้อ่านหนังสือมาดีแล้ว これも問題があるっぽいrakusai.icon フォントが合字を認識して勝手に連結表示している 例: Fira Codeというフォントをインストールすると演算子が合字になる リガチャ(合字

                クメール文字が書けない - Helpfeel社のCosenseを一部公開
              • Shift_JISとWindows-31J(CP932)とJIS漢字水準の関係について

                はじめに こんにちは!なたでです! 今回は文字コードの話、特に日本語についての話です。皆さん、第1水準、第2水準、拡張文字、Windows-31J(CP932)に入る文字は一体何かとか、自信を持って把握していますでしょうか。今回は、その辺のワードを一度整理して、まとめてみました。 基本用語 文字コード 文字コードには2つの意味がある。文字集合と符号化方式である。 文字集合 JIS X 0208など、文字の集合である。これをどのように記録するかは符号化方式による。 符号化方式 上記で規定した文字集合を符号化する方式の種類である。ISO-2022-JP、EUC-JP、Shift_JISなどがある。 コードセット 文字集合と符号化方式をまとめたもの。 常用漢字 学校で習う基本的な漢字。1923年に文字集合が生まれ、1981年の時点での常用漢字は1945文字である。 後程説明するが、この漢字が19

                  Shift_JISとWindows-31J(CP932)とJIS漢字水準の関係について
                • 半角ひらがなってなんでないの?

                  絶対カタカナよりひらがなのが便利じゃん

                    半角ひらがなってなんでないの?
                  • 3年ぶりに無料の老舗アーカイバー「Explzh」がメジャーバージョンアップ ~v9に到達/Unicode 64bit版の自己解凍書庫を作成可能に

                      3年ぶりに無料の老舗アーカイバー「Explzh」がメジャーバージョンアップ ~v9に到達/Unicode 64bit版の自己解凍書庫を作成可能に
                    • Google で絵文字の数を検索するとサーバーエラーになる問題 | スラド IT

                      現在は再現しなくなっているが、Google でプラットフォームごとの絵文字の数を検索するとサーバーエラーになる問題が発生していたそうだ (Bleeping Computer の記事、 Hacker News の記事、 BetaNews の記事、 エラー画面の Archive.today アーカイブ)。 エラーの内容としては、通常は検索結果が表示される部分に「Server Error」として説明が表示されるものだ。説明部分では要求を処理中に内部のサーバーエラーが発生したようだとして謝罪し、エンジニアが通知を受けて解決に向けて作業しているとして、あとでやり直すよう求めている。 エラーが発生する検索語句は英文で「how many emojis on ios|apple|windows|lumia」といったもので、「how may emojis on macos|linux|ipados」では問題

                      • ¥を巡る不都合な真実 - モディファイド・シフトJISという化石|kzn

                        パソコンの世界で漢字を含む日本語を扱えるようにするために、処理が煩雑になるJISコードをそのまま扱うのではなく、文字コードセットの切り替え処理が不要になるシフトJISというコードが発明されました。 このコードがどのような経緯でMS-DOSなどで採用されたのかは、あまり詳しくわからないのですが、この文字コードは規格ではなくあくまで実装に過ぎなかったので、メーカー独自の判断で構わないと思われていたようです。 MULTI16 - 遂に三菱電機もパソコンを出した この文字コードが身近に使われるようになったのは、MS-DOSが日本語に対応した1983年にリリースされた「日本語MS-DOS Ver2.x」からだと思います。この段階で階層化ディレクトリもサポートされ、CP/Mから継承したコマンドオプションは”/”で始まるというルールが仇となりパスの区切り文字がUNIXなどで使われていた”/”の代わりに”

                          ¥を巡る不都合な真実 - モディファイド・シフトJISという化石|kzn
                        • https://unicode.org/emoji/charts-13.0/emoji-released.html

                          • 「Unicode Emoji 13.0」決定──タピオカドリンクも遅まきながら登場

                            Unicodeの開発を調整する非営利団体Unicode Consortiumは1月29日、2020年中に各種サービスで利用できるようになる新しい絵文字セット「Emoji 13.0」が確定したと発表した。メーカーなどへのリリースは3月で、iOSやAndroidなどで使えるようになるのは9月か10月になる見込みだ。 新たに62の絵文字が追加された。昨年大流行した「タピオカドリンク」やダイバーシティに配慮した「赤ちゃんにミルクをあげる男性」などもある。

                              「Unicode Emoji 13.0」決定──タピオカドリンクも遅まきながら登場
                            • Python で zip 展開(日本語ファイル名対応) - Qiita

                              zip の中のファイル名 zip ファイルを展開(解凍)すると、書庫内の各データは元のファイル名で展開されます。すなわちファイル名情報も zip ファイル内に格納されています。 zip ファイル内に格納されている各ファイル名のエンコーディングは、現バージョンの zip の仕様だと UTF-8 フラグの有無を指定することができるようですが、 UTF-8 以外のエンコーディングを具体的に指定することができません。 歴史的に、従来より日本語ロケールの Windows で zip ファイルを作成すると(ツールにもよりますが)、ファイル名情報は Shift_JIS (CP932) で書き込まれます。最近の Linux や Mac は UTF-8 がほとんどです。 異なる OS で作成された zip ファイルを展開するときに、 UTF-8 フラグが付いていれば(最近の展開ツールであれば)問題なく展開す

                                Python で zip 展開(日本語ファイル名対応) - Qiita
                              • NFD→NFC変換ツール

                                (バージョンアップ)NFD→NFC変換ツール ※濁点や半濁点が別(U+3099,U+309A)の合成文字を単体の文字に変換するツール。 詳しくはこちらを参照。【変換したいテキスト】 【変換後のテキスト】

                                • Windows 10ミニTips(444) 「ワールドワイド言語サポートでUnicode UTF-8を使用」は有効にすべき?

                                  「Windows 10ミニTips」は各回の作成時点で最新のWindows 10環境を使用しています。 UTF-8化は世界的な流れだがトラブルを招く可能性アリ Windows 10の日本語ロケール(日本語文字コード)は慣例的にShift_JISとなっていたが、時代の流れと共にUTF-8化が進んできた。例えばメモ帳で作成したテキストファイルのファイル形式は、すでにANSI(Shift_JIS)からBOMなしUTF-8に変更されている。 バージョン1903では、メモ帳で使用する既定の文字コードがUTF-8になった このUTF-8を、Windows全体に適用するオプション(日本語ロケール)はバージョン1803で加わった。下図に示した手順で日本語ロケールをShift_JISからUTF-8に変更できるが、気になるのはバージョン1803でも“ベータ”だった本機能が、現時点での最新となるバージョン190

                                    Windows 10ミニTips(444) 「ワールドワイド言語サポートでUnicode UTF-8を使用」は有効にすべき?
                                  • MySQLと令和 / MySQL to Reiwa

                                    Kubernetesって何? -大規模なKubernetesを運用するKubernetes as a Serviceチームの話を添えて-

                                      MySQLと令和 / MySQL to Reiwa
                                    • StackOverflowからのコピペをやめろ。今すぐにだ。 - Qiita

                                      Original article:https://dev.to/dotnetsafer/rip-copy-and-paste-from-stackoverflow-trojan-source-solution-4p8f その昔コピペできない文章というものがありました。 実際は単にフォントを変えているだけというものですが、人間の目に見える文字と実際の文字が異なることを利用した攻撃の一種と見ることもできます。 さて、最近になって似たような攻撃に関する論文が公開されました。 人間には見えない文字を織り交ぜることによって、一見問題ないコードが実は脆弱になってしまうというものです。 ただ論文は堅苦しいうえに長くて読むのがつらいので、具体的に何がどうなのかよくわかりません。 平易に解説している記事があったので紹介してみます。 以下はDotnetsafer( Twitter / GitHub / Web

                                        StackOverflowからのコピペをやめろ。今すぐにだ。 - Qiita
                                      • Parsing Gigabytes of JSON per Second

                                        JavaScript Object Notation or JSON is a ubiquitous data exchange format on the Web. Ingesting JSON documents can become a performance bottleneck due to the sheer volume of data. We are thus motivated to make JSON parsing as fast as possible. Despite the maturity of the problem of JSON parsing, we show that substantial speedups are possible. We present the first standard-compliant JSON parser to pr

                                        • 平衡点(2020-12-18)

                                          I use cookies to analyze how visitors use my website via Google Analytics: Accept Reject Dismiss _ emacs -nw でこの先生きのこるには。 🍄 (2020/12/20 ひっそりと修正。 mintty, wsltty はファイルに設定を書くのであった)。 はじめに. この文書はEmacs Advent Calendar 2020の12/18(金)分の記事です。 昨日はfiboさんのemacs -nw のコピペ事情でした。 手元では gpaste + xclip で生活してますが、 …ネットワークごしのコピペは面倒そうですね。 さて。 最近Emacs絡みで頑張った事と言えば, ターミナルでもall-the-icons.elしたくて, isfit-plusを作ったぐらいだったので, 特に記事

                                            平衡点(2020-12-18)
                                          • 念のためもう一度トルコ語(等)で起こる問題について整理する - Qiita

                                            Qiita Advent Calendar 2020のJava Advent Calendarの12月7日のエントリです。12月9日付けで追記と内容修正あります。 トルコ語問題については、ご存知の方はご存知だと思いますが、聞いたことがない人にはなかなか理解できない問題なので2020年の今、もう一回おさらいしておくのもいいかと思い書いています。(ほかにネタがなかった、とも言う。) トルコ語の何が特殊なのか トルコ語(とアゼルバイジャン語)には、dotted-iとdotless-iの二つのアルファベットがあります。 通常私たちは「i」の大文字が「I」であり、「I」の小文字が「i」であると理解しています。しかし、トルコ語ロケール(とアゼルバイジャン語ロケール)では「I」はドットなしIであるとみなされ、その小文字は「ı」になります。逆に「i」の大文字はドットありの「İ」なのです。 このため、以下の

                                              念のためもう一度トルコ語(等)で起こる問題について整理する - Qiita
                                            • HTMLの絵文字 文字コード表 | GRAYCODE HTML&CSS

                                              HTMLで使用することのできる絵文字の文字コード一覧です。入力方法についても解説します。 この記事のポイント 絵文字は「数値文字参照」で入力する 数値文字参照は「10進数」と「16進数」の2種類の書き方から選ぶことができる 絵文字が記号として表示されてしまうときはCSSでfont-familyプロパティを指定する 絵文字の書き方 HTMLで「😀」「👍」のような絵文字を表示したい場合は、記号・特殊文字と同じように「数値文字参照」を使います。 iOSの絵文字 絵文字の入力で使用する「数値文字参照」はUnicodeで定められた16進数、または10進数の値を以下のフォーマットで指定して表示させます。 数値文字参照 (10進数)の書き方 10進数のフォーマットで絵文字のコードを書くときは「&#」と「;」で囲みます。 文字実体参照(10進数)の入力例 😀 // => 😀 &#12

                                                HTMLの絵文字 文字コード表 | GRAYCODE HTML&CSS
                                              • ECMAScript proposal: RegExp flag `/v` makes character classes and character class escapes more powerful

                                                ECMAScript proposal: RegExp flag /v makes character classes and character class escapes more powerful In this blog post, we look at the ECMAScript proposal “RegExp v flag with set notation + properties of strings” by Markus Scherer and Mathias Bynens. The new flag /v  # The proposed new regular expression flag /v (.unicodeSets) enables three features: Support for multi-code-point graphemes (such a

                                                • Fadis on Twitter: "ソースコードにUnicode制御文字を挟むことで人間には違う意味に見えるソースを作るトロイのソースが出てから各言語で対応が議論されている。対応が早かったRustは問題となっているコードポイントがコード中に現れるのを禁止したが、Py… https://t.co/h9KJeXHK5b"

                                                  ソースコードにUnicode制御文字を挟むことで人間には違う意味に見えるソースを作るトロイのソースが出てから各言語で対応が議論されている。対応が早かったRustは問題となっているコードポイントがコード中に現れるのを禁止したが、Py… https://t.co/h9KJeXHK5b

                                                    Fadis on Twitter: "ソースコードにUnicode制御文字を挟むことで人間には違う意味に見えるソースを作るトロイのソースが出てから各言語で対応が議論されている。対応が早かったRustは問題となっているコードポイントがコード中に現れるのを禁止したが、Py… https://t.co/h9KJeXHK5b"
                                                  • CP932とMS932の違いを調べて知ったCP932とSJISの違い - ponsuke_tarou’s blog

                                                    「統合したCP932」とMS932は同じようなもんです。 CP932の歴史 「誕生したばかりのCP932」とSJISと同じですが、「統合されたCP932」とSJISには違いがあります。 「統合されたCP932」にはあるけどSJISにはない文字があります。 SJISやCP932で2byte目が「5C」「7E」の文字には問題が起こることがあります。 2byte目が5cと7eの一例 「統合したCP932」とMS932は同じようなもんです。 「統合したCP932」をJavaではMS932といいます。 わざわざ「統合したCP932」としたのには理由があります。 CP932は時代によってものがちょっとずつ違うのです。 CP932の歴史 西暦 CP932 の歴史 ざっくり説明 1982 CP932誕生 マイクロソフトが日本語ようにSJISという文字コードを作りました。このSJISの管理番号はコードページ

                                                      CP932とMS932の違いを調べて知ったCP932とSJISの違い - ponsuke_tarou’s blog
                                                    • Shapecatcher: Draw the Unicode character you want!

                                                      You need to find a specific Unicode character? With Shapecatcher.com you can search through a database of characters by simply drawing your character into a box. It can find the most similar character shapes for your drawing.

                                                      • C# XmlSerializerの使い方 - け日記

                                                        XMLでリクエスト/レスポンスするAPIへアクセスする機会がありましたので、XmlSerializerの使い方を備忘録にしておきます。 XMLをシリアライズ/デシリアライズする まずはC#オブジェクト(ここではBook)とXML形式の文字列でシリアライズ/デシリアライズさせる方法です。 Bookクラス用のXmlSerializer(System.Xml.Serialization名前空間)を定義して、Serializeメソッドでシリアライズできます。 publicのフィールドまたはプロパティがXML要素になりますが、XmlRootAttribute、XmlElementAttributeで要素名を指定しています これらの属性が無い場合は、フィールド名・プロパティ名がそのまま要素名になります XMLの繰り返し構造を定義することもでき、その場合はXmlArrayAttributeで親要素名、X

                                                          C# XmlSerializerの使い方 - け日記
                                                        • エチオピアでモチモチした文字が発見されて「X」(Twitter)でちょっと話題に/「オフチョベットしたテフをマブガッドしてリットにする様子」の元ネタもこの言語【やじうまの杜】

                                                            エチオピアでモチモチした文字が発見されて「X」(Twitter)でちょっと話題に/「オフチョベットしたテフをマブガッドしてリットにする様子」の元ネタもこの言語【やじうまの杜】
                                                          • GB18030-2022が来た!詳細編—内容から読み取る本質〈エリックの多言語文字散歩〉|ヒラギノフォント公式note

                                                            前回の概要編では、じっくりとGB18030-2022の表紙を見ながら、中国におけるGBの定義、GB18030規格改定の概要、製品への搭載義務などについて解説しました。今回は、いよいよ表紙をめくって更新された内容について詳しく解説していきます。 漢字はとにかく多いGB18030-2022の規格書の実物を見ると、まずその厚みに圧倒されるでしょう。700ページを超えるページをパラパラとめくってみてわかるのは、本文はわずか8ページ程度で、残りのほとんどは付属書である長い文字コード表ばかりです。 文字コードの国際標準としてISO/IEC 10646があります。そして業界規格のUnicodeとおおむね互換しています。一方でGB18030は中国独自の規格です。GB18030は策定当初から国際標準の存在を意識して設計され、膨大な量のコードポイント(符号位置)と、各文字コードを相互変換するための対応表を用意

                                                              GB18030-2022が来た!詳細編—内容から読み取る本質〈エリックの多言語文字散歩〉|ヒラギノフォント公式note
                                                            • Perl のユーザ定義文字特性 - ┗┐<(՞ਊ՞)>┌┛

                                                              めっちゃ久々に Perl5系 書いたのですが、そのときに今更 Perl にはユーザ定義文字特性というものがあることを知りました。 perlunicode - Perl における Unicode サポート - perldoc.jp ユーザ定義文字特性によって、例えば半角のカタカナだけヒットさせるのを作ろうとなった場合、半角カタカナの範囲をユニコードの表で確認して https://unicode.org/charts/PDF/UFF00.pdf `ヲ`である `FF66` から `゚` の `FF9F` までヒットさせようと試みる場合、以下のような文字特性をかけます package Experopero::Sample; use utf8; use strict; use warnings; ... # 半角カナ文字 `ヲ` ~ `゚` を指定したユーザ定義文字特性 # see: https:

                                                                Perl のユーザ定義文字特性 - ┗┐<(՞ਊ՞)>┌┛
                                                              • Windows のコンソール端末と Unicode の相性

                                                                MacType が効いている MSYS2 の mintty は、雪だるまと令和合字の字送りの幅が半角扱いなことを除けば、概ね合格です。 サロゲートペアを扱えないのは、マルチバイトの文字コードを扱えない、シングルバイト圏のソフトウェアのような話です。 FontLinkレジストリの FontLink で欧文フォント等に和文フォント結び付けていると、意図しない形で FontLink と異なるフォントになることがあります。メモ帳で先ほど同様に試してみると、次のように。 どうやらコードポイントによって、FontLink のフォントでなく、システムの他のフォントで描画されてしまうようです。 ☃ U+2603 が Segoe UI Emoji𠮟 U+20B9F や 𠮷 U+20BB7 が 游明朝しかも、混入した 游明朝 の文字は、なぜか一回り大きな文字サイズです。標準の Segoe UI や Tah

                                                                  Windows のコンソール端末と Unicode の相性
                                                                • PHPカンファレンスの過去14+3回の登壇を振り返る - Qiita

                                                                  PHP Advent Calendar 2023の18日目の記事です。 PHPカンファレンスに登壇した記録を書きたいと思います。数えてみますと、2009年から昨年(2022年)までのPHPカンファレンス14回と、北海道2回、関西1回の合計17回登壇したことになります。 最初の登壇は14年前ですので、私の考えも当時からは変化していますので、そのあたりも触れながら紹介していきたいと思います。 PHP カンファレンス 2009 最初の登壇は2009年のPHPカンファレンスでした。この年はビジネスデイとテックデイに分かれていまして、ビジネスデイで登壇依頼を頂きましたので、当時温めていた「ウェブサイトを発注する際のセキュリティ」についてお話しました。 スライドの中で「脅威分析やってもあまり意味ない」みたいな物騒な意見が書いてあります。当時はそのように考えていたわけですが、これは当時のサイトがECサイ

                                                                    PHPカンファレンスの過去14+3回の登壇を振り返る - Qiita
                                                                  • Unicode IVS/IVDについて | 一般社団法人 文字情報技術促進協議会

                                                                    IVS(Ideographic Variation Sequence/Selector)は、文字符号としては同一視される漢字の、細かな字形の差異を特別に使い分けるための仕組みです。IVSは文字符号の国際規格であるISO/IEC 10646(2008年版以降)に規定されています。また、IVSと、それに対応する字形の一覧は、UnicodeコンソーシアムからIVD(Ideographic Variation Database)として公開されており、ISO/IEC 10646から正規の規格として参照されています。 文字符号(文字コード)を定める日本工業規格のJIS X 0213(以下、JIS)やISO/IEC 10646 Universal Coded Character Set(以下、UCS)などでは、複数の字形に対して一つの共通な符号(コード)を与える場合があります(「同一の符号位置に複数の字

                                                                    • Go言語のorderedmapパッケージを改善した - プログラムモグモグ

                                                                      Go言語で書かれたorderedmapというサードパーティパッケージがあります。 github.com Goのmapには順序がなく、JSONをデコードすると順序が失われ、それをエンコードするとオブジェクトのキーの順序にソートされます。 これに困る人はそこそこいるようで、順序を保持するmapはいくつか実装されてきました。 その中の一つが、orderedmapというパッケージです。 シンプルなインターフェイスが気に入っています。 orderedmapパッケージの利用例 package main import ( "encoding/json" "fmt" "log" "github.com/iancoleman/orderedmap" ) func main() { src := `{ "z": 1, "x": 2, "y": 3 }` fmt.Println("# map[string]in

                                                                        Go言語のorderedmapパッケージを改善した - プログラムモグモグ
                                                                      • 「Unicode 15.0」が公開 ~新しい絵文字20種を含む4,489の新たな文字が追加/「Noto Emoji」や「Last Resort Font」もさっそく対応

                                                                          「Unicode 15.0」が公開 ~新しい絵文字20種を含む4,489の新たな文字が追加/「Noto Emoji」や「Last Resort Font」もさっそく対応
                                                                        • 「多様な肌色の絵文字」を開発した黒人女性はそのアイデアをアップルに盗まれた | アップルは外部のアプリ開発者に不利な条件を課し、利益を巻き上げる

                                                                          スマートフォンなどの絵文字では、多様な人種を表すために肌の色が変えられるようになっている。このアイデアを初めに形にし、推進したのはあるアメリカの黒人女性だったが、アップルにアイデアを盗まれ、彼女は充分な対価を得られなかった。そのため、著作権侵害でアップルを起訴し、現在裁判が進行しているという。 インクルーシブなアプリのアイデア カトリーナ・パロットには、それは夢のようなことだった。自分の考案したアプリのプレゼンテーションをするため、カリフォルニア州クパチーノのアップル本社に招かれたのだ。テキサス州のNASAに解雇されて1年も経たたない今、自分が先駆けて開発した「肌の色を選べる絵文字」について、あのiPhoneメーカーと事業提携の話し合いをするのだ。

                                                                            「多様な肌色の絵文字」を開発した黒人女性はそのアイデアをアップルに盗まれた | アップルは外部のアプリ開発者に不利な条件を課し、利益を巻き上げる
                                                                          • Ultimate Unicode Input Device

                                                                            Just one more thing To make the experience fit your profile, pick a username and tell us what interests you.

                                                                              Ultimate Unicode Input Device
                                                                            • 第4回 神話と楔形文字と、ときどきUnicode | gihyo.jp

                                                                              【話し手】 ゆー(Yu)楔形文字検索ツールqantuppi、クルヌギアを開発。技術同人誌『楔形文字とユニコードの出会いにまつわるエトセトラ』で技術書典「第3回 刺され!技術書アワード」エポックメイキング部門受賞。家にねこがいます。 GitHub:uyumyuuy Twitter:@uyum 本コーナーでは技術へのタッチポイントを増やすことを目標に、各分野で活躍されている方をお迎えします。 今回のテーマは文字コードです。楔形文字(くさびがたもじ)に詳しくなってしまったゆーさんに古代文字の符号化の議論、Unicodeが世界のすべての文字を収録する意義を技術と文化の両面から紹介いただきます。 楔形文字との出会い 日高:Unicodeをはじめとした文字コードって普段は意識しない領域だと感じています。いろいろ教えてもらいながら話せればと考えています。 ゆー:よろしくお願いします。私もこの分野を専門に

                                                                                第4回 神話と楔形文字と、ときどきUnicode | gihyo.jp
                                                                              • UTF-8の文字コード表 - 備忘帳 - オレンジ工房

                                                                                UTF-8の文字コード表なのです。いつも検索して、よそ様のページを参照させていただいていたのですが、面倒なので自分で作りました。 perlのスクリプトでガーッと出したので、見栄えはアレですが、とりあえず。 1バイト文字 2バイト文字 3バイト文字 E2 9C 80 ~ Dingbats、昔からある記号、絵文字とか E3 80 80 ~ 全角ひらがな・カタカナ EF BC 80 ~ 全角英数字、半角カナ 4バイト文字 F0 9F 8C 80 ~ たぶん今どきの皆さんの言う絵文字 F0 9F 98 80 ~ 顔文字 更新履歴 (2018-05-10 追記) コード表を全体的に再出力しました。変更点は以下の通りです。 unicode追加面、4バイト文字の表もつくりました。 各文字ブロックにタイトルを付けました。英語タイトルはUnicode仕様書PDFへ直リンクしています。 表示されてないけど、ど

                                                                                • 文字情報基盤検索システム

                                                                                  本検索システムはMJ文字情報一覧表 Ver.006.01に基づいています。 Internet Explorerでは動作しません。 本検索システムでは文字関連グラフの提供予定はありません。 本検索システムは現状有姿でご利用下さい。

                                                                                  新着記事