並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 136件

新着順 人気順

unicodeの検索結果41 - 80 件 / 136件

  • What's New in Unicode 14.0

    Today the latest emoji list will be released by the Unicode Consortium, with additions including Biting Lip, Troll, Saluting Face, as well as two heart-related gestures: Heart Hands and Hand with Index Finger and Thumb Crossed (aka finger heart, popular in K-Pop circles). The release date for version 14.0 of the Unicode Standard was aptly set for the 14th day of September, and formalizes what has

      What's New in Unicode 14.0
    • 開発から 45 年、プログラミング言語 AWK に Unicode サポートが追加 | スラド デベロッパー

      プログラミング言語 AWK が最初に開発された 1977 年から 45 年後の2022年、Brian Kernighan 氏により Unicode サポートが追加されたそうだ (README.unicode、 The Register の記事、 Ars Technica の記事、 Computerphile 動画)。 Kernighan 氏は AWK (Aho Weinberger Kernighan) の「K」の由来でもあるオリジナル開発者で、80 歳になる。GitHub の「The One True Awk」リポジトリに Unicode サポートがコミットされたのは 6 月 1 日だったが、先週 Kernighan 氏が YouTube の Computerphile に出演するまで注目されずにいたようだ。Kernighan 氏によれば、AWK が Unicode をサポートしていない

      • シュトヘル達の名前を西夏文字 (Unicode) で書く

        初稿: 2020-10-16 小松弘幸 (@komatsuh) 記事の内容 シュトヘルという漫画がとてもよいです 西夏文字をコンピューター上で扱う方法を紹介します 西夏文字の簡易辞書を作成します シュトヘルの登場人物を西夏文字で表現します ユルール 𘅝𘚻 (U+1815D U+186BB) - 祝福 (慶喜) ハラバル 𗱈𗰞 (U+17C48 U+17C1E) - 黒虎 シュトヘル 𘄅𗾢 (U+18105 U+17FA2) - 雀子 左から順に ユルール ハラバル シュトヘル はじめに この文書に登場する西夏文字を正しく表示するためには、おそらくフォントのインストールが必要です。下記の GitHub などからダウンロードとインストールができます。 Noto fonts: NotoSerifTangut (GitHub) シュトヘルと西夏文字 シュトヘルという漫画を読んでとても好

          シュトヘル達の名前を西夏文字 (Unicode) で書く
        • Unicode Utilities: Confusables

          With this demo, you can supply an Input string and see the combinations that are confusable with it, using data collected by the Unicode consortium. You can also try different restrictions, using characters valid in different approaches to international domain names. For more info, see Data below.

          • 「Unicode Emoji 14.0」リリース──敬礼する顔や妊娠する男性など

            Emojipediaは、Googleは10月にはEmoji 14.0を実装すると予測している。近くリリース予定の「Android 12」では新しいEmojiが使えるかもしれない。 新たに加わった絵文字などの詳細についてはEmojipediaのブログを参照されたい。 関連記事 絵文字専門サイトのEmojipedia、携帯アプリ企業Zedgeが買収 世界絵文字デー提唱でも知られる絵文字サイトのEmojipediaを、携帯アプリ企業のZedgeが買収した。運営はこれまでと変わらず、「将来的に安定した成長が可能になった」と創業者のジェレミー・バージ氏は語る。 食べ物はよりおいしそうに Googleの絵文字はダークモードで星空にも変わる 7月17日は「世界絵文字デ-」ということで、Googleが絵文字の新デザインを発表しました。Gmailやチャットでは7月中に利用可能になる見込みです。Android

              「Unicode Emoji 14.0」リリース──敬礼する顔や妊娠する男性など
            • Unicodeバージョン 15.0リリース ―CJKの表意文字など4,489文字が追加 | gihyo.jp

              Unicode Consortiumは9月13日、Unicode標準のバージョン 15.0が利用可能になったことを発表した。バージョン15.0では4,489文字が追加され、合計で14万9,186文字になった。 追加文字には20個の新しい絵文字と 4,193個のCJK(中国語、日本語、韓国語)の表意文字とともに、2つの新しいスクリプトが追加され、合計161個のスクリプトが含まれる。 新しいスクリプトには以下のようなものがある。 ナグ・ムンダリ:インドで使われる言語であるムンダリを書くために使用される現代の文字 カンナダ語文字:インドでコンカニ語、アワディ語、ハビャカ語カンナダ語を書くために使用される文字 カクトビック数字:イヌイット語とユピック語の数を表示するために、アラスカ州カクトビックのイヌピアク語話者によって考案された文字 また、20の新しい絵文字にはヘアピック、マラカス、クラゲ、カン

                Unicodeバージョン 15.0リリース ―CJKの表意文字など4,489文字が追加 | gihyo.jp
              • Unicode characters you can not see

                Invisible Unicode characters? In Unicode there are a lot of invisible characters: regular white-space characters (e.g. U+0020 SPACE), language specific fillers (e.g. U+3164 HANGUL FILLER of the Korean Hangual alphabet), or special characters (e.g. U+2800 BRAILLE PATTERN BLANK). While all of these have a specific meaning in their natural context, they can be used in various applications that don't

                • 数字の絵文字とUNICODE

                  数字の絵文字とUNICODE 絵文字 UNICODE 0️⃣ \u0030\ufe0f\u20e3 1️⃣ \u0031\ufe0f\u20e3 2️⃣ \u0032\ufe0f\u20e3 3️⃣ \u0033\ufe0f\u20e3 4️⃣ \u0034\ufe0f\u20e3 5️⃣ \u0035\ufe0f\u20e3 6️⃣ \u0036\ufe0f\u20e3 7️⃣ \u0037\ufe0f\u20e3 8️⃣ \u0038\ufe0f\u20e3 9️⃣ \u0039\ufe0f\u20e3 数字の絵文字はUNICODEでは3バイトになる 後半の2バイト(\ufe0f\u20e3の部分)は共通 先頭の1バイトが \u0030~ \u0039で絵文字の0~9に対応している pythonで文字列中に出てくる数字の絵文字を普通の数字に変換する方法 def trans_emoji_

                    数字の絵文字とUNICODE
                  • The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 (Still No Excuses!) @ tonsky.me

                    If you combine this with the Unicode table, you’ll see that English is encoded with 1 byte, Cyrillic, Latin European languages, Hebrew and Arabic need 2, and Chinese, Japanese, Korean, other Asian languages, and Emoji need 3 or 4. A few important points here: First, UTF-8 is byte-compatible with ASCII. The code points 0..127, the former ASCII, are encoded with one byte, and it’s the same exact byt

                      The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 (Still No Excuses!) @ tonsky.me
                    • 人間にUnicode正規化は難しい - エムスリーテックブログ

                      【AI・機械学習チーム ブログリレー2日目】 AI・機械学習チームの池嶋 (@mski_iksm) です。 私達のチームでは、機械学習バッチの実行方法やインターンを含む新配属者のPC初期セットアップ手順など多くのドキュメントがGitLab上で管理されています。Gitでドキュメントを管理するのは、Wiki等と比較して更新時のピアレビューがしやすかったり、CIによる自動チェックがやりやすかったりなどのメリットから採用されています。 CIの自動チェックの1つとしてリンクチェッカーがあります。これは切れているリンクがないかを更新時にチェックするものです。 ある日、ファイルはあるように「見える」のに、なぜかリンクチェッカーのCIが落ちているという事象が発生しました。 タイトルでネタバレしているのですが、原因はUnicodeの正規化でした。 この記事では、何が起きていたのか?どのようなケースで起こりう

                        人間にUnicode正規化は難しい - エムスリーテックブログ
                      • いろんな形式で書かれた日時データも置換処理で手軽に統一「EmEditor」v21.6.0/Unicodeの「見えない文字」攻撃への対策も強化。「Unicode 14.0.0」にも対応

                          いろんな形式で書かれた日時データも置換処理で手軽に統一「EmEditor」v21.6.0/Unicodeの「見えない文字」攻撃への対策も強化。「Unicode 14.0.0」にも対応
                        • Unicode 13.0 で新しく収録された日本語の漢字|Colorless Green Ideas

                          2020年3月にリリースされた Unicode 13.0 では、「日本で最も画数が多い字」とも呼ばれる「たいと」という漢字と宮沢賢治の詩の中に出てくる「鏡」を4つ組み合わせた漢字が収録された。また、Unicode 13.0 における部首の例示フォント変更についても触れる。 はじめに Unicode は世界の様々な文字をコンピュータ上で統一的に扱うための国際規格である [1] 。Unicode には毎年のように新しい文字が追加されており、2020年3月にリリースされた Unicode 13.0 では 5,930字が追加されている [2] 。 Unicode 13.0 での漢字の追加 Unicode 13.0 で追加された文字の大半は漢字である。Unicode 13.0 では、漢字 [3] を追加するためにCJK統合漢字拡張G (CJK Unified Ideographs Extension

                            Unicode 13.0 で新しく収録された日本語の漢字|Colorless Green Ideas
                          • Unicodeに新しく追加された漢字を見ていたら「私のような漢字」を見つけてしまった→満場一致でとある読み方をされてしまう

                            リンク OSDN 「Unicode 13」リリース、新たな言語・文字・絵文字が追加され文字数は14万3800種類に | OSDN Magazine Unicode Consortiumは3月10日、文字コード規格の最新版「Unicode 13」の仕様公開を発表した。新たに5930種類の文字が加わり、合計の文字数は14万3859種類となった。 Unicode 13.0は2019年3月に登場したUnicode 12.0に続くものとなる。新たにイラクやジョージアで使われていた「Yezidi」やウズベキスタン、カザフスタン、トルクメニスタンなどの中央 4 users 2

                              Unicodeに新しく追加された漢字を見ていたら「私のような漢字」を見つけてしまった→満場一致でとある読み方をされてしまう
                            • Unicode(ユニコード)とURLエンコード検索と変換サイト 0g0.org

                              記号や便利な文字等囲み文字、略文字、短縮文字、マーク、シンボル【™©🆗①㊿🅐㋐㋿㍻㍾㊩㍿🈀】単位の略文字・短縮文字【㎠㋌㏞㏗㏖㏒㎧㎢】数学・技術分野と関係する記号やシンボルと数字【∀∏∑−∓√∛∜∞∫∴∵≃】矢印【⇐⇑⇒⇓⇔⇕⇖⇗⇘⇙↰↱↲↳↴↵↶↷】色のある丸と四角【⚪⚫🔴🟧🟨🟩🟪🟫】トランプ【🂡🂢🂣🃜🃝🃞🂿🃏🃟】麻雀牌【🀄🀅🀆🀇🀈🀐🀑🀙🀚🀛】ドミノ牌【🀱🀲🀳🂑🂒🂓】罫線【┌─┬──┼─┐┗━╋━━━┻━┛═╬═】全角文字と半角文字【123!"#$%&¢£¬ ̄¦¥₩ァィゥェォアイウエオ】ブロック要素と幾何学模様【■░▞▚▣◯◍◈◶】便利な絵文字、記号、顔文字【☀☁☂🍘🍙🍚🥇🥈🥉⚡⚽⚾🙈🙉🙊】平仮名とカタカナ(全角・半角)【あいうえおアイウエオヤユヨヷヸヹヺ】かっこ(括弧)各種【【{❴⁽₍⦅⦆₎⁾❵}】】

                              • GitHub - SixArm/usv: Unicode Separated Values (USV) data markup for units, records, groups, files, streaming, and more.

                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                  GitHub - SixArm/usv: Unicode Separated Values (USV) data markup for units, records, groups, files, streaming, and more.
                                • 忍者やタピオカミルクティーなど新規絵文字117パターンがUnicode 13.0.0で追加される予定

                                  文字コードの業界標準であるUnicode 13.0.0が2020年3月10日にリリースされるにあたり、Unicodeの策定組織であるUnicode ConsortiumがUnicode 13.0.0から追加される予定の絵文字を先行公開しました。公開された117パターンの絵文字のうち、62パターンが新しいデザインの絵文字で、残り55パターンは既存の絵文字に性別や肌の色による差分を追加したものとなっています。 The Unicode Blog: Unicode Emoji 13.0 — Now final for 2020 http://blog.unicode.org/2020/01/unicode-emoji-130-now-final-for-2020.html 117 New Emojis In Final List For 2020 https://blog.emojipedia.o

                                    忍者やタピオカミルクティーなど新規絵文字117パターンがUnicode 13.0.0で追加される予定
                                  • GitHub - cmang/durdraw: Versatile ASCII and ANSI Art text editor for drawing in the Linux/Unix/macOS terminal, with animation, 256 and 16 colors, Unicode and CP437, and customizable themes

                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                      GitHub - cmang/durdraw: Versatile ASCII and ANSI Art text editor for drawing in the Linux/Unix/macOS terminal, with animation, 256 and 16 colors, Unicode and CP437, and customizable themes
                                    • 週刊Railsウォッチ(20200212後編)Rubyistが解説するUnicodeとUTF-8、Sorbetが速い理由、CSSの歴史、2019年の脆弱性まとめほか|TechRacho by BPS株式会社

                                      2020.02.12 週刊Railsウォッチ(20200212後編)Rubyistが解説するUnicodeとUTF-8、Sorbetが速い理由、CSSの歴史、2019年の脆弱性まとめほか こんにちは、hachi8833です。昨日の大江戸Ruby会議をすっかり見落としてました😇。 大江戸Ruby会議で話すので東京にいたらそこで会いましょう! https://t.co/w1ADFEMhnx — Aaron Patterson (@tenderlove) February 8, 2020 サイト: 大江戸Ruby会議08 -- 終わりました 各記事冒頭には⚓でパーマリンクを置いてあります: 社内やTwitterでの議論などにどうぞ 「つっつきボイス」はRailsウォッチ公開前ドラフトを(鍋のように)社内有志でつっついたときの会話の再構成です👄 毎月第一木曜日に「公開つっつき会」を開催していま

                                        週刊Railsウォッチ(20200212後編)Rubyistが解説するUnicodeとUTF-8、Sorbetが速い理由、CSSの歴史、2019年の脆弱性まとめほか|TechRacho by BPS株式会社
                                      • Kotlin / Swift での Unicode の扱いまとめ (見た目上の文字数カウント, UTF-8, UTF-16, BOM, 正規化, 異体字セレクタ) - Qiita

                                        Kotlin / Swift での Unicode の扱いまとめ (見た目上の文字数カウント, UTF-8, UTF-16, BOM, 正規化, 異体字セレクタ)AndroidiOSKotlinUnicodeSwift Kotlin と Swift での見た目上の文字数カウント実装を中心に、Unicode について知っておくべき知識をまとめます。 また、モバイルアプリで入力文字数のカウントや入力文字数の上限をどのように扱うかは以下の別の記事にまとめました。 文字数カウント まずは、文字数カウントが難しい例として絵文字と異体字セレクタ表現の例を挙げます。詳しい説明はこの記事の後半を確認してください。 絵文字 🧑‍🦰 の文字数について確認します。🧑‍🦰 は以下の Unicode で構成されています。 文字 Code point UTF-8 表現 UTF-16 表現 Descriptio

                                          Kotlin / Swift での Unicode の扱いまとめ (見た目上の文字数カウント, UTF-8, UTF-16, BOM, 正規化, 異体字セレクタ) - Qiita
                                        • 【図解】【3分解説】UnicodeとUTF-8の違い!【今さら聞けない】 - Qiita

                                          UTF-16のことをUnicodeと記しているソフトウェア(Windowsのメモ帳など)もありますのでUnicodeとあったらそれはUTF-16を使って変換したものなのだな、というふうに理解してください。 そうなってしまっている理由はこちらで解説されていました。 これでUnicodeとUTF-8の違いはバッチリですね!おわり。 読んで分かりやすかったり少しでも何か学べたと思えたら いいね や コメント をもらえるとこれからの励みになります! もう少し時間がある方へ 手計算で文字をUTF-8での符号まで計算してみましょう。 理解が一気に深まります。手順は以下。 1. 文字のコードポイントをUnicodeから見つけてくる。 2. コードポイントをUTF-8の方式で変換してみる。 Omiitaの「お」をUTF-8による符号まで変換してみます。 文字「お」のコードポイントをUnicodeから見つけ

                                            【図解】【3分解説】UnicodeとUTF-8の違い!【今さら聞けない】 - Qiita
                                          • UAX31: Unicode Identifier の話

                                            今日はまた去年の作業が元ネタで、プログラミング言語の識別子に使える文字に関する話です。 レターか数字 「1文字目にはアルファベットか _、2文字目以降にはそれに加えて数字を使えます。」 30年くらい前にはこれが「プログラミング言語の識別子(変数名など)に使える文字列」の定義でした。 _ の部分はプログラミング言語次第ですが、「1文字目にアルファベット、2文字目以降に数字」の部分は結構いろんな言語でそうだったんじゃないかと思います。 まあ、昔のプログラミング言語は ASCII コードで書く物だったので、上記の条件は [a-zA-Z] とか [0-9] みたいな正規表現で書けたんですが。 Unicode の時代になると「アルファベットだけでいいのか」とか「アルファベットって何だ」という話になります。 レター まず、「アルファベット(alphabet)」というと母音と子音が分かれてる文字のことで

                                              UAX31: Unicode Identifier の話
                                            • 【💡名案】0~9の代わりにUnicode全文字を使えば「65536進法」になり,なんでも1桁で表現できるから2桁の計算が不要! ・・・ためしに「65021-65018=3」ってどう書くの?

                                              ルワンダ語たん(キニヤルワンダ語・キニャルワンダ語・キニアルワンダ語の語学たん・学術たん) @rwanda_go_tan <Unicodeで1桁を表す> 65536進法で「65018」を表す文字は「 ﷺ 」※これで1文字 次に,65536進法で「65021」を表す文字は「 ﷽ 」※これで1文字 出典 compart.com/en/unicode/U+F… ・U+FDFA,ﷺ compart.com/en/unicode/U+F… ・U+FDFD,﷽ 2019-08-29 16:13:08 ルワンダ語たん(キニヤルワンダ語・キニャルワンダ語・キニアルワンダ語の語学たん・学術たん) @rwanda_go_tan ちなみに,65536進法で 「3」という数値を表す文字は… Unicode Character 'END OF TEXT' (U+0003) filefor

                                                【💡名案】0~9の代わりにUnicode全文字を使えば「65536進法」になり,なんでも1桁で表現できるから2桁の計算が不要! ・・・ためしに「65021-65018=3」ってどう書くの?
                                              • 3年ぶりに無料の老舗アーカイバー「Explzh」がメジャーバージョンアップ ~v9に到達/Unicode 64bit版の自己解凍書庫を作成可能に

                                                  3年ぶりに無料の老舗アーカイバー「Explzh」がメジャーバージョンアップ ~v9に到達/Unicode 64bit版の自己解凍書庫を作成可能に
                                                • JVN#43561812: スマートフォンアプリ「+メッセージ(プラスメッセージ)」における Unicode 制御文字の扱いに関する脆弱性

                                                  JVN#43561812 スマートフォンアプリ「+メッセージ(プラスメッセージ)」における Unicode 制御文字の扱いに関する脆弱性 ソフトバンク株式会社 Android アプリ「+メッセージ(プラスメッセージ)」12.9.5 より前のバージョン iOS アプリ「+メッセージ(プラスメッセージ)」3.9.4 より前のバージョン 株式会社NTTドコモ Android アプリ「+メッセージ(プラスメッセージ)」54.49.0500 より前のバージョン iOS アプリ「+メッセージ(プラスメッセージ)」3.9.4 より前のバージョン KDDI株式会社 Android アプリ「+メッセージ(プラスメッセージ)」3.9.2 より前のバージョン iOS アプリ「+メッセージ(プラスメッセージ)」3.9.4 より前のバージョン

                                                  • 「Unicode Emoji 13.0」決定──タピオカドリンクも遅まきながら登場

                                                    Unicodeの開発を調整する非営利団体Unicode Consortiumは1月29日、2020年中に各種サービスで利用できるようになる新しい絵文字セット「Emoji 13.0」が確定したと発表した。メーカーなどへのリリースは3月で、iOSやAndroidなどで使えるようになるのは9月か10月になる見込みだ。 新たに62の絵文字が追加された。昨年大流行した「タピオカドリンク」やダイバーシティに配慮した「赤ちゃんにミルクをあげる男性」などもある。

                                                      「Unicode Emoji 13.0」決定──タピオカドリンクも遅まきながら登場
                                                    • Find all Unicode Characters from Hieroglyphs to Dingbats – Unicode Compart

                                                      U+1D54F is the unicode hex value of the character Mathematical Double-Struck Capital X. Char U+1D54F, Encodings, HTML Entitys:𝕏,𝕏,𝕏, UTF-8 (hex), UTF-16 (hex), UTF-32 (hex)

                                                      • VScodeでUnicodeをデコードする方法

                                                          VScodeでUnicodeをデコードする方法
                                                        • Windows 10ミニTips(444) 「ワールドワイド言語サポートでUnicode UTF-8を使用」は有効にすべき?

                                                          「Windows 10ミニTips」は各回の作成時点で最新のWindows 10環境を使用しています。 UTF-8化は世界的な流れだがトラブルを招く可能性アリ Windows 10の日本語ロケール(日本語文字コード)は慣例的にShift_JISとなっていたが、時代の流れと共にUTF-8化が進んできた。例えばメモ帳で作成したテキストファイルのファイル形式は、すでにANSI(Shift_JIS)からBOMなしUTF-8に変更されている。 バージョン1903では、メモ帳で使用する既定の文字コードがUTF-8になった このUTF-8を、Windows全体に適用するオプション(日本語ロケール)はバージョン1803で加わった。下図に示した手順で日本語ロケールをShift_JISからUTF-8に変更できるが、気になるのはバージョン1803でも“ベータ”だった本機能が、現時点での最新となるバージョン190

                                                            Windows 10ミニTips(444) 「ワールドワイド言語サポートでUnicode UTF-8を使用」は有効にすべき?
                                                          • 老舗のメールチェックツール「nPOP」が9年ぶりのアップデート ~v1.2.0が公開/SSLのアップデートやUNICODE版への一本化、UIのアップデートを実施

                                                              老舗のメールチェックツール「nPOP」が9年ぶりのアップデート ~v1.2.0が公開/SSLのアップデートやUNICODE版への一本化、UIのアップデートを実施
                                                            • Unicodeにある数字の一覧 | hydroculのメモ

                                                              Unicodeにある数字の一覧 2015/12/01 正規表現で数字にマッチさせたい場合に \p{N} というのを使うことがあるが、これにマッチする文字は [0-9] に限らない。 \p{N} はUnicodeの文字プロパティで N (Number)とされているすべてのコードポイントにマッチする。これはとてもたくさんの文字が該当する。 Rubyでの例 str = "8٨८೮൮๘໘༨၈៨᠘8𝟖𝟠𝟪𝟴𝟾Ⅷⅷ༱⁸₈⅛⑧⑻⒏⓼❽➇➑㈧㊇🄉八" p str.scan(/\p{N}/) # => ["8", "٨", "८", "೮", "൮", "๘", "໘", "༨", "၈", "៨", "᠘", "8", "𝟖", "𝟠", "𝟪", "𝟴", "𝟾", "Ⅷ", "ⅷ", "༱", "⁸", "₈", "⅛", "⑧", "⑻", "⒏", "⓼", "❽", "➇"

                                                              • GitHub - tonton-pixel/unicopedia-plus: Developer-oriented set of Unicode, Unihan & emoji utilities wrapped into one single app, built with Electron.

                                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session.

                                                                  GitHub - tonton-pixel/unicopedia-plus: Developer-oriented set of Unicode, Unihan & emoji utilities wrapped into one single app, built with Electron.
                                                                • Unicode 14.0で「溶解する顔」「妊娠中の人」など37個が追加

                                                                  現地時間2021年9月14日、Unicode開発を調整するアメリカの非営利団体・Unicode Consortiumが「Unicode 14.0」をリリースしました。このUnicode 14.0では、新たに37個の絵文字が追加されています。 The Unicode Blog: Announcing The Unicode® Standard, Version 14.0 http://blog.unicode.org/2021/09/announcing-unicode-standard-version-140.html What's New in Unicode 14.0 https://blog.emojipedia.org/whats-new-in-unicode-14-0/ “Melting face,” “pregnant person,” and 35 other emoji a

                                                                    Unicode 14.0で「溶解する顔」「妊娠中の人」など37個が追加
                                                                  • Fadis on Twitter: "ソースコードにUnicode制御文字を挟むことで人間には違う意味に見えるソースを作るトロイのソースが出てから各言語で対応が議論されている。対応が早かったRustは問題となっているコードポイントがコード中に現れるのを禁止したが、Py… https://t.co/h9KJeXHK5b"

                                                                    ソースコードにUnicode制御文字を挟むことで人間には違う意味に見えるソースを作るトロイのソースが出てから各言語で対応が議論されている。対応が早かったRustは問題となっているコードポイントがコード中に現れるのを禁止したが、Py… https://t.co/h9KJeXHK5b

                                                                      Fadis on Twitter: "ソースコードにUnicode制御文字を挟むことで人間には違う意味に見えるソースを作るトロイのソースが出てから各言語で対応が議論されている。対応が早かったRustは問題となっているコードポイントがコード中に現れるのを禁止したが、Py… https://t.co/h9KJeXHK5b"
                                                                    • Python入門ガイド: Unicode、正規表現、バイナリデータの扱い方【データ操作のマスター!】|Yuu's Memo

                                                                      データの自在な操作 データ操作はプログラミングにおいて重要なスキルです。Pythonでは、文字列やUnicode、正規表現、バイナリデータなど、さまざまなデータ形式を柔軟に操作することができます。この記事では、Pythonを使ったデータ操作の基本と応用について解説します。以下の各節では、実際のコード例を交えながら詳しく説明します。 文字列:Unicode Unicode は、コンピュータ処理のためのテキストの表現に使用される汎用の文字エンコーディング規格です。 Unicode は、多言語テキストをエンコードする一貫した方法を提供し、国際化対応テキストファイルの交換を容易にします。 多言語テキストをコード化するための規格は ISO/IEC 10646 です。 Python 3のUnicode文字列 Python 3では、文字列はデフォルトでUnicode文字列として扱われます。Unicode

                                                                        Python入門ガイド: Unicode、正規表現、バイナリデータの扱い方【データ操作のマスター!】|Yuu's Memo
                                                                      • Shapecatcher: Draw the Unicode character you want!

                                                                        You need to find a specific Unicode character? With Shapecatcher.com you can search through a database of characters by simply drawing your character into a box. It can find the most similar character shapes for your drawing.

                                                                        • Windows のコンソール端末と Unicode の相性

                                                                          MacType が効いている MSYS2 の mintty は、雪だるまと令和合字の字送りの幅が半角扱いなことを除けば、概ね合格です。 サロゲートペアを扱えないのは、マルチバイトの文字コードを扱えない、シングルバイト圏のソフトウェアのような話です。 FontLinkレジストリの FontLink で欧文フォント等に和文フォント結び付けていると、意図しない形で FontLink と異なるフォントになることがあります。メモ帳で先ほど同様に試してみると、次のように。 どうやらコードポイントによって、FontLink のフォントでなく、システムの他のフォントで描画されてしまうようです。 ☃ U+2603 が Segoe UI Emoji𠮟 U+20B9F や 𠮷 U+20BB7 が 游明朝しかも、混入した 游明朝 の文字は、なぜか一回り大きな文字サイズです。標準の Segoe UI や Tah

                                                                            Windows のコンソール端末と Unicode の相性
                                                                          • Unicode IVS/IVDについて | 一般社団法人 文字情報技術促進協議会

                                                                            IVS(Ideographic Variation Sequence/Selector)は、文字符号としては同一視される漢字の、細かな字形の差異を特別に使い分けるための仕組みです。IVSは文字符号の国際規格であるISO/IEC 10646(2008年版以降)に規定されています。また、IVSと、それに対応する字形の一覧は、UnicodeコンソーシアムからIVD(Ideographic Variation Database)として公開されており、ISO/IEC 10646から正規の規格として参照されています。 文字符号(文字コード)を定める日本工業規格のJIS X 0213(以下、JIS)やISO/IEC 10646 Universal Coded Character Set(以下、UCS)などでは、複数の字形に対して一つの共通な符号(コード)を与える場合があります(「同一の符号位置に複数の字

                                                                            • 「Unicode 15.0」が公開 ~新しい絵文字20種を含む4,489の新たな文字が追加/「Noto Emoji」や「Last Resort Font」もさっそく対応

                                                                                「Unicode 15.0」が公開 ~新しい絵文字20種を含む4,489の新たな文字が追加/「Noto Emoji」や「Last Resort Font」もさっそく対応
                                                                              • UnicodeとUTF-8の違い。UTF-8・UTF-16・UTF-32とは

                                                                                インターネットが世界中で普及している現代では、世界中のコンピュータが相互にデータを授受できるように、文字コードの統一が必須です。 そこで,考案されたのがUnicode(ユニコード)と呼ばれるコード体系です。 UnicodeはISO(国際標準化機構)規格となり、国際的に認められています。 文字コードに関する記事はこちら 文字コードとは?コンピュータの文字コードの種類 私たち人間は、 数字(10進数:0 〜 9) 文字 平仮名(あ 〜 ん) 片仮名(ア 〜 ン) 漢字 アルファベット(A ~ Z) 音 色 等々 を認識出来ますが、コンピュータは 数字(10進...

                                                                                  UnicodeとUTF-8の違い。UTF-8・UTF-16・UTF-32とは
                                                                                • 第4回 神話と楔形文字と、ときどきUnicode | gihyo.jp

                                                                                  【話し手】 ゆー(Yu)楔形文字検索ツールqantuppi、クルヌギアを開発。技術同人誌『楔形文字とユニコードの出会いにまつわるエトセトラ』で技術書典「第3回 刺され!技術書アワード」エポックメイキング部門受賞。家にねこがいます。 GitHub:uyumyuuy Twitter:@uyum 本コーナーでは技術へのタッチポイントを増やすことを目標に、各分野で活躍されている方をお迎えします。 今回のテーマは文字コードです。楔形文字(くさびがたもじ)に詳しくなってしまったゆーさんに古代文字の符号化の議論、Unicodeが世界のすべての文字を収録する意義を技術と文化の両面から紹介いただきます。 楔形文字との出会い 日高:Unicodeをはじめとした文字コードって普段は意識しない領域だと感じています。いろいろ教えてもらいながら話せればと考えています。 ゆー:よろしくお願いします。私もこの分野を専門に

                                                                                    第4回 神話と楔形文字と、ときどきUnicode | gihyo.jp