並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 178件

新着順 人気順

unicodeの検索結果41 - 80 件 / 178件

  • UTF-8のバリデーションとモノイドと半群

    この記事はUTF-8のバリデーションとオートマトンの続きです。 前回はUTF-8のバリデーションが8状態のオートマトン (DFA) で表現できることを見ました。状態と遷移を擬似コードで書けば次のようになるでしょう: -- 8つの状態 data State = START | TAILx1 | TAILx2 | TAILx3 | A | B | C | D -- 入力バイトに応じて次の状態を返す。次の状態が該当しなかったら Nothing を返す next :: Word8 -> State -> Maybe State +----+----+-----+----+ | a0 | a1 | ... | aN | 8ビット整数列 +----+----+-----+----+ | | | v v v +----+----+-----+----+ | m0 | m1 | ... | mN | モノ

      UTF-8のバリデーションとモノイドと半群
    • 「Twitter」改め「X」のロゴはUnicodeの「U+1D54F」らしい/「黒板文字」や「重ね打ち体」と呼ばれる文字の1つ【やじうまの杜】

        「Twitter」改め「X」のロゴはUnicodeの「U+1D54F」らしい/「黒板文字」や「重ね打ち体」と呼ばれる文字の1つ【やじうまの杜】
      • ChatGPTを使って、文字コードの理解と記述の負担を軽減できるのか 「日本語と認識しているUnicodeの範囲」「括弧の検出」「新字体への変換」を調査してみた

        「『生成AIを使ってこんなもの作ってみました』開発者LT大会」は、急速に発展しているChatGPTや生成AIといったAI技術を使って何かを作ってみた人たちがアイデアや成果を共有する、ログミーTech主催のイベントです。ここでPR TIMES社の土屋氏が登壇。「ChatGPTを使って文字コードを扱う負担を軽減できるか」という調査の内容と結果について紹介します。 Shun氏の自己紹介と、本セッションのアジェンダ Shun氏(以下、Shun):それでは、PR TIMES社の土屋が発表します。私の名前はShunといいます。PR TIMESに勤めていて、ソフトウェアエンジニアをやっています。 本日のアジェンダです。私の発表はどちらかというと、個人開発でChatGPTを使ったものを作って、それで実験をしてみたという内容になっております。 表題にもあるとおり、ChatGPTに文字コードのことを聞いてどん

          ChatGPTを使って、文字コードの理解と記述の負担を軽減できるのか 「日本語と認識しているUnicodeの範囲」「括弧の検出」「新字体への変換」を調査してみた
        • UTF-8のバリデーションとオートマトン

          UTF-8は今日の文字エンコーディングの中で最も重要なものと言って差し支えないでしょう。UTF-8の仕様はこの辺で確認できます: Unicode 15.1.0 > 3.9 UTF-8 RFC 3629 - UTF-8, a transformation format of ISO 10646 この記事では、読者はすでにUTF-8にある程度の馴染みがあるものとして、UTF-8のバリデーションの細かいところを考えます。 UTF-8のバリデーションを行うには、以下のことを確かめなければなりません: 最初の1バイトが所定の範囲にあること:ASCII (0x00-0x7F) または0xC2以上。 後続のバイト(たち)が0x80-0xBFの範囲にあること。 長すぎないこと:U+007F以下の文字はちょうど1バイトで表現されていること、U+0080以上U+07FF以下の文字はちょうど2バイトで表現されて

            UTF-8のバリデーションとオートマトン
          • The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 (Still No Excuses!) @ tonsky.me

            If you combine this with the Unicode table, you’ll see that English is encoded with 1 byte, Cyrillic, Latin European languages, Hebrew and Arabic need 2, and Chinese, Japanese, Korean, other Asian languages, and Emoji need 3 or 4. A few important points here: First, UTF-8 is byte-compatible with ASCII. The code points 0..127, the former ASCII, are encoded with one byte, and it’s the same exact byt

              The Absolute Minimum Every Software Developer Must Know About Unicode in 2023 (Still No Excuses!) @ tonsky.me
            • ¥を巡る不都合な真実 - モディファイド・シフトJISという化石|kzn

              パソコンの世界で漢字を含む日本語を扱えるようにするために、処理が煩雑になるJISコードをそのまま扱うのではなく、文字コードセットの切り替え処理が不要になるシフトJISというコードが発明されました。 このコードがどのような経緯でMS-DOSなどで採用されたのかは、あまり詳しくわからないのですが、この文字コードは規格ではなくあくまで実装に過ぎなかったので、メーカー独自の判断で構わないと思われていたようです。 MULTI16 - 遂に三菱電機もパソコンを出した この文字コードが身近に使われるようになったのは、MS-DOSが日本語に対応した1983年にリリースされた「日本語MS-DOS Ver2.x」からだと思います。この段階で階層化ディレクトリもサポートされ、CP/Mから継承したコマンドオプションは”/”で始まるというルールが仇となりパスの区切り文字がUNIXなどで使われていた”/”の代わりに”

                ¥を巡る不都合な真実 - モディファイド・シフトJISという化石|kzn
              • GB18030-2022が来た!詳細編—内容から読み取る本質〈エリックの多言語文字散歩〉|ヒラギノフォント公式note

                前回の概要編では、じっくりとGB18030-2022の表紙を見ながら、中国におけるGBの定義、GB18030規格改定の概要、製品への搭載義務などについて解説しました。今回は、いよいよ表紙をめくって更新された内容について詳しく解説していきます。 漢字はとにかく多いGB18030-2022の規格書の実物を見ると、まずその厚みに圧倒されるでしょう。700ページを超えるページをパラパラとめくってみてわかるのは、本文はわずか8ページ程度で、残りのほとんどは付属書である長い文字コード表ばかりです。 文字コードの国際標準としてISO/IEC 10646があります。そして業界規格のUnicodeとおおむね互換しています。一方でGB18030は中国独自の規格です。GB18030は策定当初から国際標準の存在を意識して設計され、膨大な量のコードポイント(符号位置)と、各文字コードを相互変換するための対応表を用意

                  GB18030-2022が来た!詳細編—内容から読み取る本質〈エリックの多言語文字散歩〉|ヒラギノフォント公式note
                • PHPカンファレンスの過去14+3回の登壇を振り返る - Qiita

                  PHP Advent Calendar 2023の18日目の記事です。 PHPカンファレンスに登壇した記録を書きたいと思います。数えてみますと、2009年から昨年(2022年)までのPHPカンファレンス14回と、北海道2回、関西1回の合計17回登壇したことになります。 最初の登壇は14年前ですので、私の考えも当時からは変化していますので、そのあたりも触れながら紹介していきたいと思います。 PHP カンファレンス 2009 最初の登壇は2009年のPHPカンファレンスでした。この年はビジネスデイとテックデイに分かれていまして、ビジネスデイで登壇依頼を頂きましたので、当時温めていた「ウェブサイトを発注する際のセキュリティ」についてお話しました。 スライドの中で「脅威分析やってもあまり意味ない」みたいな物騒な意見が書いてあります。当時はそのように考えていたわけですが、これは当時のサイトがECサイ

                    PHPカンファレンスの過去14+3回の登壇を振り返る - Qiita
                  • Grapheme Clusters and Terminal Emulators

                    Copy and paste "🧑‍🌾" in your terminal emulator. How many cells forward did your cursor move? Depending on your terminal emulator, it may have moved 2, 4, 5, or 6 cells1. Yikes. This blog post describes why this happens and how terminal emulator and program authors can achieve consistent spacing for all characters. Character Grids, Historically Terminals operate on a grid of fixed size cells. Thi

                    • 世界絵文字デー Googleが「目の下にくま」「指紋」などの新絵文字披露

                      世界絵文字デーを開始した絵文字リファレンスサイトの英Emojipediaは同日、絵文字で遊べる新サイト「Emoji Playground」を開設した。Emojipediaでは、Unicode 16.0で承認される見込みの他の絵文字も紹介している。 関連記事 「世界絵文字デー」はなぜ7月17日なのか AppleもFacebookも祝う「World Emoji Day」は2014年に始まったばかり。なぜ7月17日になったのだろう? 絵文字×絵文字=カオス? 「Emoji kitchen」がSNSで話題 X上では大喜利状態に 2つの絵文字をミックスして新しい絵文字を生み出す機能「Emoji kitchen」がSNSで話題だ。Google検索からも利用可能になり、X(元Twitter)ではカオスな絵文字を投稿するユーザーが相次いでいる。 Google、絵文字を組み合わせた「ハート付きうんち」などを

                        世界絵文字デー Googleが「目の下にくま」「指紋」などの新絵文字披露
                      • [Unicode]スペース以外の見えない空白文字の一覧 | 404 motivation not found

                        目次 はじめにスペースや全角スペースのような空白文字一覧参考にしたサイトはじめに スペースや全角スペース以外にもいくつか存在する目に見えない Unicode の文字の一覧です。 スペースや全角スペースのような空白文字一覧 ブラウザや環境によっては表示されない場合があると思います。 Unicode 実体 説明 description

                          [Unicode]スペース以外の見えない空白文字の一覧 | 404 motivation not found
                        • エチオピアでモチモチした文字が発見されて「X」(Twitter)でちょっと話題に/「オフチョベットしたテフをマブガッドしてリットにする様子」の元ネタもこの言語【やじうまの杜】

                            エチオピアでモチモチした文字が発見されて「X」(Twitter)でちょっと話題に/「オフチョベットしたテフをマブガッドしてリットにする様子」の元ネタもこの言語【やじうまの杜】
                          • SwiftUIで日本語テキストが不自然に改行される | DevelopersIO

                            SwiftUIのTextビューで日本語を表示する際、意図しない箇所で改行が入ることがある。改行コードを使わずに改行位置を調整する方法を紹介する。 日本語テキストが不自然に改行される SwiftUIのTextビューで日本語を表示する時、意図しない箇所で改行が入ることがある。たとえば「あなたに寄り添う究極のイノベーション」というフレーズが、「あなたに寄り添う\n究極のイノベーシ\nョン」と不自然に改行されることがある。 例図では以下のように表示されている。 あなたに寄り添う 究極のイノベーシ ョン あなたの未来を形 作る最上のガジェ ット 英語圏で作られたWebサイトでの日本語の改行問題 英語圏で作られた後に日本語に翻訳されたサイトの例では、「今すぐダウンロード」というフレーズが「今すぐダウンロー\nド」と表示されることがあった。日本人の感覚からするとこれには強い違和感がある。他にも禁則処理が

                              SwiftUIで日本語テキストが不自然に改行される | DevelopersIO
                            • GB 18030-2022が来た!概要編—表紙から読み取る情報〈エリックの多言語文字散歩〉|ヒラギノフォント公式note

                              時は2023年、夏。中国の文字界隈でもっともホットな話題は、新しいGB 18030-2022の施行でしょう。 みなさんも、いよいよGB 18030-2022が2023年8月1日より施行されるという話を聞いたことがあるかもしれませんが、実際にどのような内容で私たちにどのような影響があるか、ご存知ない方もいらっしゃることでしょう。 そこで、GB 18030-2022について概要編と詳細編の2回に分けて解説していきます。 今回はGB 18030-2022の概要編として、中国から入手した本物のGB 18030-2022の規格書の表紙をじっくり見るところから、解説を始めたいと思います。 GB 18030-2022の表紙 そもそもGBってなに?GB 18030の話題を始める前に、そもそも「GB」とはなにかについて簡単に解説しておきましょう。GBとはズバリ、中国の国家標準[※1]のことです。日本の規格で

                                GB 18030-2022が来た!概要編—表紙から読み取る情報〈エリックの多言語文字散歩〉|ヒラギノフォント公式note
                              • 変体仮名を使える「Android 15 Beta 2」が公開 ~「プライベートスペース」なども追加/今秋にも正式リリース

                                  変体仮名を使える「Android 15 Beta 2」が公開 ~「プライベートスペース」なども追加/今秋にも正式リリース
                                • Decoding UTF8 with Parallel Extract

                                  Decoding UTF8 with Parallel Extract 23 Mar 2024 As a side-quest I recently decided to write a branchless utf8 decoder utilizing the pext or "parallel extract" instruction. It's compliant with rfc-3629, meaning that it doesn't just naively decode the code-point but also checks for overlong encoding, surrogate pairs and such. Compiled with gcc -O3 -march=x86-64-v3 the entire decoder results in just

                                  • List of Emoji

                                    Emojis are small picture-like symbols that can add context and emotion to written text. They are about the same size as a letter that can be typed, but unlike alphanumeric characters, they are usually depicted in color, and their meaning is often open to interpretation. The word emoji comes from combining the Japanese words for picture and character. The first emoji characters, introduced in the 9

                                    • 右から左に書かれる文章、前後関係でカタチが変わる文字。『FORSPOKEN』のアラビア語ローカライズで行われた9個の工夫【CEDEC2023】

                                      国内最大規模のゲーム業界カンファレンス「CEDEC2023」が、2023年8月23日(水)から8月25日(金)までの日程で開催されました。最終日となる8月25日には、スクウェア・エニックス プログラマー 中原 勇氏が登壇し、「FORSPOKENでのアラビア語対応について」と題した講演を行いました。 右から左に書かれる文章や、隣接する文字によっては表示が変わる字形など、数多くの課題に対応する具体的な手法が解説された本講演をレポートします。 TEXT / セレナーデ☆ゆうき EDIT / 神山 大輝

                                        右から左に書かれる文章、前後関係でカタチが変わる文字。『FORSPOKEN』のアラビア語ローカライズで行われた9個の工夫【CEDEC2023】
                                      • コマンドラインで URL デコードする一例 - ようへいの日々精進XP

                                        この記事は YAMAP エンジニア Advent Calendar 2020 の九日目になる予定です。 qiita.com tl;dr URL エンコードされた文字列を、コマンドラインでシュッとデコードしたかったので調べたのでメモ。 URL エンコードされる文字列は以下の通り。 負けない事 投げ出さない事 逃げ出さない事 これを URL エンコードすると、以下のような文字列となる。 %E8%B2%A0%E3%81%91%E3%81%AA%E3%81%84%E4%BA%8B%0D%0A%E6%8A%95%E3%81%92%E5%87%BA%E3%81%95%E3%81%AA%E3%81%84%E4%BA%8B%0D%0A%E9%80%83%E3%81%92%E5%87%BA%E3%81%95%E3%81%AA%E3%81%84%E4%BA%8B 本記事で利用する環境は以下の通り。 root@

                                          コマンドラインで URL デコードする一例 - ようへいの日々精進XP
                                        • Zalgo Text のできるまで - KAYAC engineers' blog

                                          こんにちは!面白プロデュース事業部のおばらです。 今回は、先日スタートしたJS体操第3問のテーマでもある「Zalgo Text(ザルゴ・テキスト)」の作り方を JavaScript のサンプルコードと併せて簡単にご紹介します。 hubspot.kayac.com 目次 Zalgo とは Zalgo Text とは Zalgo Text を作ってみる 「結合文字」 「ダイアクリティカルマーク」 「Unicode エスケープシーケンス」と「コードポイント」 「A」という文字に「ダイアクリティカルマーク」を加えてみる 「ダイアクリティカルマーク」の数を増やしてみる 「基底文字」も増やしてみる まとめ Zalgo とは まず、Zalgo ってなんでしょう? Zalgo(ザルゴ)とは、Flash アニメータ Dave Kally によって生み出された架空の生物。インターネット上の人々を狂気に陥れ破滅

                                            Zalgo Text のできるまで - KAYAC engineers' blog
                                          • GitHub - runk/node-chardet: Character encoding detection tool for NodeJS

                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                              GitHub - runk/node-chardet: Character encoding detection tool for NodeJS
                                            • 楔形文字(くさび形文字) Cuneiformの文字一覧 - 1 Unicode U+12000~U+123FF(73729文字目~74752文字目) (ユニコード) 0g0.org

                                              楔形文字(くさび形文字) Cuneiformの文字一覧 - 1 Unicode U+12000~U+123FF(73729文字目~74752文字目)

                                              • Public Review Issues

                                                Description of Issue: A draft UAX is now available for general public review and comment. This Unicode Standard Annex will be published as a part of Unicode 16.0. It describes the format and content of the Unikemet database, which will be added to the UCD to provide source and other information about Egyptian hieroglyphs. How to Provide Feedback: For information about how to discuss this Public Re

                                                • 窓辺の小石(134) ストレンジなラブ

                                                  インターネットなどで公開されているテキストファイルの大半がUTF-8形式となり、いまではShift JISコードのテキストファイルは少数派になりつつある。しかし、つい最近まで、WindowsでUTF-8といえば、“Byte Order Mark”(BOM)付きが普通だった。BOM付きのUTF-8形式テキストは、ExcelなどMicrosoft製品では快調に読めるものの、エラーになるサードパーティ・アプリケーションや、Linuxなどで問題を起こすなど、使いやすいものではなかった。このため、Windows 7、8の頃は、テキストファイルとしては、まだ以前からのShift JISコードを使うユーザーも少なくなかった。当時、筆者も原稿のファイルは、Shift JISを使っていた。 メモ帳がBOMなしのUTF-8で保存できるようになったのは、2019年のWindows 10 Ver.1903からであ

                                                    窓辺の小石(134) ストレンジなラブ
                                                  • 【JS体操第3問ヒント②】「コードポイント」と「コードユニット」 - KAYAC Engineers' Blog

                                                    こんにちは!面白プロデュース事業部のおばらです。 本記事はJS体操第3問「Zalgo Text の生成」の問題のヒントにもなるかもしれないシリーズ第2弾。 第1弾は 「Zalgo Text のできるまで」でした。 今回は「コードポイント」、そして「コードポイント」と似ているけれどちょっと違う概念の「コードユニット」についてざっくりおさらいしてみます。 techblog.kayac.com hubspot.kayac.com 目次 「Unicode」とは 「コードポイント」とは 「文字」を「コードポイント」に変換する 「コードポイント」を「文字」に変換する 「コードユニット」とは 「UTF-8」「UTF-16」「UTF-32」 「コードユニット」とは 「文字」を「コードユニット」に変換する 「コードユニット」を「文字」に変換する 「コードポイント」と「コードユニット」の違い 文字数とは? ま

                                                      【JS体操第3問ヒント②】「コードポイント」と「コードユニット」 - KAYAC Engineers' Blog
                                                    • 第22回CODHセミナー - デジタル時代の変体仮名:日本の文字文化の継承と新たな展開

                                                      概要 変体仮名とは、現代社会では使われなくなった「ひらがな」の字形を指す言葉です。江戸時代のひらがなは現在とは異なり、一つの音にも複数の字形が存在していました。しかし明治時代以降のひらがなは一音一字への動きが進み、現代社会における変体仮名は、そば屋の看板の「読めない文字」などにわずかに残る存在となってしまいました。 しかし最近、デジタル技術による変体仮名の再生に向けた動きが相次いでいます。まず2017年に変体仮名285文字がUnicodeに採用され、標準化が進みました。そして2024年にはGoogleがNoto Serif Hentaiganaを開発し、オープンな変体仮名フォントが誕生しました。さらに、くずし字認識や生成技術を活用したアプリが普及するなど、変体仮名の利用と継承にも新たな可能性が生まれています。そこで本セミナーでは、デジタル時代の変体仮名に取り組む関係者の方々にお集まりいただ

                                                        第22回CODHセミナー - デジタル時代の変体仮名:日本の文字文化の継承と新たな展開
                                                      • The Unicode® Standard – 2023 Release Planning

                                                        News, announcements, release info, and calendar updates from the Unicode Consortium By Peter Constable, Chair of the Unicode Technical Committee At the Q4 Unicode Technical Committee (UTC) meeting held from November 1-3, our member representatives unanimously agreed to a release plan for 2023 and tentative plan for 2024. Along with some tooling updates, our plans aim to ensure that we are more agi

                                                          The Unicode® Standard – 2023 Release Planning
                                                        • Announcing The Unicode® Standard, Version 15.1

                                                          Version 15.1 of the Unicode Standard is now available. This minor version update includes updated code charts, data files and annexes. The core specification is unchanged from Unicode Version 15.0. This version adds 627 characters, bringing the total number of characters to 149,813. The additions include 622 CJK unified ideographs in a new block, CJK Unified Ideographs Extension I. These new ideog

                                                            Announcing The Unicode® Standard, Version 15.1
                                                          • 新しいemoji😄のアイデアを�Unicodeが募集中‼️🏃‍♀️💨💨💨�傾向を学んでみんな提案しよう💪

                                                            現在の私たちが何気なく使っている絵文字たち(😀🥺💦💕🏠💻🌊😈🐱💢…)って、実は誰でも提案📝📮することができて、「この絵文字はワシが作った👴」と言えるチャンス💪があることをご存知ですか❓🤔 このスライド📄では、Unicodeコンソーシアム🌏が2024年7月末🍉まで募集しているEmoji v17.0😁…

                                                              新しいemoji😄のアイデアを�Unicodeが募集中‼️🏃‍♀️💨💨💨�傾向を学んでみんな提案しよう💪
                                                            • ハート1個が教えてくれた 絵文字が世界のEmojiになったわけ:朝日新聞デジタル

                                                              ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

                                                                ハート1個が教えてくれた 絵文字が世界のEmojiになったわけ:朝日新聞デジタル
                                                              • SNSのアクセシブルな投稿について考える

                                                                アクセシブルな投稿 1 年ほど前に X では画像の投稿時に、代替テキストをつけられる機能がリリースされました。この機能によって、音声読み上げソフトを使用するユーザーは、よりアクセシブルなコンテンツを享受できるようになりました。[1] では、投稿者は代替テキストをつければアクセシビリティの高いコンテンツを提供したと言えるのでしょうか。 アクセシビリティについて語る記事では、コーディングや、UI/UX の文脈で語られることが多いように感じます。しかし、SNS などユーザー投稿型サービスにおいても、各ユーザー一人ひとりが意識して取り組むべきものであると思っています。 画像 先述の通り、X では画像の投稿時に、代替テキストをつけられます。画像の投稿の際は代替テキストをつけることを心がけましょう。 X のヘルプセンターでは良い画像の説明を作成する方法が紹介されています。 また、代替テキストがない場合

                                                                  SNSのアクセシブルな投稿について考える
                                                                • 自治体システム標準化の前にまず文字のキホンを理解せよ①|標準化どうしましょう(自治体システム標準化にちょっと関わってる)

                                                                  自治体システムに携わると、普通のエンジニアでは基本的に意識しないものを意識する必要がある。それは、文字である。 普段目にする新聞やテレビの字幕スーパー(テロップ)等は、2千数百字のいわゆる常用漢字しかキホン使わない。Windowsユーザーならお馴染みの、MS明朝。これを使うと、約1万数千字の漢字や非漢字(英数字やひらがなカタカナそして記号等)が扱える。これでキホン世の中うまく廻る。 ところが、自治体システムに携わるとそうはいかない。 戸籍制度のもと、太古の昔から手書きで管理されていた漢字たちを誤字脱字を含めシステムで表現しなければならない。そして、その戸籍と同じ文字を皆様おなじみ証明書の頂点たる住民票であらわす必要がある。 どうやらその法的根拠はないらしいが。。。(諸説あり) その戸籍の文字が、数十~百数十万字あるらしい。これをシステムで表現するのは実に難しい。 前置きが長くなりました。こ

                                                                    自治体システム標準化の前にまず文字のキホンを理解せよ①|標準化どうしましょう(自治体システム標準化にちょっと関わってる)
                                                                  • ビルマ語(ミャンマー語)をWindowsで~Unicode以前 | エヤワディ Blog

                                                                    2009/02/27IT, ビルマ語(ミャンマー語), ミャンマー絡み ユニコード(Unicode)とビルマ語の話を書こうと思ったら、Unicode以前の話も書かないとわかりづらいということで、前半と後半に分けることにした。前半は、Unicode以前、後半はUnicodeの話だ。もしかしたら私の無知や勘違いがあるかもしれないので、間違いがあったらご指摘を。 Windows95や98の時代は日本語Windowsでビルマ語を表記するのは大変だった。特に2階建て文字のような特殊文字を表示するのが難しかった。当時、文字は1バイト(8ビット)容量の中で扱われていた。8ビットだから256種類だ。256種のうち、前半はアスキー(ASCII)文字と言われる標準的なアルファべトと記号の範囲で、後半は各言語の独自の規格の部分になった。タイ語やアラビア語、日本語の半角カタカナなどがこの後半部に入れられた。なお、

                                                                      ビルマ語(ミャンマー語)をWindowsで~Unicode以前 | エヤワディ Blog
                                                                    • 賈 U+8CC8 Unicode文字 0g0.org

                                                                      Base64エンコード : 6LOI 「賈」に似ている意味の文字賵劉賴賶賂賅莾赉魯賀賝賏莱廴萱賔蘉賧賎黎「賈」に似ている形の文字責贊賃質貿賢買貴貫䩀貰賀賚賁貲貸貢貨婁嘼「賈」の文字を含む単語書賈良賈良賈は深く蔵して虚しきが如し斯里賈亞瓦德納普拉科提賈湖富商巨賈阿布賈餘勇可賈大賈善賈賈人羅賈瓦賈伯斯商賈斯里賈亞瓦德納普拉科特富商大賈賈家店賈禍大腹賈恩賈梅納賈第蟲病賈第蟲屬拉夫桑賈尼賈南德拉馬爾賈賈汪區賈第蟲艾哈邁迪內賈德內賈德賈夾威德賈の説明 漢字 賈 部首: 貝貝 + 6 画 総画: 13画13 異体字 : 贾(簡体字) 筆順 : ファイル:賈-bw.png 字源 会意、「襾(ふたの形、「覆」の上部)」+「貝(財貨)」で、財貨を蔵する商人。 意義 商人。 商取引。 日本語 発音(?) 音読み 呉音 : ク、ケ 漢音 ...[出典:Wiktionary] 賈(か)は、漢姓の一つ。中国、朝鮮な

                                                                      • u8ffa (迺) - GlyphWiki

                                                                        u8ffa (国際符号化文字集合・ユニコード統合漢字 U+8FFA「迺」) (@8)出典: フリーグリフデータベース『グリフウィキ(GlyphWiki)』

                                                                          u8ffa (迺) - GlyphWiki
                                                                        • 瀰 - 表意文字オーバーフローCJK (Mei4 nei4), Unicode番号: U+7030 📖 シンボルの意味を知る ✂ コピー & 📋 ペースト (◕‿◕) SYMBL

                                                                          表意文字オーバーフローCJK. cjk統合漢字. シンボル「表意文字オーバーフローCJK」は「cjk統合漢字」ブロックの「」サブブロックに含まれており、1993年にUnicodeバージョン1.1の一部として承認されました。

                                                                            瀰 - 表意文字オーバーフローCJK (Mei4 nei4), Unicode番号: U+7030 📖 シンボルの意味を知る ✂ コピー & 📋 ペースト (◕‿◕) SYMBL
                                                                          • 文字化けした迷惑メールを自動翻訳してみたら… | BrainDead World

                                                                            数多く届けられる迷惑メールの中で、最近、以下のように「文字化け」(正確には文字化けというより、訳のわからない日本語が示されている)で来るものがあります。 「Amaおピげzon」という企業からのお知らせということになっています。 何がどうなってこうなるのかわからないですが、ふと、「これ自動翻訳で英語にしたらどうなる?」と思い、Google で翻訳しましたら、何と、 「ある程度ちゃんとした英語になる」 のでした。 以下のように翻訳が示されました。 Thank you for using Amd●●●zon. There is something wrong with your account. I’m going to roll it out, and I’m going to roll it out. Yano, I’m going to put my personal account on

                                                                            • も - ひらがなレターモー, Unicode番号: U+3082 📖 シンボルの意味を知る ✂ コピー & 📋 ペースト (◕‿◕) SYMBL

                                                                              ひらがなレターモー. 平仮名. シンボル「ひらがなレターモー」は「平仮名」ブロックの「ひらがな」サブブロックに含まれており、1993年にUnicodeバージョン1.1の一部として承認されました。

                                                                                も - ひらがなレターモー, Unicode番号: U+3082 📖 シンボルの意味を知る ✂ コピー & 📋 ペースト (◕‿◕) SYMBL
                                                                              • データロード機能の概要 | Snowflake Documentation

                                                                                データロード機能の概要¶ このトピックでは、 COPY INTO <テーブル> コマンドを使用してファイルからSnowflakeテーブルにデータをロードするためにサポートされている機能のクイックリファレンスを提供します。 このトピックの内容:

                                                                                • ファイルの文字コードをMacのターミナルで確認する&変換する - Qiita

                                                                                  ここでunknown-8bitと出てきたのでドキッとしてしまいましたが、unknown-8bitはShift_JISのことだそうでホッと一安心。 文字コードを変換する 文字コードを変換するにはnkfコマンドを使います。 //未インストールの場合、Homebrewでnkfをインストール $ brew install nkf //ファイルをShift_JISに変換(上書き保存)する $ nkf -s --overwrite ファイル名 //ファイルをUTF-8に変換(上書き保存)する $ nkf -w --overwrite ファイル名 いろいろなcharset 上記のコマンドをテストしようとして適当にテキストファイルを作成したところ、コマンドはもちろんエディターの設定をいろいろ変えて保存してもfile --mimeでの出力結果がずっとus-asciiになってしまい、大いにハマりました。 原因

                                                                                    ファイルの文字コードをMacのターミナルで確認する&変換する - Qiita