並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 429件

新着順 人気順

charsetの検索結果321 - 360 件 / 429件

  • Windows のコンソール端末と Unicode の相性

    MacType が効いている MSYS2 の mintty は、雪だるまと令和合字の字送りの幅が半角扱いなことを除けば、概ね合格です。 サロゲートペアを扱えないのは、マルチバイトの文字コードを扱えない、シングルバイト圏のソフトウェアのような話です。 FontLinkレジストリの FontLink で欧文フォント等に和文フォント結び付けていると、意図しない形で FontLink と異なるフォントになることがあります。メモ帳で先ほど同様に試してみると、次のように。 どうやらコードポイントによって、FontLink のフォントでなく、システムの他のフォントで描画されてしまうようです。 ☃ U+2603 が Segoe UI Emoji𠮟 U+20B9F や 𠮷 U+20BB7 が 游明朝しかも、混入した 游明朝 の文字は、なぜか一回り大きな文字サイズです。標準の Segoe UI や Tah

      Windows のコンソール端末と Unicode の相性
    • PHPカンファレンスの過去14+3回の登壇を振り返る - Qiita

      PHP Advent Calendar 2023の18日目の記事です。 PHPカンファレンスに登壇した記録を書きたいと思います。数えてみますと、2009年から昨年(2022年)までのPHPカンファレンス14回と、北海道2回、関西1回の合計17回登壇したことになります。 最初の登壇は14年前ですので、私の考えも当時からは変化していますので、そのあたりも触れながら紹介していきたいと思います。 PHP カンファレンス 2009 最初の登壇は2009年のPHPカンファレンスでした。この年はビジネスデイとテックデイに分かれていまして、ビジネスデイで登壇依頼を頂きましたので、当時温めていた「ウェブサイトを発注する際のセキュリティ」についてお話しました。 スライドの中で「脅威分析やってもあまり意味ない」みたいな物騒な意見が書いてあります。当時はそのように考えていたわけですが、これは当時のサイトがECサイ

        PHPカンファレンスの過去14+3回の登壇を振り返る - Qiita
      • 「Unicode 15.0」が公開 ~新しい絵文字20種を含む4,489の新たな文字が追加/「Noto Emoji」や「Last Resort Font」もさっそく対応

          「Unicode 15.0」が公開 ~新しい絵文字20種を含む4,489の新たな文字が追加/「Noto Emoji」や「Last Resort Font」もさっそく対応
        • 念のためもう一度トルコ語(等)で起こる問題について整理する - Qiita

          Qiita Advent Calendar 2020のJava Advent Calendarの12月7日のエントリです。12月9日付けで追記と内容修正あります。 トルコ語問題については、ご存知の方はご存知だと思いますが、聞いたことがない人にはなかなか理解できない問題なので2020年の今、もう一回おさらいしておくのもいいかと思い書いています。(ほかにネタがなかった、とも言う。) トルコ語の何が特殊なのか トルコ語(とアゼルバイジャン語)には、dotted-iとdotless-iの二つのアルファベットがあります。 通常私たちは「i」の大文字が「I」であり、「I」の小文字が「i」であると理解しています。しかし、トルコ語ロケール(とアゼルバイジャン語ロケール)では「I」はドットなしIであるとみなされ、その小文字は「ı」になります。逆に「i」の大文字はドットありの「İ」なのです。 このため、以下の

            念のためもう一度トルコ語(等)で起こる問題について整理する - Qiita
          • Go言語のorderedmapパッケージを改善した - プログラムモグモグ

            Go言語で書かれたorderedmapというサードパーティパッケージがあります。 github.com Goのmapには順序がなく、JSONをデコードすると順序が失われ、それをエンコードするとオブジェクトのキーの順序にソートされます。 これに困る人はそこそこいるようで、順序を保持するmapはいくつか実装されてきました。 その中の一つが、orderedmapというパッケージです。 シンプルなインターフェイスが気に入っています。 orderedmapパッケージの利用例 package main import ( "encoding/json" "fmt" "log" "github.com/iancoleman/orderedmap" ) func main() { src := `{ "z": 1, "x": 2, "y": 3 }` fmt.Println("# map[string]in

              Go言語のorderedmapパッケージを改善した - プログラムモグモグ
            • 「多様な肌色の絵文字」を開発した黒人女性はそのアイデアをアップルに盗まれた | アップルは外部のアプリ開発者に不利な条件を課し、利益を巻き上げる

              スマートフォンなどの絵文字では、多様な人種を表すために肌の色が変えられるようになっている。このアイデアを初めに形にし、推進したのはあるアメリカの黒人女性だったが、アップルにアイデアを盗まれ、彼女は充分な対価を得られなかった。そのため、著作権侵害でアップルを起訴し、現在裁判が進行しているという。 インクルーシブなアプリのアイデア カトリーナ・パロットには、それは夢のようなことだった。自分の考案したアプリのプレゼンテーションをするため、カリフォルニア州クパチーノのアップル本社に招かれたのだ。テキサス州のNASAに解雇されて1年も経たたない今、自分が先駆けて開発した「肌の色を選べる絵文字」について、あのiPhoneメーカーと事業提携の話し合いをするのだ。

                「多様な肌色の絵文字」を開発した黒人女性はそのアイデアをアップルに盗まれた | アップルは外部のアプリ開発者に不利な条件を課し、利益を巻き上げる
              • UnicodeとUTF-8の違い。UTF-8・UTF-16・UTF-32とは

                インターネットが世界中で普及している現代では、世界中のコンピュータが相互にデータを授受できるように、文字コードの統一が必須です。 そこで,考案されたのがUnicode(ユニコード)と呼ばれるコード体系です。 UnicodeはISO(国際標準化機構)規格となり、国際的に認められています。 文字コードに関する記事はこちら 文字コードとは?コンピュータの文字コードの種類 私たち人間は、 数字(10進数:0 〜 9) 文字 平仮名(あ 〜 ん) 片仮名(ア 〜 ン) 漢字 アルファベット(A ~ Z) 音 色 等々 を認識出来ますが、コンピュータは 数字(10進...

                  UnicodeとUTF-8の違い。UTF-8・UTF-16・UTF-32とは
                • Ultimate Unicode Input Device

                  Just one more thing To make the experience fit your profile, pick a username and tell us what interests you.

                    Ultimate Unicode Input Device
                  • 第4回 神話と楔形文字と、ときどきUnicode | gihyo.jp

                    【話し手】 ゆー(Yu)楔形文字検索ツールqantuppi、クルヌギアを開発。技術同人誌『楔形文字とユニコードの出会いにまつわるエトセトラ』で技術書典「第3回 刺され!技術書アワード」エポックメイキング部門受賞。家にねこがいます。 GitHub:uyumyuuy Twitter:@uyum 本コーナーでは技術へのタッチポイントを増やすことを目標に、各分野で活躍されている方をお迎えします。 今回のテーマは文字コードです。楔形文字(くさびがたもじ)に詳しくなってしまったゆーさんに古代文字の符号化の議論、Unicodeが世界のすべての文字を収録する意義を技術と文化の両面から紹介いただきます。 楔形文字との出会い 日高:Unicodeをはじめとした文字コードって普段は意識しない領域だと感じています。いろいろ教えてもらいながら話せればと考えています。 ゆー:よろしくお願いします。私もこの分野を専門に

                      第4回 神話と楔形文字と、ときどきUnicode | gihyo.jp
                    • 文字コード is なに? What is a character code?

                      共創のための地域基盤としての非公式組織の形成 / Informal community as an infrastructure for co-creation

                        文字コード is なに? What is a character code?
                      • 文字情報基盤検索システム

                        本検索システムはMJ文字情報一覧表 Ver.006.01に基づいています。 Internet Explorerでは動作しません。 本検索システムでは文字関連グラフの提供予定はありません。 本検索システムは現状有姿でご利用下さい。

                        • GitHub - qntm/base2048: Binary encoding optimised for Twitter

                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                            GitHub - qntm/base2048: Binary encoding optimised for Twitter
                          • CyberChef 超入門 (例題付き) - 午前7時のしなもんぶろぐ

                            お久しぶりです。しなもんです。 今回は最近日本でもファンを増やしている便利ツール、"CyberChef" をご紹介します。 CyberChef とは? 豊富な機能 使い始めるのが簡単 直感的に操作可能 処理を繋げて表現できる ブラウザだけで機能する 隔離された環境でも使える Recipe をセーブ/ロードできる 処理速度が微妙・大きなファイルが苦手 初めての CyberChef:〇〇などない 例題1:Coin Challenge! 例題2:Et tu, Brute? 例題3:dots&dushes 例題4:reversible hash 例題5:X-channel light rays 応用編:Emotet ダウンローダからの通信先の抽出 重要な注意点 前提 解析! まとめ 参考資料 CyberChef とは? CyberChef (サイバーシェフ) とは、英国政府通信本部 (GCHQ)

                              CyberChef 超入門 (例題付き) - 午前7時のしなもんぶろぐ
                            • Unicopedia Plus - ユニコードや絵文字を調べる開発者用ツール

                              絵文字の登場によってユニコードが幅広く使われるようになりました。合字によって、肌の色を変えたり、年々絵文字の種類が増えています。また、アジア圏の文字では似ていても微妙に違う文字もあります。 そんなユニコードの文字をチェックしたり、調べられるのがUnicopedia Plusです。 Unicopedia Plusの使い方 同じ字に見えますが、日本語や中国語(簡体字、繁体字など)によって微妙に違うのが分かります。 十二支を並べたところ。これも違うのが分かります。 絵文字を調べる機能も。 一覧での確認。 より詳細に絵文字を調べる機能。 Unicopedia Plusを使うことで、どの絵文字がどの段階から利用できるのか、各文字の違いなどを細かくトラッキングできます。ユニコードを開発者の視点から調べる際に役立つことでしょう。 Unicopedia PlusはElectron/JavaScript製の

                                Unicopedia Plus - ユニコードや絵文字を調べる開発者用ツール
                              • Encodeモジュール - 日本語などのマルチバイト文字列を適切に処理する - Perlゼミ|Perlの基礎をインストールからサンプルで丁寧に解説

                                日本語などのマルチバイト文字をPerlで適切に扱うにはEncodeモジュールを使用します。次の3つのことを覚えておけば多くの場合適切に日本語を扱うことができます。 外部から入力された文字列はEncodeモジュールのdecode関数でデコードする 外部へ出力する文字列はEncodeモジュールのencode関数でエンコードする ソースコードはUTF-8で保存しutf8プラグマを有効にする この解説での用語 この解説では外部から入力された文字列のことを「バイト文字列」と呼ぶことにします。Perlの内部表現に変換された文字列を「内部文字列」と呼ぶことにします。また「バイト文字列」が特定の文字コードで記述されている場合は「UTF-8バイト文字列」「Shift_JISバイト文字列」などと呼ぶことにします。 プログラミングで日本語を扱う場合にその文字列がバイト文字列であるのか内部文字列であるのかを明確に

                                  Encodeモジュール - 日本語などのマルチバイト文字列を適切に処理する - Perlゼミ|Perlの基礎をインストールからサンプルで丁寧に解説
                                • SQLServer日本語コードの確認方法 - Qiita

                                  SQLServerに作成したデータベースの文字コード(コードページ)が何なのか実機から調べた際の方法を紹介します。 環境 SQL Server 2014 対象のデータ型 今回調査対象としたのは、文字列型のデータ型であるchar(varchar)、nchar(nvarchar)で定義された列とします。 文字コードの設定箇所 SQLServerには文字列の区別、ソート順を決定する照合順序という定義がありますが、文字コードはそれと同一箇所で設定します。 設定する箇所は以下となります。 1.サーバに設定(SQLServerインストール時に指定) 2.データベースに設定(CREATE DATABASE句で指定) 3.テーブルに設定(CREATE TABLE句で指定) 4.列に設定(CREATE TABLE句で指定) 優先順位 列に定義 > テーブルに定義 > データベースに定義 > サーバに定義 と

                                    SQLServer日本語コードの確認方法 - Qiita
                                  • Grapheme Clusters and Terminal Emulators

                                    Copy and paste "🧑‍🌾" in your terminal emulator. How many cells forward did your cursor move? Depending on your terminal emulator, it may have moved 2, 4, 5, or 6 cells1. Yikes. This blog post describes why this happens and how terminal emulator and program authors can achieve consistent spacing for all characters. Character Grids, Historically Terminals operate on a grid of fixed size cells. Thi

                                    • エジプト・ヒエログリフ Egyptian Hieroglyphsの文字一覧 - 1 Unicode U+13000~U+133FF(77825文字目~78848文字目) (ユニコード) 0g0.org

                                      エジプト・ヒエログリフ Egyptian Hieroglyphsの文字一覧 - 1 Unicode U+13000~U+133FF(77825文字目~78848文字目)

                                      • Unicode絵文字の仕組みをみてみる

                                        Unicode絵文字で使われている仕組み、特に、複数の文字を組み合わせて1つの絵文字を組み立てる「Emoji Sequences」のことは意外と知られていないかもしれません。Unicode絵文字がどのように成り立っているか、ひととおり大雑把に紹介してみます。 例えば: ❤️‍🔥 (heart on fire) ← ❤️ + ZWJ + 🔥 ❤️‍🩹 (mending heart) ← ❤️ + ZWJ + 🩹 🏳️‍⚧️ (transgender flag) ← 🏳️ + ZWJ + ⚧️ 🏳️‍🌈 (rainbow flag) ← 🏳️ + ZWJ + 🌈 🏴‍☠️ (pirate flag) ← 🏴 + ZWJ + ☠️ 🐕‍🦺 (service dog) ← 🐕 + ZWJ + 🦺 🐈‍⬛ (black cat) ← 🐈 + ZWJ + ⬛ 🐦‍

                                          Unicode絵文字の仕組みをみてみる
                                        • 文字エンコードを指定してファイルを開く

                                          Visual Studio Code ではファイルの文字エンコードとして UTF-8 がデフォルトで設定されています。その為、 Shift_JIS など UTF-8 以外の文字エンコードで保存されたファイルを開くと文字化けして表示されます。ここでは Visual Studio Code で文字エンコードを指定してファイルを開く方法について解説します。 文字エンコードを指定してファイルを開きなおす Visual Studio Code ではデフォルトで文字エンコードとして UTF-8 を使用します。その為、文字エンコードとして UTF-8 を使用して保存されたファイルを開いた場合は問題なく表示されます。 それに対して例えば文字エンコードとして Shift_JIS を使用して保存されたファイルを開いた場合、文字化けが発生します。 UTF-8 以外の文字エンコードで保存されたファイルを開くには、

                                            文字エンコードを指定してファイルを開く
                                          • [Unicode]スペース以外の見えない空白文字の一覧 | 404 motivation not found

                                            目次 はじめにスペースや全角スペースのような空白文字一覧参考にしたサイトはじめに スペースや全角スペース以外にもいくつか存在する目に見えない Unicode の文字の一覧です。 スペースや全角スペースのような空白文字一覧 ブラウザや環境によっては表示されない場合があると思います。 Unicode 実体 説明 description

                                              [Unicode]スペース以外の見えない空白文字の一覧 | 404 motivation not found
                                            • エチオピアでモチモチした文字が発見されて「X」(Twitter)でちょっと話題に/「オフチョベットしたテフをマブガッドしてリットにする様子」の元ネタもこの言語【やじうまの杜】

                                                エチオピアでモチモチした文字が発見されて「X」(Twitter)でちょっと話題に/「オフチョベットしたテフをマブガッドしてリットにする様子」の元ネタもこの言語【やじうまの杜】
                                              • 文字情報基盤整備事業 | 一般社団法人 文字情報技術促進協議会

                                                文字情報基盤整備事業は、平成22年度電子経済産業省推進費(文字情報基盤構築に関する研究開発事業) によりスタートした、行政で用いられる人名漢字等約6万文字の漢字を整備するプロジェクトです。令和2年8月に一般社団法人 文字情報技術促進協議会に信託譲渡されました。詳しくはこちらから。

                                                • 絵文字をスクリーンリーダーに読み上げさせてみた | アクセシビリティBlog | ミツエーリンクス

                                                  以前に同僚と少し絵文字に関する話をしていたこともあり、ふと、絵文字はスクリーンリーダーでどう読み上げられるのかということが気になって、ごく簡単に読み上げさせてみましたという話です。 筆者の自宅の環境がWindowsとAndroidであることから、読み上げのテストにあたっては、NVDA、Windowsのナレーター、TalkBackで試してみました。以下にテスト環境を記しておきます。ブラウザーによる違いは見られなかったので、これについては省いています。 Windows バージョン 1909(OS ビルド 18363.836) NVDA 2020.1jp Android 10 TalkBack バージョン 8.2.0.303936097 以下が4つの絵文字について読み上げテストを実施した結果になります。言語については、lang属性を付与して読み上げさせました。 笑顔を表す絵文字と各スクリーンリー

                                                    絵文字をスクリーンリーダーに読み上げさせてみた | アクセシビリティBlog | ミツエーリンクス
                                                  • SwiftUIで日本語テキストが不自然に改行される | DevelopersIO

                                                    SwiftUIのTextビューで日本語を表示する際、意図しない箇所で改行が入ることがある。改行コードを使わずに改行位置を調整する方法を紹介する。 日本語テキストが不自然に改行される SwiftUIのTextビューで日本語を表示する時、意図しない箇所で改行が入ることがある。たとえば「あなたに寄り添う究極のイノベーション」というフレーズが、「あなたに寄り添う\n究極のイノベーシ\nョン」と不自然に改行されることがある。 例図では以下のように表示されている。 あなたに寄り添う 究極のイノベーシ ョン あなたの未来を形 作る最上のガジェ ット 英語圏で作られたWebサイトでの日本語の改行問題 英語圏で作られた後に日本語に翻訳されたサイトの例では、「今すぐダウンロード」というフレーズが「今すぐダウンロー\nド」と表示されることがあった。日本人の感覚からするとこれには強い違和感がある。他にも禁則処理が

                                                      SwiftUIで日本語テキストが不自然に改行される | DevelopersIO
                                                    • U+301C from UTF-8 to Windows-31J (Encoding::UndefinedConversionError) に対応する - ESM アジャイル事業部 開発者ブログ

                                                      こんにちは。ima1zumi です。 私の開発している Rails アプリでは、Excel で読み込めるように 文字コードを Windows-31J に変換して CSV を出力する機能があります。 先日、CSV 出力にて Unicode の波ダッシュ 〜 を Windows-31J に変換しようとして Encoding::UndefinedConversionError が発生して CSV 出力に失敗したことがありました。なぜエラーになるのか、どうやって対応するのかをまとめました。 まとめ encode メソッドの fallback オプションを使って未定義文字の変換先を定義することで変換できます。 str = "\u{2014 301C 2016 2212 00A2 00A3 00AC}" undefined_signs = { "\u2014" => "\x81\x5C".force_

                                                        U+301C from UTF-8 to Windows-31J (Encoding::UndefinedConversionError) に対応する - ESM アジャイル事業部 開発者ブログ
                                                      • Unicode IVS/IVDについて | 一般社団法人 文字情報技術促進協議会

                                                        IVS(Ideographic Variation Sequence/Selector)は、文字符号としては同一視される漢字の、細かな字形の差異を特別に使い分けるための仕組みです。IVSは文字符号の国際規格であるISO/IEC 10646(2008年版以降)に規定されています。また、IVSと、それに対応する字形の一覧は、UnicodeコンソーシアムからIVD(Ideographic Variation Database)として公開されており、ISO/IEC 10646から正規の規格として参照されています。 文字符号(文字コード)を定める日本工業規格のJIS X 0213(以下、JIS)やISO/IEC 10646 Universal Coded Character Set(以下、UCS)などでは、複数の字形に対して一つの共通な符号(コード)を与える場合があります(「同一の符号位置に複数の字

                                                        • 「iOS 16.4」で新たに使えるようになった絵文字はこれだ! Androidスマホに送ったらどうなる?

                                                            「iOS 16.4」で新たに使えるようになった絵文字はこれだ! Androidスマホに送ったらどうなる?
                                                          • GitHub - tc39/proposal-regexp-v-flag: UTS18 set notation in regular expressions

                                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                              GitHub - tc39/proposal-regexp-v-flag: UTS18 set notation in regular expressions
                                                            • Office アシスタント「クリッパー」が絵文字として復活へ | スラド idle

                                                              Office アシスタントの「クリッパー」が Microsoft 365 の絵文字として復活することになったようだ(Microsoft のツイート、 The Verge の記事、 The Next Web の記事、 On MSFT の記事)。 クリッパー (英: Clippy) はゼムクリップに目玉を付けたような外見で、かつて Microsoft Office 英語版デフォルトの Office アシスタントだった。最も嫌われた Microsoft のキャラクターといわれる一方で、たびたび復活を遂げてきた。今回は Microsoft 公式 Twitter アカウントがクリッパーの画像を投稿し、「いいね」が 2 万件を超えたら Microsoft 365 のクリップの絵文字をクリッパーに置き換えると宣言。設定値が低すぎる気もするが、投稿から 2 時間 15分後には既に 3 万件を超えていたとい

                                                              • libraries | suckless.org software that sucks less

                                                                libgrapheme is an extremely simple freestanding C99 library providing utilities for properly handling strings according to the latest Unicode standard 15.0.0. It offers fully Unicode compliant grapheme cluster (i.e. user-perceived character) segmentation word segmentation sentence segmentation detection of permissible line break opportunities case detection (lower-, upper- and title-case) case con

                                                                • Unicode正規化 - Qiita

                                                                  とは 「ア」と「ア」, 「①」と「1」など等価な文字の表記を統一する操作. NLPで前処理としてよく使われる "Unicode正規化(ユニコードせいきか、英語: Unicode normalization)とは、等価な文字や文字の並びを統一的な内部表現に変換することでテキストの比較を容易にする、テキスト正規化処理の一種である。" - Wikipedia NFD, NFC, NFKD, NFKC 4種類の正規化形式が存在する. 「NFD (Normalization Form Canonical Decomposition)」 「NFC (Normalization Form Canonical Composition)」 「NFKD (Normalization Form Compatibility Decomposition)」 「NFKC (Normalization Form Com

                                                                    Unicode正規化 - Qiita
                                                                  • The GB 18030-2022 Standard

                                                                    By Dr Ken Lunde A non-trivial amount of my professional life is spent tracking regional character set standards, with an extraordinarily strong focus on ones for East Asia. When a significant standard is published or updated, I take it upon myself to research what changed, in a practical sense, and to spread the word to the developer community. That is the purpose of this particular article. Histo

                                                                      The GB 18030-2022 Standard
                                                                    • utf8とutf8mb4の違い【MySQL】

                                                                      (なぜ2種類あるのかはMySQLの歴史によるものらしいのですが、私はいまいち分かっていないので詳しく知りたい方はググってみてください・・。) 保存できる文字の違い これはつまり、UnicodeのコードポイントがU+FFFFを超える文字は、utf8では保存できないってことです。 例えば 崎(U+5D0E)←保存できる 﨑(U+FA11)←保存できる 😀(U+1F600)←保存できない 𩸽(U+29E3D)←保存できない ※ちなみにこの漢字はホッケと読みます みたいな感じ。 絵文字などを保存したい場合はutf8mb4を使わないといけません。 MySQLのutf8はUTF-8ではないのでは・・? UTF-8は「世界中の文字を1つの文字コードで表そうぜ!」な文字集合であるUnicodeを表すための文字符号化方式の1つなわけですが 本来UTF-8は、1~4バイトで文字を表すルールです。 なので、

                                                                      • 高速UTF-8バリデーションの世界 - Qiita

                                                                        参照: http://www.unicode.org/versions/Unicode6.0.0/ch03.pdf の "Table 3-7. Well-Formed UTF-8 Byte Sequences" アルゴリズムを理解する上で重要なUTF-8の特徴について述べます。 1コードポイントは1-4バイトのシーケンスで表現される 上位ニブル(1バイト8ビットのうち、上位4ビット)を確認することでシーケンスの情報が得られる そのバイトがシーケンス先頭バイトかどうかわかる もしそれがシーケンス先頭バイトだったなら、何バイトのシーケンスかわかる 先頭でないバイトは基本的に0x80..0xBFの範囲が許容されているが、何箇所か例外があるのでそれもバリデーションしなければならない 例外の箇所は表では太字で示した 例えば、表を見て分かるように、先頭バイトが0xE0のとき2バイト目は0xA0..0x

                                                                          高速UTF-8バリデーションの世界 - Qiita
                                                                        • PowerShell起動時、文字コードをUTF-8に変える方法 - Qiita

                                                                          Goal ショートカット設定でPowerShell起動時に文字コードをUTF-8に変える。 経緯 プログラムをコンソールから実行した時、 日本語が含まれていると文字化けが 発生します。 特にWindowsでは、UIの文字コードを UTF-8にするためには、システム全体の 表示言語を英語にする必要があり、 UIは日本語、文字コードはShift-JIS (CP932、Windows-31J)を妥協して 使っている方が多いと思います。 プログラムをコンパイルして実行する前に、 chcp 65001を打ち込んで文字コードを 変える儀式を繰り返すことは無駄だと 気付いた時、即座にリンク先の中に 下記の内容を記述しましょう。 手順 PowerShellショートカットのプロパティを開く。 リンク先を編集する。 プロパティのOKボタンをクリックする。 詳細説明 PowerShellのショートカットの場所を

                                                                            PowerShell起動時、文字コードをUTF-8に変える方法 - Qiita
                                                                          • Ridiculously fast unicode (UTF-8) validation – Daniel Lemire's blog

                                                                            One of the most common “data type” in programming is the text string. When programmers think of a string, they imagine that they are dealing with a list or an array of characters. It is often a “good enough” approximation, but reality is more complex. The characters must be encoded into bits in some way. Most strings on the Internet, including this blog post, are encoded using a standard called UT

                                                                              Ridiculously fast unicode (UTF-8) validation – Daniel Lemire's blog
                                                                            • なにやら文字コードについてMSが言ってるようなのでツッコミ入れておこうと思う|JunTajima

                                                                              ツッコミポイント・Windowsにおける外字ってそういうのを多用してるのはどうせお役所とかだろうからそっちに直接言ったらどうか ・たかが外字持って行っただけでOSのハングアップやブルースクリーンって何だw どうせUnicodeのPUA使ってるだけだろう ・Unicodeで文字が定義されてるかどうかとそいつが手元の環境で出せるかどうかは別問題だ。フォント入れろフォント ・MacでShift_JISのファイル読めないんてことはないよ。cp932(JISX0208のMSによるオレオレ拡張)依存の丸数字が化けたりするけど ・OneDriveのポンコツ実装をユーザーのせいにするなw ・お前のとこの「メモ帳」のデフォルト保存文字コードが長らくcp932だったからずっとShift_JISが残っているのだぜ ・お前のとこの表計算ソフトでCSVをcp932決め打ちで開く挙動どうにかしろ ・お前のとこの圧縮解

                                                                                なにやら文字コードについてMSが言ってるようなのでツッコミ入れておこうと思う|JunTajima
                                                                              • Hideyuki Tanaka on Twitter: "文字コードがUTF8になっただけでは一切対応が進まなかったアメリカ人の書くコードの多倍長文字対応が、絵文字が入った途端に全てのソフトが完璧に多倍長文字に対応されるようになったんで、なんだかんだでアメリカ人に多倍長文字を使う強力なモ… https://t.co/JTxQUjo8vY"

                                                                                文字コードがUTF8になっただけでは一切対応が進まなかったアメリカ人の書くコードの多倍長文字対応が、絵文字が入った途端に全てのソフトが完璧に多倍長文字に対応されるようになったんで、なんだかんだでアメリカ人に多倍長文字を使う強力なモ… https://t.co/JTxQUjo8vY

                                                                                  Hideyuki Tanaka on Twitter: "文字コードがUTF8になっただけでは一切対応が進まなかったアメリカ人の書くコードの多倍長文字対応が、絵文字が入った途端に全てのソフトが完璧に多倍長文字に対応されるようになったんで、なんだかんだでアメリカ人に多倍長文字を使う強力なモ… https://t.co/JTxQUjo8vY"
                                                                                • 全角1文字の情報量は何バイト? | スラド IT

                                                                                  Twitterで中学生の技術の問題の画像がアップされ、その問いの内容が物議を醸している(d-tasakiさんのツイート)。議論となっているのは次の問題で、

                                                                                  新着記事