[9ページ] charsetの人気記事 429件 - はてなブックマーク

321 - 360 件 / 429件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

charsetの検索結果321 - 360 件 / 429件

Windows のコンソール端末と Unicode の相性
- 6 users
- number-shot.net
- テクノロジー
- 2020/01/01
MacType が効いている MSYS2 の mintty は、雪だるまと令和合字の字送りの幅が半角扱いなことを除けば、概ね合格です。サロゲートペアを扱えないのは、マルチバイトの文字コードを扱えない、シングルバイト圏のソフトウェアのような話です。 FontLinkレジストリの FontLink で欧文フォント等に和文フォント結び付けていると、意図しない形で FontLink と異なるフォントになることがあります。メモ帳で先ほど同様に試してみると、次のように。どうやらコードポイントによって、FontLink のフォントでなく、システムの他のフォントで描画されてしまうようです。 ☃ U+2603 が Segoe UI Emoji𠮟 U+20B9F や𠮷 U+20BB7 が游明朝しかも、混入した游明朝の文字は、なぜか一回り大きな文字サイズです。標準の Segoe UI や Tah
- windows
PHPカンファレンスの過去14+3回の登壇を振り返る - Qiita
- 6 users
- qiita.com/ockeghem
- テクノロジー
- 2023/12/18
PHP Advent Calendar 2023の18日目の記事です。 PHPカンファレンスに登壇した記録を書きたいと思います。数えてみますと、2009年から昨年（2022年）までのPHPカンファレンス14回と、北海道2回、関西1回の合計17回登壇したことになります。最初の登壇は14年前ですので、私の考えも当時からは変化していますので、そのあたりも触れながら紹介していきたいと思います。 PHP カンファレンス 2009 最初の登壇は2009年のPHPカンファレンスでした。この年はビジネスデイとテックデイに分かれていまして、ビジネスデイで登壇依頼を頂きましたので、当時温めていた「ウェブサイトを発注する際のセキュリティ」についてお話しました。スライドの中で「脅威分析やってもあまり意味ない」みたいな物騒な意見が書いてあります。当時はそのように考えていたわけですが、これは当時のサイトがECサイ
- php
- セキュリティ
「Unicode 15.0」が公開～新しい絵文字20種を含む4,489の新たな文字が追加／「Noto Emoji」や「Last Resort Font」もさっそく対応
- 6 users
- forest.watch.impress.co.jp
- テクノロジー
- 2022/09/16
- Unicode
念のためもう一度トルコ語（等）で起こる問題について整理する - Qiita
- 6 users
- qiita.com/hatano
- テクノロジー
- 2020/12/07
Qiita Advent Calendar 2020のJava Advent Calendarの12月7日のエントリです。12月9日付けで追記と内容修正あります。トルコ語問題については、ご存知の方はご存知だと思いますが、聞いたことがない人にはなかなか理解できない問題なので2020年の今、もう一回おさらいしておくのもいいかと思い書いています。（ほかにネタがなかった、とも言う。）トルコ語の何が特殊なのかトルコ語（とアゼルバイジャン語）には、dotted-iとdotless-iの二つのアルファベットがあります。通常私たちは「i」の大文字が「I」であり、「I」の小文字が「i」であると理解しています。しかし、トルコ語ロケール（とアゼルバイジャン語ロケール）では「I」はドットなしIであるとみなされ、その小文字は「ı」になります。逆に「i」の大文字はドットありの「İ」なのです。このため、以下の
Go言語のorderedmapパッケージを改善した - プログラムモグモグ
- 6 users
- itchyny.hatenablog.com
- テクノロジー
- 2021/01/20
Go言語で書かれたorderedmapというサードパーティパッケージがあります。 github.com Goのmapには順序がなく、JSONをデコードすると順序が失われ、それをエンコードするとオブジェクトのキーの順序にソートされます。これに困る人はそこそこいるようで、順序を保持するmapはいくつか実装されてきました。その中の一つが、orderedmapというパッケージです。シンプルなインターフェイスが気に入っています。 orderedmapパッケージの利用例 package main import ( "encoding/json" "fmt" "log" "github.com/iancoleman/orderedmap" ) func main() { src := `{ "z": 1, "x": 2, "y": 3 }` fmt.Println("# map[string]in
- design
- あとで読む
「多様な肌色の絵文字」を開発した黒人女性はそのアイデアをアップルに盗まれた | アップルは外部のアプリ開発者に不利な条件を課し、利益を巻き上げる
- 5 users
- courrier.jp
- テクノロジー
- 2021/04/12
スマートフォンなどの絵文字では、多様な人種を表すために肌の色が変えられるようになっている。このアイデアを初めに形にし、推進したのはあるアメリカの黒人女性だったが、アップルにアイデアを盗まれ、彼女は充分な対価を得られなかった。そのため、著作権侵害でアップルを起訴し、現在裁判が進行しているという。インクルーシブなアプリのアイデアカトリーナ・パロットには、それは夢のようなことだった。自分の考案したアプリのプレゼンテーションをするため、カリフォルニア州クパチーノのアップル本社に招かれたのだ。テキサス州のNASAに解雇されて1年も経たたない今、自分が先駆けて開発した「肌の色を選べる絵文字」について、あのiPhoneメーカーと事業提携の話し合いをするのだ。
UnicodeとUTF-8の違い。UTF-8・UTF-16・UTF-32とは
- 5 users
- elite-lane.com
- 世の中
- 2019/10/14
インターネットが世界中で普及している現代では、世界中のコンピュータが相互にデータを授受できるように、文字コードの統一が必須です。そこで，考案されたのがUnicode（ユニコード）と呼ばれるコード体系です。 UnicodeはISO（国際標準化機構）規格となり、国際的に認められています。文字コードに関する記事はこちら文字コードとは？コンピュータの文字コードの種類私たち人間は、数字（10進数：0 〜 9）文字平仮名（あ〜ん）片仮名（ア〜ン）漢字アルファベット（A ~ Z）音色等々を認識出来ますが、コンピュータは数字（10進...
Ultimate Unicode Input Device
- 5 users
- hackaday.io
- テクノロジー
- 2022/07/04
Just one more thing To make the experience fit your profile, pick a username and tell us what interests you.
- neta
第4回　神話と楔形文字と、ときどきUnicode | gihyo.jp
- 5 users
- gihyo.jp
- テクノロジー
- 2022/04/22
【話し手】ゆー（Yu）楔形文字検索ツールqantuppi、クルヌギアを開発。技術同人誌『楔形文字とユニコードの出会いにまつわるエトセトラ』で技術書典「第3回刺され！技術書アワード」エポックメイキング部門受賞。家にねこがいます。 GitHub：uyumyuuy Twitter：@uyum 本コーナーでは技術へのタッチポイントを増やすことを目標に、各分野で活躍されている方をお迎えします。今回のテーマは文字コードです。楔形文字（くさびがたもじ）に詳しくなってしまったゆーさんに古代文字の符号化の議論、Unicodeが世界のすべての文字を収録する意義を技術と文化の両面から紹介いただきます。楔形文字との出会い日高：Unicodeをはじめとした文字コードって普段は意識しない領域だと感じています。いろいろ教えてもらいながら話せればと考えています。ゆー：よろしくお願いします。私もこの分野を専門に
文字コード is なに？ What is a character code?
- 5 users
- speakerdeck.com/tomuro
- テクノロジー
- 2019/08/09
共創のための地域基盤としての非公式組織の形成 / Informal community as an infrastructure for co-creation
文字情報基盤検索システム
- 5 users
- moji.or.jp
- テクノロジー
- 2021/04/11
本検索システムはMJ文字情報一覧表 Ver.006.01に基づいています。 Internet Explorerでは動作しません。本検索システムでは文字関連グラフの提供予定はありません。本検索システムは現状有姿でご利用下さい。
- character
- search
- 日本語
- service
GitHub - qntm/base2048: Binary encoding optimised for Twitter
- 5 users
- github.com/qntm
- テクノロジー
- 2020/09/22
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- Twitter
- ネタ
CyberChef 超入門 (例題付き) - 午前７時のしなもんぶろぐ
- 5 users
- am7cinnamon.hatenablog.com
- テクノロジー
- 2021/02/13
お久しぶりです。しなもんです。今回は最近日本でもファンを増やしている便利ツール、"CyberChef" をご紹介します。 CyberChef とは？豊富な機能使い始めるのが簡単直感的に操作可能処理を繋げて表現できるブラウザだけで機能する隔離された環境でも使える Recipe をセーブ／ロードできる処理速度が微妙・大きなファイルが苦手初めての CyberChef：〇〇などない例題1：Coin Challenge! 例題2：Et tu, Brute? 例題3：dots&dushes 例題4：reversible hash 例題5：X-channel light rays 応用編：Emotet ダウンローダからの通信先の抽出重要な注意点前提解析！まとめ参考資料 CyberChef とは？ CyberChef (サイバーシェフ) とは、英国政府通信本部 (GCHQ)
Unicopedia Plus - ユニコードや絵文字を調べる開発者用ツール
- 5 users
- www.moongift.jp
- テクノロジー
- 2019/09/07
絵文字の登場によってユニコードが幅広く使われるようになりました。合字によって、肌の色を変えたり、年々絵文字の種類が増えています。また、アジア圏の文字では似ていても微妙に違う文字もあります。そんなユニコードの文字をチェックしたり、調べられるのがUnicopedia Plusです。 Unicopedia Plusの使い方同じ字に見えますが、日本語や中国語（簡体字、繁体字など）によって微妙に違うのが分かります。十二支を並べたところ。これも違うのが分かります。絵文字を調べる機能も。一覧での確認。より詳細に絵文字を調べる機能。 Unicopedia Plusを使うことで、どの絵文字がどの段階から利用できるのか、各文字の違いなどを細かくトラッキングできます。ユニコードを開発者の視点から調べる際に役立つことでしょう。 Unicopedia PlusはElectron/JavaScript製の
- unicode
Encodeモジュール - 日本語などのマルチバイト文字列を適切に処理する - Perlゼミ|Perlの基礎をインストールからサンプルで丁寧に解説
- 5 users
- perlzemi.com
- テクノロジー
- 2019/11/27
日本語などのマルチバイト文字をPerlで適切に扱うにはEncodeモジュールを使用します。次の3つのことを覚えておけば多くの場合適切に日本語を扱うことができます。外部から入力された文字列はEncodeモジュールのdecode関数でデコードする外部へ出力する文字列はEncodeモジュールのencode関数でエンコードするソースコードはUTF-8で保存しutf8プラグマを有効にするこの解説での用語この解説では外部から入力された文字列のことを「バイト文字列」と呼ぶことにします。Perlの内部表現に変換された文字列を「内部文字列」と呼ぶことにします。また「バイト文字列」が特定の文字コードで記述されている場合は「UTF-8バイト文字列」「Shift_JISバイト文字列」などと呼ぶことにします。プログラミングで日本語を扱う場合にその文字列がバイト文字列であるのか内部文字列であるのかを明確に
- 日本語
- perl
SQLServer日本語コードの確認方法 - Qiita
- 5 users
- qiita.com/makoto8048
- テクノロジー
- 2020/02/01
SQLServerに作成したデータベースの文字コード（コードページ）が何なのか実機から調べた際の方法を紹介します。環境 SQL Server 2014 対象のデータ型今回調査対象としたのは、文字列型のデータ型であるchar（varchar）、nchar（nvarchar）で定義された列とします。文字コードの設定箇所 SQLServerには文字列の区別、ソート順を決定する照合順序という定義がありますが、文字コードはそれと同一箇所で設定します。設定する箇所は以下となります。１．サーバに設定（SQLServerインストール時に指定）２．データベースに設定（CREATE DATABASE句で指定）３．テーブルに設定（CREATE TABLE句で指定）４．列に設定（CREATE TABLE句で指定）優先順位列に定義　＞　テーブルに定義　＞　データベースに定義　＞　サーバに定義と
Grapheme Clusters and Terminal Emulators
- 5 users
- mitchellh.com
- テクノロジー
- 2023/10/03
Copy and paste "🧑‍🌾" in your terminal emulator. How many cells forward did your cursor move? Depending on your terminal emulator, it may have moved 2, 4, 5, or 6 cells1. Yikes. This blog post describes why this happens and how terminal emulator and program authors can achieve consistent spacing for all characters. Character Grids, Historically Terminals operate on a grid of fixed size cells. Thi
エジプト・ヒエログリフ Egyptian Hieroglyphsの文字一覧 - 1 Unicode U+13000～U+133FF(77825文字目～78848文字目) (ユニコード) 0g0.org
- 5 users
- 0g0.org
- テクノロジー
- 2019/10/15
エジプト・ヒエログリフ Egyptian Hieroglyphsの文字一覧 - 1 Unicode U+13000～U+133FF(77825文字目～78848文字目)
Unicode絵文字の仕組みをみてみる
- 5 users
- zenn.dev/mierune
- テクノロジー
- 2023/05/26
Unicode絵文字で使われている仕組み、特に、複数の文字を組み合わせて1つの絵文字を組み立てる「Emoji Sequences」のことは意外と知られていないかもしれません。Unicode絵文字がどのように成り立っているか、ひととおり大雑把に紹介してみます。例えば： ❤️‍🔥 (heart on fire) ← ❤️ + ZWJ + 🔥 ❤️‍🩹 (mending heart) ← ❤️ + ZWJ + 🩹 🏳️‍⚧️ (transgender flag) ← 🏳️ + ZWJ + ⚧️ 🏳️‍🌈 (rainbow flag) ← 🏳️ + ZWJ + 🌈 🏴‍☠️ (pirate flag) ← 🏴 + ZWJ + ☠️ 🐕‍🦺 (service dog) ← 🐕 + ZWJ + 🦺 🐈‍⬛ (black cat) ← 🐈 + ZWJ + ⬛ 🐦‍
- Unicode
文字エンコードを指定してファイルを開く
- 5 users
- www.javadrive.jp
- テクノロジー
- 2021/07/23
Visual Studio Code ではファイルの文字エンコードとして UTF-8 がデフォルトで設定されています。その為、 Shift_JIS など UTF-8 以外の文字エンコードで保存されたファイルを開くと文字化けして表示されます。ここでは Visual Studio Code で文字エンコードを指定してファイルを開く方法について解説します。文字エンコードを指定してファイルを開きなおす Visual Studio Code ではデフォルトで文字エンコードとして UTF-8 を使用します。その為、文字エンコードとして UTF-8 を使用して保存されたファイルを開いた場合は問題なく表示されます。それに対して例えば文字エンコードとして Shift_JIS を使用して保存されたファイルを開いた場合、文字化けが発生します。 UTF-8 以外の文字エンコードで保存されたファイルを開くには、
- VSCode
- 設定
[Unicode]スペース以外の見えない空白文字の一覧 | 404 motivation not found
- 5 users
- tech-blog.s-yoshiki.com
- テクノロジー
- 2023/08/10
目次はじめにスペースや全角スペースのような空白文字一覧参考にしたサイトはじめにスペースや全角スペース以外にもいくつか存在する目に見えない Unicode の文字の一覧です。スペースや全角スペースのような空白文字一覧ブラウザや環境によっては表示されない場合があると思います。 Unicode 実体説明 description
- 文字コード
- プログラミング
エチオピアでモチモチした文字が発見されて「X」（Twitter）でちょっと話題に／「オフチョベットしたテフをマブガッドしてリットにする様子」の元ネタもこの言語【やじうまの杜】
- 5 users
- forest.watch.impress.co.jp
- テクノロジー
- 2024/03/21
文字情報基盤整備事業 | 一般社団法人文字情報技術促進協議会
- 5 users
- moji.or.jp
- テクノロジー
- 2021/01/07
文字情報基盤整備事業は、平成２２年度電子経済産業省推進費（文字情報基盤構築に関する研究開発事業）によりスタートした、行政で用いられる人名漢字等約6万文字の漢字を整備するプロジェクトです。令和２年８月に一般社団法人文字情報技術促進協議会に信託譲渡されました。詳しくはこちらから。
- 日本語
絵文字をスクリーンリーダーに読み上げさせてみた | アクセシビリティBlog | ミツエーリンクス
- 5 users
- www.mitsue.co.jp
- テクノロジー
- 2020/05/25
以前に同僚と少し絵文字に関する話をしていたこともあり、ふと、絵文字はスクリーンリーダーでどう読み上げられるのかということが気になって、ごく簡単に読み上げさせてみましたという話です。筆者の自宅の環境がWindowsとAndroidであることから、読み上げのテストにあたっては、NVDA、Windowsのナレーター、TalkBackで試してみました。以下にテスト環境を記しておきます。ブラウザーによる違いは見られなかったので、これについては省いています。 Windows バージョン 1909（OS ビルド 18363.836） NVDA 2020.1jp Android 10 TalkBack バージョン 8.2.0.303936097 以下が4つの絵文字について読み上げテストを実施した結果になります。言語については、lang属性を付与して読み上げさせました。笑顔を表す絵文字と各スクリーンリー
- emoji
- accessibility
- a11y
- Windows
- Android
SwiftUIで日本語テキストが不自然に改行される | DevelopersIO
- 5 users
- dev.classmethod.jp
- テクノロジー
- 2023/12/05
SwiftUIのTextビューで日本語を表示する際、意図しない箇所で改行が入ることがある。改行コードを使わずに改行位置を調整する方法を紹介する。日本語テキストが不自然に改行される SwiftUIのTextビューで日本語を表示する時、意図しない箇所で改行が入ることがある。たとえば「あなたに寄り添う究極のイノベーション」というフレーズが、「あなたに寄り添う\n究極のイノベーシ\nョン」と不自然に改行されることがある。例図では以下のように表示されている。あなたに寄り添う究極のイノベーションあなたの未来を形作る最上のガジェット英語圏で作られたWebサイトでの日本語の改行問題英語圏で作られた後に日本語に翻訳されたサイトの例では、「今すぐダウンロード」というフレーズが「今すぐダウンロー\nド」と表示されることがあった。日本人の感覚からするとこれには強い違和感がある。他にも禁則処理が
- iOS
- 日本語
U+301C from UTF-8 to Windows-31J (Encoding::UndefinedConversionError) に対応する - ESM アジャイル事業部開発者ブログ
- 5 users
- blog.agile.esm.co.jp
- テクノロジー
- 2022/03/13
こんにちは。ima1zumi です。私の開発している Rails アプリでは、Excel で読み込めるように文字コードを Windows-31J に変換して CSV を出力する機能があります。先日、CSV 出力にて Unicode の波ダッシュ〜を Windows-31J に変換しようとして Encoding::UndefinedConversionError が発生して CSV 出力に失敗したことがありました。なぜエラーになるのか、どうやって対応するのかをまとめました。まとめ encode メソッドの fallback オプションを使って未定義文字の変換先を定義することで変換できます。 str = "\u{2014 301C 2016 2212 00A2 00A3 00AC}" undefined_signs = { "\u2014" => "\x81\x5C".force_
- windows
Unicode IVS/IVDについて | 一般社団法人文字情報技術促進協議会
- 5 users
- moji.or.jp
- テクノロジー
- 2022/02/28
IVS(Ideographic Variation Sequence/Selector)は、文字符号としては同一視される漢字の、細かな字形の差異を特別に使い分けるための仕組みです。IVSは文字符号の国際規格であるISO/IEC 10646(2008年版以降)に規定されています。また、IVSと、それに対応する字形の一覧は、UnicodeコンソーシアムからIVD(Ideographic Variation Database)として公開されており、ISO/IEC 10646から正規の規格として参照されています。文字符号（文字コード）を定める日本工業規格のJIS X 0213(以下、JIS)やISO/IEC 10646 Universal Coded Character Set（以下、UCS）などでは、複数の字形に対して一つの共通な符号（コード）を与える場合があります（「同一の符号位置に複数の字
- 技術
「iOS 16.4」で新たに使えるようになった絵文字はこれだ！　Androidスマホに送ったらどうなる？
- 5 users
- k-tai.watch.impress.co.jp
- テクノロジー
- 2023/03/29
- Android
- ios
- food
GitHub - tc39/proposal-regexp-v-flag: UTS18 set notation in regular expressions
- 5 users
- github.com/tc39
- テクノロジー
- 2021/05/12
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- javascript
Office アシスタント「クリッパー」が絵文字として復活へ | スラド idle
- 4 users
- idle.srad.jp
- テクノロジー
- 2021/07/17
Office アシスタントの「クリッパー」が Microsoft 365 の絵文字として復活することになったようだ(Microsoft のツイート、 The Verge の記事、 The Next Web の記事、 On MSFT の記事)。クリッパー (英: Clippy) はゼムクリップに目玉を付けたような外見で、かつて Microsoft Office 英語版デフォルトの Office アシスタントだった。最も嫌われた Microsoft のキャラクターといわれる一方で、たびたび復活を遂げてきた。今回は Microsoft 公式 Twitter アカウントがクリッパーの画像を投稿し、「いいね」が 2 万件を超えたら Microsoft 365 のクリップの絵文字をクリッパーに置き換えると宣言。設定値が低すぎる気もするが、投稿から 2 時間 15分後には既に 3 万件を超えていたとい
- ソフトウェア
- microsoft
- pc
- 歴史
- ネタ
libraries | suckless.org software that sucks less
- 4 users
- libs.suckless.org
- テクノロジー
- 2022/10/08
libgrapheme is an extremely simple freestanding C99 library providing utilities for properly handling strings according to the latest Unicode standard 15.0.0. It offers fully Unicode compliant grapheme cluster (i.e. user-perceived character) segmentation word segmentation sentence segmentation detection of permissible line break opportunities case detection (lower-, upper- and title-case) case con
Unicode正規化 - Qiita
- 4 users
- qiita.com/fury00812
- テクノロジー
- 2021/06/08
とは「ア」と「ｱ」, 「①」と「1」など等価な文字の表記を統一する操作. NLPで前処理としてよく使われる "Unicode正規化（ユニコードせいきか、英語: Unicode normalization）とは、等価な文字や文字の並びを統一的な内部表現に変換することでテキストの比較を容易にする、テキスト正規化処理の一種である。" - Wikipedia NFD, NFC, NFKD, NFKC 4種類の正規化形式が存在する. 「NFD (Normalization Form Canonical Decomposition)」「NFC (Normalization Form Canonical Composition)」「NFKD (Normalization Form Compatibility Decomposition)」「NFKC (Normalization Form Com
The GB 18030-2022 Standard
- 4 users
- ken-lunde.medium.com
- 政治と経済
- 2022/08/02
By Dr Ken Lunde A non-trivial amount of my professional life is spent tracking regional character set standards, with an extraordinarily strong focus on ones for East Asia. When a significant standard is published or updated, I take it upon myself to research what changed, in a practical sense, and to spread the word to the developer community. That is the purpose of this particular article. Histo
- 文字コード
- china
utf8とutf8mb4の違い【MySQL】
- 4 users
- penpen-dev.com
- テクノロジー
- 2021/09/05
（なぜ2種類あるのかはMySQLの歴史によるものらしいのですが、私はいまいち分かっていないので詳しく知りたい方はググってみてください･･。）保存できる文字の違いこれはつまり、UnicodeのコードポイントがU+FFFFを超える文字は、utf8では保存できないってことです。例えば崎（U+5D0E）←保存できる﨑（U+FA11）←保存できる 😀（U+1F600）←保存できない𩸽（U+29E3D）←保存できない ※ちなみにこの漢字はホッケと読みますみたいな感じ。絵文字などを保存したい場合はutf8mb4を使わないといけません。 MySQLのutf8はUTF-8ではないのでは･･？ UTF-8は「世界中の文字を1つの文字コードで表そうぜ！」な文字集合であるUnicodeを表すための文字符号化方式の1つなわけですが本来UTF-8は、1～4バイトで文字を表すルールです。なので、
- mysql
高速UTF-8バリデーションの世界 - Qiita
- 4 users
- qiita.com/saka1_p
- テクノロジー
- 2021/08/13
参照: http://www.unicode.org/versions/Unicode6.0.0/ch03.pdf の "Table 3-7. Well-Formed UTF-8 Byte Sequences" アルゴリズムを理解する上で重要なUTF-8の特徴について述べます。 1コードポイントは1-4バイトのシーケンスで表現される上位ニブル（1バイト8ビットのうち、上位4ビット）を確認することでシーケンスの情報が得られるそのバイトがシーケンス先頭バイトかどうかわかるもしそれがシーケンス先頭バイトだったなら、何バイトのシーケンスかわかる先頭でないバイトは基本的に0x80..0xBFの範囲が許容されているが、何箇所か例外があるのでそれもバリデーションしなければならない例外の箇所は表では太字で示した例えば、表を見て分かるように、先頭バイトが0xE0のとき2バイト目は0xA0..0x
- Unicode
PowerShell起動時、文字コードをUTF-8に変える方法 - Qiita
- 4 users
- qiita.com/s4i
- テクノロジー
- 2020/03/18
Goal ショートカット設定でPowerShell起動時に文字コードをUTF-8に変える。経緯プログラムをコンソールから実行した時、日本語が含まれていると文字化けが発生します。特にWindowsでは、UIの文字コードを UTF-8にするためには、システム全体の表示言語を英語にする必要があり、 UIは日本語、文字コードはShift-JIS (CP932、Windows-31J)を妥協して使っている方が多いと思います。プログラムをコンパイルして実行する前に、 chcp 65001を打ち込んで文字コードを変える儀式を繰り返すことは無駄だと気付いた時、即座にリンク先の中に下記の内容を記述しましょう。手順 PowerShellショートカットのプロパティを開く。リンク先を編集する。プロパティのOKボタンをクリックする。詳細説明 PowerShellのショートカットの場所を
- Windows
- tips
Ridiculously fast unicode (UTF-8) validation – Daniel Lemire's blog
- 4 users
- lemire.me
- テクノロジー
- 2020/10/21
One of the most common “data type” in programming is the text string. When programmers think of a string, they imagine that they are dealing with a list or an array of characters. It is often a “good enough” approximation, but reality is more complex. The characters must be encoded into bits in some way. Most strings on the Internet, including this blog post, are encoded using a standard called UT
なにやら文字コードについてMSが言ってるようなのでツッコミ入れておこうと思う｜JunTajima
- 4 users
- note.com/juntajima
- 暮らし
- 2020/03/04
ツッコミポイント・Windowsにおける外字ってそういうのを多用してるのはどうせお役所とかだろうからそっちに直接言ったらどうか・たかが外字持って行っただけでOSのハングアップやブルースクリーンって何だw どうせUnicodeのPUA使ってるだけだろう・Unicodeで文字が定義されてるかどうかとそいつが手元の環境で出せるかどうかは別問題だ。フォント入れろフォント・MacでShift_JISのファイル読めないんてことはないよ。cp932（JISX0208のMSによるオレオレ拡張）依存の丸数字が化けたりするけど・OneDriveのポンコツ実装をユーザーのせいにするなw ・お前のとこの「メモ帳」のデフォルト保存文字コードが長らくcp932だったからずっとShift_JISが残っているのだぜ・お前のとこの表計算ソフトでCSVをcp932決め打ちで開く挙動どうにかしろ・お前のとこの圧縮解
Hideyuki Tanaka on Twitter: "文字コードがUTF8になっただけでは一切対応が進まなかったアメリカ人の書くコードの多倍長文字対応が、絵文字が入った途端に全てのソフトが完璧に多倍長文字に対応されるようになったんで、なんだかんだでアメリカ人に多倍長文字を使う強力なモ… https://t.co/JTxQUjo8vY"
- 4 users
- twitter.com/tanakh
- テクノロジー
- 2020/07/26
文字コードがUTF8になっただけでは一切対応が進まなかったアメリカ人の書くコードの多倍長文字対応が、絵文字が入った途端に全てのソフトが完璧に多倍長文字に対応されるようになったんで、なんだかんだでアメリカ人に多倍長文字を使う強力なモ… https://t.co/JTxQUjo8vY
- 文字
- font
- 開発
全角1文字の情報量は何バイト? | スラド IT
- 4 users
- it.srad.jp
- テクノロジー
- 2022/06/28
Twitterで中学生の技術の問題の画像がアップされ、その問いの内容が物議を醸している（d-tasakiさんのツイート）。議論となっているのは次の問題で、