[B! Unicode] rbyのブックマーク

rby id:rby

Unicodeに関するrbyのブックマーク (12)

how-can-i-determine-whether-console-out-has-been-redirected-to-a-file
rby 2018/08/09
.net

c#

console

UNICODE
リンク
Go 言語と Unicode 正規化
今回は少し目先を変えて「Unicode 正規化（normalization）」のお話。 2羽の「ペンギン」まず「ペンギン」という文字列を思い浮かべてみる。この文字列を Unicode のコードポイントで表すと以下のようになる。ペ：U+30DA ン：U+30F3 ギ：U+30AE ン：U+30F3 ところでペンギンの「ペ」と「ギ」は半濁点および濁点を含む。 Unicode は「ペ」と「ギ」をそれぞれ2つの要素に分解できる。ペ：U+30D8 + U+309A ン：U+30F3 ギ：U+30AD + U+3099 ン：U+30F3 U+309A および U+3099 はそれぞれ半濁点と濁点を表す「結合文字（combining character）」である。「ヘ」や「キ」のような「基底文字（base character）」に結合文字を1つ以上1 付加した文字を「合成列（composite
rby 2018/07/12
go

Unicode

正規化
リンク
絵文字の異体字セレクタを扱ひたい扱へない - c4se記：さっちゃんですよ☆
※ 忘備録程度の情報です。結論絵文字には U+FE0E／U+FE0F が異体字セレクタとして付くことがあります。Unicode の STANDARDIZED VARIANTS といふ仕様の一部です。気をつけませう。歴史 Unicode には異体字セレクタ (VARIATION SELECTOR) といふ規格がある。 cf. 異体字セレクタ https://ja.wikipedia.org/wiki/%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BF Unicode は文字の区別をする集合であり、字形 (グリフ) の区別はしないといふ方針で一応は定められてゐる。しかし「それは字形ではなく文字の違ひである、Unicode は実用に耐えない」といふ主張は後を絶たなかった。そこで、文字の直後に数百種類の特殊な不可視コ
rby 2017/06/09
UNICODE
リンク
C#で、文字コードを表す文字列から、文字に変換する - Qiita
定数ではなく変数で扱いたい場合に若干調べるのに時間がかかったのでメモ。 "304C" -> "が" のように、 Unicode文字コードを表す文字列から文字に変換したい場合、 Convert クラスを使用します。 string charCode = "304C"; int charCode16 = Convert.ToInt32(charCode,16); // 16進数文字列 -> 数値 char c = Convert.ToChar(charCode16); // 数値(文字コード) -> 文字 string newChar = c.ToString(); // "が" という「文字列」
rby 2017/03/14
C#

文字コード

Unicode
リンク
[SDK32] C ランタイム関数の Win32 で対応する関数一覧
すべての Microsoft 製品 Microsoft 365 Office Windows Surface Xbox セールサポートソフトウェア Windows アプリ OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入するアクセサリ VR & 複合現実エンタメ Xbox Game Pass Ultimate Xbox Live Gold Xbox とゲーム PC ゲーム Windows ゲーム映画とテレビ番組法人向け Microsoft Azure Microsoft Dynamics 365 Microsoft 365 Microsoft Industry データプラットフォーム Power Platform 法人向けを購入する Developer & IT .NET Visual Studi
rby 2013/07/01
C

WindowsAPI

programming

UNICODE
リンク
Visual C++雑多メモー TCHAR編
Visual C++は、ワイド文字（Unicode）／マルチバイト文字のプログラムコードを、デファイン_UNICODEおよびUNICODEの制御だけで切り替えられるようにする仕掛け（本記事ではTCHARと呼称）を用意しています。Windows のAPIやVisual C++の標準ライブラリはほとんどがこのTCHARの仕掛けを使っています。ところが、アプリケーションコードでTCHARの仕掛けを使う場合に、どのようにプログラミングすればよいか、情報がまとまっていません。そこで、自分でプログラミングをしていて引っかかったり調べたことなどを雑多メモとして残すことにしました。 TCHARを使うと、標準C++プログラミングとは相性が悪いです。Visual C++というのはC++言語の亜種で、Windowsアプリケーション開発用言語として認識しておくのが吉。概要 TCHARの仕掛けを使う場合、コンパ
rby 2013/06/18
win32

windows

programming

C++

UNICODE

TCHAR
リンク
#define UNICODE と #define _UNICODE の違い
[戻る] momo 2007/11/02(金) 04:23:49 #define UNICODE #define _UNICODE ときどきこういう風に二つ重ねて書いてあるコードを見かけますが、#define UNICODE と #define _UNICODE ってどうちがうんですか？どちらもTEXT("")マクロを展開するという点で同じだと思うんですが wood 2007/11/02(金) 04:48:53 アンダースコア付きのものは互換のためのものと解釈しております言語仕様が上位に行くに従い、いずれなくなるかも知れないものと思ってますＵＴＦも８と１６とが存在しますよね、詳しく調べてませんが、そのような、扱えるコード範囲の互換のものではないでしょうか？ＭＳＤＮ等を見ないでの回答ですので間違いでしたらすみません YuO [E-Mail] 2007/11/02(金) 05:34
rby 2013/06/18
TCHAR

UNICODE

windows

win32

programming
リンク
その14 UNICODEで分けないtstring型を宣言する
ホーム < ゲームつくろー！ < Programming TIPs編その14 UNICODEで分けないtstring型を宣言する Visual C++には文字セットとしてUnicode対応版とマルチバイト文字列対応版があります。これはプロジェクトのプロパティの構成プロパティにある「文字セット」で設定できます。 Unicode文字セットの場合2バイト文字を扱う事になります。型は通常wchar_t型です。一方マルチバイト文字セットは1バイト文字を扱うので方はchar型です。プログラマはプロジェクトの文字セットごとにこれを使い分ける必要があります。これは極めて面倒です。そこでVisual C++にはTCHAR型が用意されています。TCHAR型自体は次のように定義されています：
rby 2013/06/18
C++

TCHAR

UNICODE

programming

win32
リンク
ICU - International Components for Unicode
2024-04-17: ICU 75 is now available. It updates to CLDR 45 (beta blog) locale data with new locales and various additions and corrections. C++ code now requires C++17 and is being made more robust. The CLDR MessageFormat 2.0 specification is now in techno logy preview, together with a corresponding update of the ICU4J (Java) tech preview and a new ICU4C (C++) tech preview. See Downloading ICU > ICU
rby 2011/08/08
software

UNICODE

文字コード

library
リンク
UTF-8ファイル名対応版 Git for Windows
お知らせ ('12/4/10) 「msysGit」「Git for Windows」v1.7.10が公開、UTF-8のファイル名に対応('12/4/10 窓の杜) ようやく本家 Git for Windows が UTF-8ファイル名に対応しました。このページで公開していた UTF-8 ファイル名対応 Git for Windows はこれでお役御免となります。一応、資料としてページはここに残しておきますが、今後は本家 Git for Windows をお使いください。なお、本家にはここで公開しているパッチは取り込まれていません。本家のパッチは Karsteen Blees 氏によるものです。やっている内容はここに記載した方針と少し違い、POSIX API レベルで差し替えるのではなく、mingw.c 内にある ANSI API 呼び出しを Unicode API に変更しているようで
rby 2010/07/28
git

UNICODE

windows

日本語
リンク
WindowsプログラミングでのTCHARの扱い方(UsefullCode.net)
UsefullCode.net Visual Studio 2005/2008/2010やandroid SDK/NDKでの開発者向けに便利なソースコードを提供 This site provide you with useful source codes under 'USEFULLCODE license'. TCHARでは代入などの際に " " ではなく、_T(" ") を利用していることに注意。変数の宣言時に文字列を指定することもできる。 //////////////////////////////// //初期文字列代入 // TCHAR pszSrc[] = {_T("abcdあいう")}; 文字数の取得にstrlenは利用できない。_tcslenを利用する。 //////////////////////////////// //文字数取得 // size_t nLen1 =
rby 2010/03/16
win32

Windows

Programming

まとめ

UNICODE

TCHAR
リンク
[AKUMA NO PROGRAMING TECHNIC FOR SDK]
rby 2010/03/16
win32

Windows

Programming

まとめ

UNICODE

TCHAR
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx