[B! 文字コード] soma1080のブックマーク

新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH（クロステック）

普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。　　　　　（日経コンピュータ） 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

soma1080 2009/12/11

文字コード

リンク

ActionScript3.0を極める | URLLoaderで取得したデータをutf-8にデコードする

フィードがshift-jis, euc-jpの場合文字化けするとかはサーバ側で処理してるから、私は関係ないが AIRで開発で困ったので以下覚え書き readMultiByteで文字コードを指定→　Stringオブジェクトに変換で対応できる #shift-jis → utf-8 var byteArray:ByteArray = event.target.data as　ByteArray; var html:String = byteArray.readMultiByte(byteArray.length, "shift-jis"); #euc-jp → utf-8 var byteArray:ByteArray = event.target.data as　ByteArray; var html:String = byteArray.readMultiB

soma1080 2009/12/03

ASにおける文字コードの変換

リンク

UnicodeとUTF-8の違いは？ - Humanity

という2chのスレがかなり勉強になったのでまとめ。少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合？)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記：簡単にまとめました。 1 ：デフォルトの名無しさん：2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 ：デフォルトの名無しさん：2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 ：デフォルトの名無しさん：2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 ：デフォルトの名無しさん：2007/04/

soma1080 2009/12/01

文字コード

リンク

文字コードを判別する: .NET Tips: C#, VB.NET, Visual Studio

文字コードを判別するバイト型配列を文字列に変換する方法は「バイト型配列のデータを文字コードを指定して文字列に変換する」で紹介しましたが、データの文字コードが分からなければ変換できません。ここでは、バイト型配列のデータから文字コードを判別する方法を紹介します。 .NET Frameworkでは、基本的には、文字コードを判別する方法が用意されていませんので、外部DLL、OCX等を使うか、自分でコードを書くかということになります。 BOMで判断する方法BOM（バイトオーダーマーク、byte order mark）と呼ばれる「印」がデータの先頭に付いている時は、これを手掛かりに文字コードを判別することができます。以下に、BOMから文字コード（UTF-8、UTF-16BE、UTF-16LE、UTF-32BE、UTF-32LE）を判別するメソッドの例を示します。 ''' <summary> '''

soma1080 2009/07/13

リンク

UTF-8N形式でファイルを保存するには？

まいろ 2007/02/21(水) 15:48:41 <219.121.49.27> ADODB.Stream.SaveToFileを使用してUTF-8形式で保存した場合、作成されたファイルの先頭にBOMが追加されてしまいます。 UTF-8N形式でファイルを保存する、または、UTF-8形式のファイルのBOMを除去するにはどうすればよいでしょうか？次のページも拝見しましたが、ADODB.Streamオブジェクトを使用するような方法があれば幸いです。 http://www.geocities.co.jp/SilkRoad/4511/vb/utf8.htm 開発環境: Win XP(Pro) & VB6(SP6) Blue 2007/02/21(水) 16:21:37 <192.51.44.52> バイナリモードでBOM分スキップしたものを再度Writeすればどうでしょうか？

soma1080 2009/07/08

UTF-8からBOMを除去

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

文字コードに関するsoma1080のブックマーク (5)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス