タグ

文字コードに関するsoma1080のブックマーク (5)

  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
  • ActionScript3.0を極める | URLLoaderで取得したデータをutf-8にデコードする

    フィードがshift-jis, euc-jpの場合文字化けするとかはサーバ側で処理してるから、私は関係ないが AIRで開発で困ったので以下覚え書き readMultiByteで文字コードを指定→ Stringオブジェクトに変換 で対応できる #shift-jis → utf-8 var byteArray:ByteArray = event.target.data as ByteArray; var html:String = byteArray.readMultiByte(byteArray.length, "shift-jis"); #euc-jp → utf-8 var byteArray:ByteArray = event.target.data as ByteArray; var html:String = byteArray.readMultiB

    soma1080
    soma1080 2009/12/03
    ASにおける文字コードの変換
  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • 文字コードを判別する: .NET Tips: C#, VB.NET, Visual Studio

    文字コードを判別するバイト型配列を文字列に変換する方法は「バイト型配列のデータを文字コードを指定して文字列に変換する」で紹介しましたが、データの文字コードが分からなければ変換できません。ここでは、バイト型配列のデータから文字コードを判別する方法を紹介します。 .NET Frameworkでは、基的には、文字コードを判別する方法が用意されていませんので、外部DLL、OCX等を使うか、自分でコードを書くかということになります。 BOMで判断する方法BOM(バイトオーダーマーク、byte order mark)と呼ばれる「印」がデータの先頭に付いている時は、これを手掛かりに文字コードを判別することができます。 以下に、BOMから文字コード(UTF-8、UTF-16BE、UTF-16LE、UTF-32BE、UTF-32LE)を判別するメソッドの例を示します。 ''' <summary> '''

    文字コードを判別する: .NET Tips: C#, VB.NET, Visual Studio
  • UTF-8N形式でファイルを保存するには?

    まいろ 2007/02/21(水) 15:48:41 <219.121.49.27> ADODB.Stream.SaveToFileを使用してUTF-8形式で保存した場合、作成されたファイルの先頭にBOMが追加されてしまいます。 UTF-8N形式でファイルを保存する、または、UTF-8形式のファイルのBOMを除去するにはどうすればよいでしょうか? 次のページも拝見しましたが、ADODB.Streamオブジェクトを使用するような方法があれば幸いです。 http://www.geocities.co.jp/SilkRoad/4511/vb/utf8.htm 開発環境: Win XP(Pro) & VB6(SP6) Blue 2007/02/21(水) 16:21:37 <192.51.44.52> バイナリモードでBOM分スキップしたものを再度Writeすればどうでしょうか?

    soma1080
    soma1080 2009/07/08
    UTF-8からBOMを除去
  • 1