タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

文字コードに関するInoHiroのブックマーク (5)

  • 文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。

    「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ

    文字コード(UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP)についての俺的まとめ - 今日もスミマセン。
  • バイト型配列のデータを文字コードを指定して文字列に変換 .NET Tips C#, VB.NET, Visual Studio

    バイト型配列のデータを文字コードを指定して文字列に変換する 文字列を文字コードを指定してバイト型配列のデータに変換するバイト型配列を文字列に変換するバイト型配列に代入されている文字列データをString型に変換(デコード)するには、Encoding.GetStringメソッドを使います。具体的には、バイト型配列のデータの文字コードに従ってEncodingオブジェクトを作成し、GetStringメソッドを呼び出します。Encodingオブジェクトを作成する方法については、「目的の文字コードに合ったEncodingオブジェクトを取得する」をご覧ください。 下の例ではバイト型配列"bytesData"にすでに文字列データが入っているものとし、これをString型に変換しています。 'バイト型配列"bytesData"に文字列データが入っているものとする Dim str As String 'Sh

    バイト型配列のデータを文字コードを指定して文字列に変換 .NET Tips C#, VB.NET, Visual Studio
  • 文字コードを指定してテキストファイルに書き込む

    文字コードを指定してテキストファイルに書き込むここでは、テキストファイルに文字列を書き込む方法について説明します。 ストリームを使ってテキストファイルに書き込む最も基的な方法は、StreamWriterクラスのWriteメソッドを使う方法です。 早速ですが、以下に簡単な例を示します。この例ではテキストボックス"TextBox1"の内容をShift JISコードでテキストファイル"C:\test\1.txt"に書き込んでいます。 'Shift JISで書き込む '書き込むファイルが既に存在している場合は、上書きする Dim sw As New System.IO.StreamWriter("C:\test\1.txt", _ False, _ System.Text.Encoding.GetEncoding("shift_jis")) 'TextBox1.Textの内容を書き込む sw.W

    文字コードを指定してテキストファイルに書き込む
  • UTF-8.jp

    - WinMirror - 任意のアプリケーションのウィンドウやデスクトップをミラーリングして表示できます。 解説: オンサイトでの登壇で返しのモニターがなくてもデモをやりやすくするツールを作った - SSTエンジニアブログ - 音声字幕機能付きのWebカメラ - Web Audio APIを使ってマイク入力をスピーカーから出力 - LTタイマー - JavaScriptセキュリティの基礎知識:連載|gihyo.jp … 技術評論社 - HTML5時代の「新しいセキュリティ・エチケット」- @IT - 教科書に載らないWebアプリケーションセキュリティ - @IT - 連載:当は怖い文字コードの話|gihyo.jp … 技術評論社 - JSF*ck - encode JavaScript with only 6 letters - []()!+ (broken) JSF*ck demo

  • 第4回 UTF-8の冗長なエンコード | gihyo.jp

    今回は、文字コードに関連するセキュリティの話題では古参ともいえるUTF-8の冗長なエンコードというテーマについて紹介します。 UTF-8とは UTF-8は、各文字を1~4バイトの可変長で表現するUnicodeの符号化方式のひとつです。 U+0000からU+007Fの範囲の文字を0x00から0x7Fの1バイトで表現しているため、US-ASCIIと互換性がある、バイト列の途中からでも文字の先頭バイトを簡単に検出できる、多バイト文字の途中に0x00や0x5C(\⁠)⁠、0x2F(/)などが現れない、などの特徴があります。 UTF-8での文字のビットパターンは表1のようになります。 表1 UTF-8でのビットパターン

    第4回 UTF-8の冗長なエンコード | gihyo.jp
  • 1