タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

文字コードに関するtomitake_flashのブックマーク (3)

  • UTF-8/UTF-16/UTF-32の違い - tanamonの稀に良く書く日記

    軽く調べてみた。 UTF-8 1文字は1byte〜6byteで表される。 (6byteで31bitまでの表現ができる) ASCIIは1byte ISO 8859-1以外のISO 8859の8bit文字は2byte 大抵の日語文字(半角カナ含む)は3byte 5〜6byteの文字は定義されていないし、する気もなさそう ISO 8859-1部分に互換性があるため、マルチバイト文字に対応していないような行儀の悪いプログラムでもそのまま動く。 BOMを付ける場合、BOMは3byteになる。 エンディアンに関係なくEF BB BF BOMは来要らないはずだけど、付いていることがある。 文字コードを自動判別する際にはBOMが無いと誤判別することが多いため、 出所不明の文書が飛び交う所では付けたほうがいいかもしれない。 BOM付きをUTF-8、なしを通称UTF-8N(正式名称ではない)という。 既に

    UTF-8/UTF-16/UTF-32の違い - tanamonの稀に良く書く日記
  • Eclipse入門:Eclipseの基本設定:文字コードの設定

    ソースファイルなどを作成した際にどの文字コードを使って作成するにかを指定します。 Eclipse起動後に「ウィンドウ」メニューの中の「設定」メニューをクリックして下さい。 「設定」画面が表示されます。左側項目リストの中の「一般」の中に含まれる「ワークスペース」をクリックして下さい。 「ワークスペース」に関する設定画面が表示されます。 「テキスト・ファイル・エンコード」と書かれた箇所で文字コードの設定が可能です。現在はデフォルトの文字コード(MS932)になっていますので変更したい場合には「その他」をチェックして頂いてからその右側のコンボボックスで文字コードを選択して下さい。 任意の文字コードを選択することが出来ます。なおWindows環境で開発している場合にはデフォルトの設定値である「MS032」のままにしておいて問題はありません。 以上です。

    tomitake_flash
    tomitake_flash 2009/10/07
    一覧にないときには使いたい文字コードを入力すればおk
  • 草なぎ剛くんについて重大なお知らせ - rna fragments

    大好きな草なぎ剛くんについてデマが流れているので…! fut573 メモ:『彅』弓+剪はJISにないので、windows以外の環境では正常に表示されない場合が多く、ネット上では使わない事を推奨されている文字の一つである。 へー 2009/04/23 はてなブックマーク - 草なぎ剛、公然わいせつ容疑で逮捕(サンケイスポーツ) - Yahoo!ニュース 「なぎ」の文字コードに関しては JIS コード(JIS X 0208)では外字になってしまいますが、Unicode では CJK 統合漢字に含まれるちゃんとした文字です。HTML や XML で使う場合は文字実体参照文字参照*1を使って彅(または 彅)のようにして表現できます。*2 表示に関しては今時の OS なら大抵大丈夫です。Mac OS X の標準フォントでも Linux で広く使われている IPA フォント

    草なぎ剛くんについて重大なお知らせ - rna fragments
  • 1