[B! 文字コード] tomitake_flashのブックマーク

tomitake_flash id:tomitake_flash

文字コードに関するtomitake_flashのブックマーク (3)

UTF-8/UTF-16/UTF-32の違い - tanamonの稀に良く書く日記
軽く調べてみた。 UTF-8 1文字は1byte〜6byteで表される。（6byteで31bitまでの表現ができる） ASCIIは1byte ISO 8859-1以外のISO 8859の8bit文字は2byte 大抵の日本語文字（半角カナ含む）は3byte 5〜6byteの文字は定義されていないし、する気もなさそう ISO 8859-1部分に互換性があるため、マルチバイト文字に対応していないような行儀の悪いプログラムでもそのまま動く。 BOMを付ける場合、BOMは3byteになる。エンディアンに関係なくEF BB BF BOMは本来要らないはずだけど、付いていることがある。文字コードを自動判別する際にはBOMが無いと誤判別することが多いため、出所不明の文書が飛び交う所では付けたほうがいいかもしれない。 BOM付きをUTF-8、なしを通称UTF-8N(正式名称ではない)という。既に
tomitake_flash 2010/03/24
文字コード
リンク
Eclipse入門:Eclipseの基本設定:文字コードの設定
ソースファイルなどを作成した際にどの文字コードを使って作成するにかを指定します。 Eclipse起動後に「ウィンドウ」メニューの中の「設定」メニューをクリックして下さい。「設定」画面が表示されます。左側項目リストの中の「一般」の中に含まれる「ワークスペース」をクリックして下さい。「ワークスペース」に関する設定画面が表示されます。「テキスト・ファイル・エンコード」と書かれた箇所で文字コードの設定が可能です。現在はデフォルトの文字コード(MS932)になっていますので変更したい場合には「その他」をチェックして頂いてからその右側のコンボボックスで文字コードを選択して下さい。任意の文字コードを選択することが出来ます。なおWindows環境で開発している場合にはデフォルトの設定値である「MS032」のままにしておいて問題はありません。以上です。
tomitake_flash 2009/10/07
一覧にないときには使いたい文字コードを入力すればおk

eclipse

文字コード
リンク
草なぎ剛くんについて重大なお知らせ - rna fragments
大好きな草なぎ剛くんについてデマが流れているので…！ fut573 メモ:『彅』弓+剪はJISにないので、windows以外の環境では正常に表示されない場合が多く、ネット上では使わない事を推奨されている文字の一つである。　へー 2009/04/23 はてなブックマーク - 草なぎ剛、公然わいせつ容疑で逮捕（サンケイスポーツ） - Yahoo!ニュース「なぎ」の文字コードに関しては JIS コード(JIS X 0208)では外字になってしまいますが、Unicode では CJK 統合漢字に含まれるちゃんとした文字です。HTML や XML で使う場合は文字実体参照文字参照*1を使って彅(または 彅)のようにして表現できます。*2 表示に関しては今時の OS なら大抵大丈夫です。Mac OS X の標準フォントでも Linux で広く使われている IPA フォント
tomitake_flash 2009/04/30
文字コード
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx