[B! utf-8][ruby] pugleeのブックマーク

puglee id:puglee

utf-8とrubyに関するpugleeのブックマーク (2)

Ruby 2.1.0 に追加される不正なバイト列を除去する String#scrub の紹介 : sonots:blog
puglee 2014/08/20
utf-8

ruby

文字列

文字化け
リンク
ほぅほぅじょせつ : UTF-8とUTF-8Nの違いによるワナ
2008年02月27日08:32 カテゴリ UTF-8とUTF-8Nの違いによるワナ rubyを書いているのだが、結構意外なところではまって、時間を費やしてしまったのでメモしておく。どうやらUTF-8にはUTF-8とUTF-8Nの2種類がある。それらの違いは、UTF-8ではBOM（Byte Order Mark）と呼ばれる、エンディアンを判定するためのデータが先頭3バイトに書き込まれ、UTF-8Nでは書き込まれないというもの。（追記20080401：コメントでご指摘をいただいたように、上の表記は適切ではありません。正しくは「UTF-8」では基本的にBOMは付与されず、BOMが付与された場合に限り「UTF-8BOM」などの表記を与えて区別するべきであるようです。wikipadia「UTF-8」　本来であればすべての表記を変更すべきですが、ここではTerePadがBOMつきのUTF-8を「
puglee 2013/04/12
utf-8

ruby

Windows

文字コード
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx