タグ

utfとjavaに関するkiyo_hikoのブックマーク (4)

  • How to read/write a file in UTF-8 in Java?

    kiyo_hiko
    kiyo_hiko 2014/05/02
    "Then, you shouldn't use FileReader or FileWriter for this because it always uses the platform-default encoding (which is often not UTF-8)." おアアア…自作アプリでUTF-8のテキスト読まないのFileReader使ってるせいか
  • Dfile.encoding=UTF-8 ビルド - Google 検索

    2023/01/30 · ソースファイルを保存する時のエンコーディングとして UTF-8 を使用した場合には次のいずれかの方法でエンコーディングを設定してコンパイルを行います。

    kiyo_hiko
    kiyo_hiko 2013/11/05
    jar作ったら文字化けした(自ブログ) http://kiyohikou.hateblo.jp/entry/2013/11/04/213432 ひとまずjavawに-Dfile.encoding=UTF-8付けたらうごいた
  • サロゲートペア

    Last Updated 2011/09/21 私は当初、サロゲートペアに興味がありませんでしたが、XPS の研究を始めてみると無視できないことが分かりました。そこで、XPS のページに含めることにしたのですが、.Net Framework 全般に関わる問題であることは言うまでもありません。 【注意】 このページの一部の文字はサロゲートペアを使っていますので、IE(インターネットエクスプローラ)でなければ正しく表示されない場合があります。 サロゲートペアとは何か サロゲート "surrogate" の英語としての意味は、「代理人」とか「代用物」です。これだけでは何のことかサッパリですが、日語にしにくい言葉ではあります。 2009 年に「サロゲート」というタイトルの、ブルースウイルス主演のアメリカ映画が公開されました。そこでは、人間の代わりに仕事をするロボット(いわゆる、ミュータント)の意

    kiyo_hiko
    kiyo_hiko 2013/10/06
    代理組合せ
  • JavaでUTF-8のBOMに対処する - 万象酔歩

    この記事は「 Javaでファイルオープン:文字コードや追加モードなど」の補助記事です。 JavaでBOM付きUTF-8ファイルを読む 媒体上の文字コード規格、UTF-8には、規格策定者の迷いのため 一時期、先頭に3バイトのBOMと呼ばれる、バイト並び識別マーク を置く仕様がありました。 現在はBOMはまず使われることはありませんが、Windows付属の「メモ帳」という 簡易エディタでUTF-8ファイルをうっかり作成してしまうと、ファイル先頭に BOMが付いてしまいます。 残念なことにJavaではBOM付きのUTF-8ファイルをまともに 読むことができません。 先頭がBOMの場合スキップする方法 対処法は色々考えられますが、ここでは、BufferedInputStreamを被せ、 先頭がBOMの場合スキップし、BOMでない場合先頭まで巻き戻す形を 示します。 import java.io.*

    JavaでUTF-8のBOMに対処する - 万象酔歩
    kiyo_hiko
    kiyo_hiko 2013/08/28
    「BOMはまず使われることはありません…メモ帳という 簡易エディタでUTF-8ファイルをうっかり作成してしまうと…BOMが付いてしまいます。残念なことにJavaではBOM付きのUTF-8ファイルをまともに 読むことができません」
  • 1