タグ

utf-8とtroubleに関するruedapのブックマーク (3)

  • Excel 2007 の CSV と 文字エンコーディング の関係 - Hello Another World!

    自己紹介 上亮介 (ue) @ わんくま同盟 Microsoft MVP for Development Platforms - VSTO (Jul 2008 - Jun 2009) Xbox Live Xbox 360 で遊んでいます。 あわせて読みたい この記事は Excel 2003 の CSV と 文字エンコーディング の関係 の改訂版です。 改訂前の記事は Excel 2003 ベースですが、YamaKenさんから Excel 2007 だとどうなるのかとの旨コメントを頂きました。 Yamakenさん、ありがとうございます。 カンマ区切り、タブ区切りそれぞれのテキストファイルを Excel 2007 で開いたときの挙動をまとめました。 先に結果を言うと、ほとんどの場合 Excel 2007 は Excel 2003 と同じ挙動を示します。 違う挙動を示すのは

  • Excel 2003 の CSV と 文字エンコーディング の関係 - Hello Another World!

    自己紹介 上亮介 (ue) @ わんくま同盟 Microsoft MVP for Development Platforms - VSTO (Jul 2008 - Jun 2009) Xbox Live Xbox 360 で遊んでいます。 あわせて読みたい この記事は Excel 2003 の CSV と Unicode の関係 の改訂版です。 改訂前の記事に PASSJ 理事の河端善博さんから改訂に必要な情報をコメントして頂きました。 河端さん、ありがとうございました。カンマ区切り、タブ区切りそれぞれのテキストファイルを Excel 2003 で開いたときの挙動をまとめました。調査に使用したテキストファイルのエンコーディングは以下の5種です。Shift_JIS(CP932) 形式 UTF-7 形式 UTF-8 形式 (BOM 有り・BOM 無し) UTF-16 LE 形式

  • 波ダッシュ

    波ダッシュと全角チルダ 期間などの範囲を表したり、省略などを意味するものに「〜」(波ダッシュ)という文字があります。この記号は、現代日語ではかなり頻繁に使われる文字の一つであり、ユニコードにも「WAVE DASH」として収録されています。 ところが、文章中で頻繁に使われる基的な記号であるにも関わらず、波ダッシュは使う側が十分注意して扱わないとトラブルになりかねない、問題のある文字なのです。波ダッシュに関わる問題はあまり知られていないようですから、ここで具体的に解説しておきましょう。 文字をコンピュータで扱うには、まず文字コードで定義しなければなりません。JIS X 0208で規定されている「波ダッシュ」のコード番号は0133(区点コード)ですが、多くのパソコンで実際に使われている標準的な文字コードであるシフトJISでは「0×8160」というコード番号が割り当てられています。 ちなみに

  • 1