タグ

charsetに関するsomatのブックマーク (6)

  • 3.18.1 Javaにおける文字化けの問題についての注意事項

    Javaにおける文字化けの問題についての注意事項を以下に述べます。 Javaで異機種間結合を行う場合、あるいは、データベース接続を行う場合に起こる問題の1つに、文字化けの問題があります。例えば、Solaris OEマシンからWindowsマシンにネットワークを介して全角のチルダ記号('~')を送ると、Windowsマシンで表示したときに文字化けが発生することがあります。 これは既存の日語コード(JIS、EUC、シフトJIS)をUnicodeに変換する際の変換規則が各ベンダによって異なるために起きる問題です。この問題はJava VMで解決できるものではなく、Javaのシステム開発者がこの問題を避けるための自衛的手段を講じる必要があります。 この問題を理解するには、この問題が起きた背景を理解する必要があります。 この背景を、以下で説明します。 ■Unicodeの特徴 UnicodeはUnic

  • Perl io layer

  • 私はいかにして様々なブラウザの脆弱性を発見したか - 葉っぱ日記

    先日、Twitterでどのように脆弱性を見つけるかに興味あるんだろうかと書いたら、意外に色々な人から反応があったので、これまでに自分が見つけた脆弱性のいくつかについてどういう経緯で見つけたのかちょっと書いてみます。 JVN#89344424: 複数のメールクライアントソフトにおける、添付ファイルによりメールクライアントソフトが使用不能になる脆弱性 これは、添付ファイル名にUnicodeの円記号を含めておくと、メーラ側でShift_JISに変換する際にバックスラッシュに変換されてしまって想定外のディレクトリに添付ファイルが展開されてしまったり、あるいは「©on」のような名前のファイルを添付しておくことでShift_JISに変換してCONというファイルを開こうとしてメーラが固まってしまうという問題です。これは、私自身が文字コードの問題について調べ始めた初期段階で、Unicodeからの変換で問題

    私はいかにして様々なブラウザの脆弱性を発見したか - 葉っぱ日記
  • 波ダッシュ

    波ダッシュと全角チルダ 期間などの範囲を表したり、省略などを意味するものに「〜」(波ダッシュ)という文字があります。この記号は、現代日語ではかなり頻繁に使われる文字の一つであり、ユニコードにも「WAVE DASH」として収録されています。 ところが、文章中で頻繁に使われる基的な記号であるにも関わらず、波ダッシュは使う側が十分注意して扱わないとトラブルになりかねない、問題のある文字なのです。波ダッシュに関わる問題はあまり知られていないようですから、ここで具体的に解説しておきましょう。 文字をコンピュータで扱うには、まず文字コードで定義しなければなりません。JIS X 0208で規定されている「波ダッシュ」のコード番号は0133(区点コード)ですが、多くのパソコンで実際に使われている標準的な文字コードであるシフトJISでは「0×8160」というコード番号が割り当てられています。 ちなみに

  • eucJP-ms と CP51932 の違い コードページ932/ウェブリブログ

    「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧

  • ウェブリブログ:サービスは終了しました。

    「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧

    ウェブリブログ:サービスは終了しました。
  • 1