タグ

文字化けに関するyunohitoのブックマーク (3)

  • 🐧 Linux で ZIP from Windows の文字化け修正 - mattintosh note

    Windows で作成された ZIPLinux とか Mac OS で解凍すると文字化けする問題。確実なのは Wine 経由で 7-Zip などの Windows 用アーカイバを使うことなんだけど、「Wine をインストールできない」という状況に置かれた場合を想定してみた。 unzip や 7z などを使って解凍する場合、LANG の値によって展開のされ方が異なるので LANG=C を忘れずに設定しておく。トップディレクトリが文字化けしていると困るので親ディレクトリを用意する。 (unzip の場合、アーカイブによっては LANG=ja_JP.UTF-8 のときに正しい名前で解凍できることもあるので LANG=C が悪影響を及ぼすことがある) # unzip LANG=C unzip -d tmp ARCHIVE.zip # 7z LANG=C 7z x -otmp ARCHIVE.

    🐧 Linux で ZIP from Windows の文字化け修正 - mattintosh note
  • 統計学の力を借りて、文字化け退散! 解決&高速化編 | 月と燃素と、ひと匙の砂糖

    前回までのあらすじ。 文字化けをどうにかしたい。 それぞれのエンコードは、バイトとバイトのつながりに特徴がある。(数バイトで一文字表すから) これを、ベクトルに見立てて、それぞれの「角度」を調べて、一番近いので分類してみた。 ある場合†1について、エンコードに含まれるASCII部分が邪魔をして推定成功率がいまいち←イマココ! ■単純に除いてみる だけ! 前回、RFCの全データを使って作ったASCIIのデータがありました。これがASCIIの使われている領域ですから、これを判断に使わなきゃ良いんじゃないの? …というわけで、ASCII部分を除外して作ってみた各エンコードの画像がこちら。(クリックすると拡大します、ぜひクリックしてみてください) ASCIIと使用領域がかぶっているISO-2022-JP(JIS)でもちゃんと要素が残っているので、使えそうです。 かなり安直な方法†2ですが、とりあえ

  • 「美乳」で文字化けが直るって本当?

    ・「美乳」で文字化けが直るって当? オンラインDVD&CDレンタルなら月々1980円で借り放題のDMMがお得! えっ? って聞きなおしたくなるようなタイトルですが、「この『美乳』という文字をヘッダー部分にコメントとして挿入しておくと、文字化けが直る」という話は確かに存在します。ただし、これは大前提としてEUC-JPのページを作成するならば、という話になります。 <HTML> <HEAD> <meta http-equiv=Content-Type content="text/html; charset=EUC-JP"> <!-- 美乳 --> <TITLE>テスト1</TITLE> </HEAD> <BODY bgcolor="#FFFFFF"> このページはアダルトサイトとは無縁です。ヌード画像などは一切ありません。 </BODY> </HTML> では、なぜ、この「美乳」がおまじない

  • 1