タグ

文字化けに関するsyan0のブックマーク (5)

  • 疼く UTF-8とUTF-8-MACについて調べた

    タグ MacOSX AppleScript sh iconv xxd ファイル名 Spotlight_コメント 文字コード UTF-8 UTF-8-MAC よくファイルのSpotlight コメントに書き込んでいるんだけど、ときどき消えてしまうんだよね。たいていの場合はEAに記録された方から復元できるからいいけど、念のためにAppleScriptでファイル名とSpotlight コメントをテキストファイルにバックアップすることにした。ただ、Macのファイルシステムで使われている文字コードのUTF-8-MACUTF-8では違う文字として扱われるものがあるそうで、そのままではよろしくないので調べてみた。 ファイル名などをUTF-8で入力すると一致しないけど、test -eなどではファイルパスがUTF-8のままでも使えることは知っていた。 UTF-8-MACの違いについてはこちらのサイトが詳し

  • テキストファイルの標準エンコーディングは? - やねうらおブログ(移転しました)

    テキストファイルのエンコーディングとして何を基とすべきかというのは悩ましい。 日語のみならutf-16で幸せになれるのかと思ったら、JIS2004で追加された907字のうち304文字がサロゲートペアであって、2バイトで表現できない。 どうせ16bitで表現しきれないのなら、utf-32は保存領域がもったいない感があるので仕方ないのでutf-8を選択する。 utf-8だと相手に解釈してもらうためには、BOMをつけるほうが好ましい。 そこで、秀丸で標準保存形式としてutf-8(BOMつき)を設定しておく。 秀丸の拡張子関連づけで、".txt"を秀丸と関連づけておく。 よし、これでテキストファイルを新規作成して、秀丸で開くと…。 utf-8(BOMなし)と解釈される。一体どうなっているのか。 Windowsではエクスプローラーからファイルを新規作成するときにテンプレートを設定しておくことが出

    テキストファイルの標準エンコーディングは? - やねうらおブログ(移転しました)
  • iconv - Wikipedia

    iconv(アイコンブ)は異なる文字コード間の相互変換を行う標準API。または、そのAPIに付属する文字コード変換ユーティリティプログラム。名前は「International Codeset Conversion Library」に由来する[1]。GNUによる実装[2]が有名で、変換ライブラリ libiconv のライセンスはLGPL、変換プログラム iconv のライセンスはGPLである。 iconvのAPIは、おもにUNIX環境で文字列の文字コード変換を行う標準インタフェースである。iconvは最初HP-UXで開発され、後にPOSIX規格として標準化された。そのため、ほとんどのUnix系のシステムで使用できる。 iconv APIは文字コード変換プログラムのほか、既存のプログラムを国際化または多言語化するためにも用いられる。例えば、Sambaの国際化にはiconvが利用されている。 X

  • Mac OSXでのカタカナひらがなの濁点が変なので変換する方法 - salmomoのさるもも

    文字コードはややこしくてあまり首を突っ込みたくないんですが、Mac使いの人なら経験あると思います。 特にYoutubeにアップすると変になります。 「スティーヴィー・レイ・ヴォーン」でなく、濁点が独立して 「スティーウ゛ィー・レイ・ウ゛ォーン」などと表記されてしまう問題です。 これはUTF-8-MACという文字コードを使っていることが原因らしいのですが、これを(普通の)UTF-8に変換する方法です。 Automatorでサービスを作って、選択部分を変換という方法にしようと思います。 こんな感じになります。↓ サービスってはこれです。 まずはAutomator起動して、サービスを作ります。 Automator起動 流れはこんな感じです。 「/opt/local/bin/iconv -f UTF-8-MAC -t UTF-8」 で文字コード変換。 それをクリップボードにコピー。 終了したことを

  • Gmailで受け取ったメッセージが文字化けしていたときの対処方法

    いや対処方法もなにも Gmail に用意されてる機能なんだけど、 あまり使うことがなくて存在を忘れてたので。 最初の頃はいくらかあったような気がするけど 今は Gmail で文字化けが起きることはあまりなくなった。 ところが今日、立て続けに2件のメールが文字化け。 両方とも Hotmail をお使いの方からだった。 まあ文字コードの不一致が原因ですね。 ともかく読めないと困るんだけど、 そういえば Gmail には文字化けを修復する機能がついているのだった。 メッセージを開いた状態で右上の▼ボタンを押して 出てくるメニューから「文字化けを修復」を選ぶ。 英語版だったらこれ。 すると、別ウィンドウ(かタブ)が開いて そのメッセージの文字コードにあわせて表示されるので データが壊れているのでなければ、無事読むことができる。 あるいは、POP ダウンロードを有効にしておいて 別のメールクライアン

    Gmailで受け取ったメッセージが文字化けしていたときの対処方法
  • 1