タグ

Perlとencodeに関するartztのブックマーク (3)

  • 2/5 Perl でファイルの中身を変更する [Perl] All About

    Perl でファイルの中身を変更する(2ページ目)Perl でファイルを開き、変更し、保存する方法を覚えます。 文字コードについておさらい ここで1回、「文字コード」についておさらいしておきましょう。 文字コードとは、文字を電子ファイルに保存する時に「『あ』は『01』、『い』は『02』という番号に変換して保存しておきましょう。」などとあらかじめ取り決めてある変換ルールの事です。偉い方々が話し合って決めます。 日語で使われる主な文字コードは「UTF-8」、「Shift_JIS」、「ISO-2022-JP」、「EUC-JP」の4つがあります。変換ルールが一方では「『あ』は『01』」、別のルールでは「『あ』は『101』」など、それぞれ異なりますので、ファイルがどのルールで保存されているかが分かっていないと開いた時に文字化けしてしまうのです。 4つの文字コードはそれぞれ歴史がありよく使われる場面

    2/5 Perl でファイルの中身を変更する [Perl] All About
    artzt
    artzt 2013/09/02
    #Perl ファイル入力と出力両方を行うプログラム use strict; use warnings; use utf8; binmode STDOUT, 'encoding(utf8)'; #Windows の場合は utf8 -> cp932 my ($fh, $fh2); open ($fh, ':encoding(cp932)', 'text01_copied.txt') or die "ERROR: open: text01_copied.txt: $!\n" ; while(){ print
  • https://osksn2.hep.sci.osaka-u.ac.jp/~taku/osx/perl/perl_utf.html

  • Perl 5.8.x Unicode関連

    -> 趣旨と注意書き -> UTF8フラグ? -> UTF8フラグとPerlIOレイヤ -> UTF8フラグのついた文字列を記述する -> Wide character in print ... -> Encode -> utf8::* -> use utf8; -> use encoding; -> use UTF8 と use encoding -> JcodeからEncodeへ -> 情報源 <- モドル 趣旨と注意書き Perl 5.8.x のUnicode 関連です。 正直、5.8.x は、ネタでしか使ってなかったので(ぉ、ちゃんといじったことがありませんでした。 使ってみると、よくわかんなくなったので、ちょっとまとめてみました。 今でもあんまりわかってないかもしれないので、内容は無保証です。 突っ込み歓迎。 Jcode、Encodeのメンテナの弾さんから、ご指摘いただいたので、

  • 1