タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Perlと文字コードに関するAkinekoのブックマーク (6)

  • ウェブリブログ:サービスは終了しました。

    「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧

    ウェブリブログ:サービスは終了しました。
  • Perlゼミ(サンプルコードPerl入門)

    Perl入学式 全6回のPerl入門講座。東京、大阪、沖縄、札幌で開催。(東京は4月と10月スタート、それ以外は5月スタート) YAPC::Japan Perlを軸としたITに関わる全ての人のためのカンファレンス。 東京 吉祥寺.pm 五反田.pm 大阪 なにわPerl 沖縄 沖縄.pm

  • 404 Blog Not Found:perl - Encode 入門

    2008年04月09日01:00 カテゴリLightweight Languages perl - Encode 入門 すでにOSCONでもYAPCでも、あちこちそちこちでこの基方針に関しては話したのですが、ここ 404 Blog Not Found でも改めて。 Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改め だまってコードを書けよハゲ 入り口で decode して、内部ではすべて flagged utf8 で扱い、出口で encode する。これがすべてです!とにかくこの基方針をまもっていれば幸せになれます。ここでは、EUC-JPでエンコードされたファイル中の「小飼弾」「こがいだん」「コガイダン」「Kogai Dan」を正規表現で書き換えて標準出力にEUC-JPで出力するプログラムを例にとって説明します。 decode() then encode(

    404 Blog Not Found:perl - Encode 入門
  • Perlで(UTF-8)文字列を扱う基礎中の基礎 - punitan (a.k.a. punytan) のメモ

    ちょっと前に記事を書いたつもりになっていて全く書いていなかったのでメモ。 これをおさえておけば、特殊なケース以外はたいていうまくいくと思います。 一番初めに #!/usr/bin/perl use strict; use warnings; use utf8; use Encode; と書きます。日語を扱う可能性があるプログラムのすべて(つまり、あなたが文字列処理をするプログラムの全て)に、書いておくと幸せになれるらしいですよ。 Perl内部のUTF-8UTF-8 文字列がUTF-8ならUTF-8じゃないか?と思われるかもしれません。が、しかしPerlには「内部で扱うflagged UTF-8」と「flaggedではない外部のUTF-8」の二種類があることを覚えておきましょう。 文字列を扱う時は、Perl内部で扱うflagged UTF-8へdecodeで変換し、Perlの外部に出力す

    Perlで(UTF-8)文字列を扱う基礎中の基礎 - punitan (a.k.a. punytan) のメモ
  • PerlIOのレイヤについてまとめてみた - ぱせらんメモ

    PerlIOがいつまでたってもきちんと理解できず、毎回試行錯誤しながら適当に指定してしまうのできちんと調べてみた。 調べてみて一番の収穫だったのは、レイヤは主に三種類に分けられる、ということ。 ドキュメントでは順不同で出てくるのでごっちゃになって混乱していたが、こうして分類してみると自分の望むものが何なのかよくわかるようになった。 リソースアクセス系 これはリソースに対して実際にIOを行うレイヤ。 :unix Unix/POSIXのread(), write()等を使うレイヤ。 バッファリングしない。どのプラットフォームでも常にO_BINARYで扱う。 :win32 file descriptorの代わりにWindowsネイティブのハンドルを使うレイヤ。 5.10.0現在のリリースではバグっぽいことがわかっているらしい。ので使わないほうがいい。 :stdio システムのstdioライブラリ

    PerlIOのレイヤについてまとめてみた - ぱせらんメモ
  • Perl 5.8.x Unicode関連

    -> 趣旨と注意書き -> UTF8フラグ? -> UTF8フラグとPerlIOレイヤ -> UTF8フラグのついた文字列を記述する -> Wide character in print ... -> Encode -> utf8::* -> use utf8; -> use encoding; -> use UTF8 と use encoding -> JcodeからEncodeへ -> 情報源 <- モドル 趣旨と注意書き Perl 5.8.x のUnicode 関連です。 正直、5.8.x は、ネタでしか使ってなかったので(ぉ、ちゃんといじったことがありませんでした。 使ってみると、よくわかんなくなったので、ちょっとまとめてみました。 今でもあんまりわかってないかもしれないので、内容は無保証です。 突っ込み歓迎。 Jcode、Encodeのメンテナの弾さんから、ご指摘いただいたので、

  • 1