[B! unicode] khashiのブックマーク

khashi id:khashi

unicodeに関するkhashiのブックマーク (17)

ウェブリブログ：サービスは終了しました。
「ウェブリブログ」は 2023年1月31日をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧
khashi 2010/01/06
perl

encode

utf8

unicode
リンク
ウェブリブログ：サービスは終了しました。
「ウェブリブログ」は 2023年1月31日をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧
khashi 2009/10/02
perl

encode

unicode
リンク
#perl - utf8::decode()ではなくEncode::decode_utf8()を使うべき理由 : 404 Blog Not Found
2009年09月13日13:00 カテゴリLightweight Languages #perl - utf8::decode()ではなくEncode::decode_utf8()を使うべき理由駄目です。 [を] Perl の utf8 まわりのおまじない最近良く使うおまじない、というかイディオム。 utf8::decode($text) unless utf8::is_utf8($text); こういう場合は、Encode::decode_utf8()でないと。以下をごらんください。 #!/usr/bin/perl use strict; use warnings; use Encode; use Devel::Peek; for my $bytes ( "\x2F", "\xC0\xAF", "\xE0\x80\xAF", "\xF0\x80\x80\xAF" ) { my $u
khashi 2009/09/14
perl

unicode

utf8

encode

文字コード
リンク
Excel 2007 の CSV と文字エンコーディングの関係 - Hello Another World!
自己紹介上本亮介 (ue) @ わんくま同盟 Microsoft MVP for Development Platforms - VSTO (Jul 2008 - Jun 2009) Xbox Live Xbox 360 で遊んでいます。あわせて読みたいこの記事は Excel 2003 の CSV と文字エンコーディングの関係の改訂版です。改訂前の記事は Excel 2003 ベースですが、YamaKenさんから Excel 2007 だとどうなるのかとの旨コメントを頂きました。 Yamakenさん、ありがとうございます。カンマ区切り、タブ区切りそれぞれのテキストファイルを Excel 2007 で開いたときの挙動をまとめました。先に結果を言うと、ほとんどの場合 Excel 2007 は Excel 2003 と同じ挙動を示します。違う挙動を示すのは
khashi 2009/05/22
csv

unicode

文字コード

excel
リンク
Perlで日本語(ISO-2022-JP)メールを送信(まとめ) - kopug memo
UTF-8で作成されたメール本文をMIME::Lite及びEncodeを使用してメールを送信をする。そこで問題となってくるのが下記の3点。１．チルダ（全角）等の文字化け（"〜 ‖ − ¢ £ ¬ "）２．機種依存文字が含まれていた場合の対応３．MIME::Lite で smtp送信する場合、Return-Pathが有効にならない 1.チルダ（全角）等の文字化け（"〜 ‖ − ¢ £ ¬ "）に関する解決方法：これは有名らしいのですが、Encode::JPが採用している UnicodeConsortium の写像表に問題があるとかで、一部の文字が化けます。チルダとか。しようがないのでこんな風に対応しておきました。 my %map = ( "\x{ff5e}" => "\x{301c}", # 〜 (1-33, WAVE DASH) "\x{2225}" => "\x{201
khashi 2009/03/09
perl

mail

unicode

文字化け

文字コード
リンク
Unicode正規化
正しい並び替えでは、表示は(A)のままですが、間違った並び替えでは、正規結合クラスが互いに等しいMACRONとACUTEを並び替えたため、表示は(B)のように、eの上のアクセント記号の位置が入れ替わってしまいます。正規分解・互換分解ある文字列の正規分解 (Canonical Decomposition) を得るには、まず、それぞれの文字を正規マッピングによって再帰的に、可能な限り、分解します。すなわち、1回分解した後に現れた文字がなおも分解可能であればさらに分解します。分解マッピングがその文字自身である場合は、分解不可能なので、そのままです。しかし、分解しただけでは必ずしも正しい結果が得られません。つまり、結合文字の順序の一意性を保証するため、分解後の文字列に対して正規順序アルゴリズムを適用しなければなりません。このように、正規マッピングによる再帰的分解と、正規順序アルゴリズムによ
khashi 2008/06/12
文字コード

unicode
リンク
Hello Another World! Static +
*.wankuma.com/* の条件でわんくま同盟を丸ごとググれます本屋はじめました Hello Another World! book store (amazon) 自己紹介上本亮介（うえもとりょうすけ） (ue) Hello Another World! というブログをやっています。ブログで発信した情報を本サイトでまとめています。サイト名のプラス記号には単なる静的サイト以上のことができたらいいなという思いを込めていますが、はたして。 2006年の7月に Microsoft MVP を受賞しました。 Microsoft MVP for Microsoft Office System - Microsoft Office System (jul 2006 - jun 2007) リンクわんくま同盟わんくま同盟わんくまブログ勉強会情報 Excel 2007 に様々
khashi 2008/04/11
csv

excel

文字コード

unicode
リンク
UTF8 フラグあれこれ - daily dayflower
UTF8 フラグについてわかってるつもりだったんですが，utf8::is_utf8 considered harmful - Bulknews::Subtech - subtech を読んで混乱したので，自分なりにまとめてみました。間違いがありましたらご指摘よろしく。まとめスカラー変数の内部表象の状態を示すものとして UTF8 フラグというものがあるスカラー変数は（リファレンス等は別として）下記のものを格納できる (A) 文字列（内部表象: UTF-8） (B) 文字列（内部表象: ISO-8859-1） (C) バイナリ列純粋なバイナリストリーム（画像ファイル等）かもしれないし， UTF-8 octet stream かもしれないし， CP932 octet stream かもしれないし，etc, etc ... Perl は（後方互換性確保などの理由から）ISO-8859-1
khashi 2008/02/20
perl

unicode

encode

文字コード
リンク
http://openmya.hacker.jp/hasegawa/public/20071107/s6/h6.html?file=data.txt
khashi 2007/11/09
xss

security

utf-7

unicode
リンク
Unicode::Normalize で遊ぶ - daily dayflower
Unicode の規格では，文字の合字（リガチャ等）等を統一的に扱えるように，「正規化」という処理が仕様として定まっています。この正規化処理のうち「互換性分解」という処理を行うと副作用として半角カナを全角カナに変換できます（逆に全角カナ→半角カナはできません）。 #!/usr/bin/perl use strict; use utf8; use Encode; use Unicode::Normalize; my $src = 'ﾎﾟﾝｼﾞｭｰｽ'; my $dst = Unicode::Normalize::NFKC($src); print Encode::encode('utf8', "${src} => ${dst}\n"); # OUTPUT is: ﾎﾟﾝｼﾞｭｰｽ => ポンジュースUnicode の正規化についてはperl5.8のUnicodeサポートおよび http:/
khashi 2007/07/28
perl

unicode
リンク
Unicode-Normalize-1.26 - Unicode Normalization Forms - metacpan.org
khashi 2007/07/28
perl

cpan

unicode
リンク
UnicodeJapanese - 日本語文字コード変換
Unicode::Japanese - 日本語文字コード変換 Unicode::Japanese - Japanese Character Encoding Handler 名前 NAME Unicode::Japanese - 日本語文字コード変換 Unicode::Japanese - Japanese Character Encoding Handler 概要 SYNOPSIS use Unicode::Japanese; # convert utf8 -> sjis print Unicode::Japanese->new($str)->sjis; # convert sjis -> utf8 print Unicode::Japanese->new($str,'sjis')->get; # convert sjis (imode_EMOJI) -> utf8 # convert
khashi 2007/04/17
perl

cpan

unicode
リンク
daily dayflower - 半角←→全角変換，Unicode::Japanese に未公開機能が…
2008-10-21 追記いまだに（ありがたいことですが）検索で飛んできたりブクマされたりというのがちょいちょいあるので，最新動向を書いておきます。 id:tokuhirom さんが Lingua::JA::Regular::Unicode という Pure Perl Module をリリースなさいました（→ http://d.hatena.ne.jp/tokuhirom/20081018/1224300947）。あなたが作っているアプリで文字列まわりを Unicode::Japanese インスタンスですべて持ちたいわけでなければ（そして，たいていのばあい，持つ必要はないのですが），この Lingua::JA::Regular::Unicode を使うのがベターです。依存性もなく，とても軽量ですので。 2008-10-21 追記おわりウェブアプリを作っていると，ユーザが入力した半角
khashi 2007/04/17
perl

cpan

文字コード

unicode
リンク
http://www.nii.ac.jp/CAT-ILL/PUB/font/www/table/
khashi 2007/01/23
unicode

文字コード
リンク
naoya.dyndns.org is offline
naoya.dyndns.org is currently offline. Please try again later. Questions about our services? Learn more at Dyn.com.
khashi 2006/11/04
perl

unicode
リンク
Perl5.8 の UNICODE 対応
perl は 5.8 から Unicode(utf-8) がサポートされました．5.6 でも Unicode に対応はしていましたが，ぜんぜん使い物にならず，ようやく 5.8 でまともに使えるようになったということです．ただせっかく使えるにもかかわらず perldoc などを見てもイマイチ使い方がわからないので，独自にまとめてみたのがこのページです．誤った書き方や勘違いをしていることもあるので，形式的ですがこのページの内容は無保証です．内容文字コード変換 perlIO jperlからの移行 UTF-8フラグ文字コード自動判別 Unicode Standard Unicode 正規化その他参考資料文字コード変換とりあえず perl5.8 で新しく組み込まれた機能を見るために，euc-jp から shift_jis への変換スクリプトをいくつか載せます． openを利用し
khashi 2006/11/04
perl

unicode
リンク
Perl 5.8.x Unicode 関連
khashi 2006/11/04
perl

unicode

文字コード
リンク
1