タグ

文字コードに関するPOMMEのブックマーク (9)

  • WindowsとMacでUnicodeマッピングが違う文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    JIS X 0208の範囲内の文字を対象に、WindowsMacでUnicodeマッピングが違うものをリストアップしてみた。 Windows側のマッピングの文字(U+FF5E FULLWIDTH TILDEなど)がMac環境のテキストに紛れ込んだ場合、目で見て違いを判別するのは難しいため、予期せぬ事態の原因となる可能性がある。 FULLWIDTH TILDEなどは、Mac OS Xにおける通常の利用では、わざわざ文字パレットから入力したのでなければ出現することはまれである。ただし、Windowsで作成したドキュメント経由で入り込んでくることがあるほか、2chブラウザのBathyScapheのように、Mac用のアプリでありながらあえてCP932の変換テーブルを採用している例もある。 たとえば波ダッシュ(01-33 WAVE DASH)は、BathyScaphe上ではU+301C WAVE

    WindowsとMacでUnicodeマッピングが違う文字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • Macの外字の歴史を整理してみる - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    1989年、Appleは漢字Talk 6をリリースし、また、初の日語対応PostScriptプリンタであるApple LaserWriter II NTX-Jを発売した。NTX-Jに搭載されていた日フォントは、モリサワのリュウミンL-KLと中ゴシックBBB。 プリンタ・フォントであるリュウミンL-KLと中ゴシックBBBの文字セットとエンコーディングは、Adobeによって83pv-RKSJ(以下単に「83pv」と呼ぶ)*1として定義されており、その外字部分(下図・左)は、NECPC98外字のサブセットとなっていた。 リュウミンL-KLと中ゴシックBBBに対応するスクリーン・フォントとしてAppleから提供されたのが、細明朝体と中ゴシック体。漢字Talk 6.0.7でForeign System Fontをインストールすると、上図青地部分を画面表示することができた。 上図ピンク地部分の

    Macの外字の歴史を整理してみる - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 漢字検索 - 読みや画数などから人名用漢字含む1万字を検索

    特徴: 読みが分からなくとも、漢字の部品(構成要素)や画数などから調べられます 子供の命名に使える漢字で絞り込むことができます JIS第1〜第4水準の10,053文字に対応し(非漢字領域の「〆、仝、々」含む)、日の漢字をほぼ網羅しています 検索結果には異体字もあわせて表示されます 問い合わせの入力方法 以下で、背景が黄色い文字列は入力例です。 よくある例 [金 高] → 「金」「高」の両方を構成要素として 含む漢字。検索結果として「鎬」がヒットし、読みや文字コードなどが表示されます。 [さんずい こう] → 構成要素にさんずいを含み、 読みが「こう」の漢字。例えば「江」などがヒットします。 [さんずい はん 5-6画] → 構成要素にさ んずいを含み、「はん」という読みを持ち、総画数が5〜6画の漢字。例えば 「汎」など。 [にんべん 常用] → にんべんを含む常用漢字。例えば「仁」や「仏

  • Perlメモ

    複数のプロセスでロック状態が異常であると判断し,そのうちの 1つがロックを解除したことにより,別のプロセスがロックしたにもか かわらず,先ほどロック状態が異常であると判断したプロセスによってこの正常なロッ クを解除されてしまう可能性があります. この方法の問題点は,異常なロック状態を解除する操作が正常なロック状態をも 解除できてしまうことにあります.逆に言えば,異常なロック状態を解除する操作に よって正常なロック状態を解除できなければ問題ないわけです.そのためにはどうす ればよいのか? 答えはロック状態が常に変化していけば よいということです.そして,これを実現するのに都合がよいのが rename による方法になります. 最初のスクリプトで説明しますと,ロックファイルが lockfile という 名前のときがロックが解除されている状態で,lockfile987654321 のよう に後ろに

    Perlメモ
  • Adobe - Windows Vista上のJIS2004基準のフォントについて

    ホーム サポート Font / Type Windows Vista上のJIS2004基準のフォントについて Windows Vista上のJIS2004基準のフォントと 他のフォントの文字の形の互換性についての注意事項 2007年1月にMicrosoft®社の新しいオペレーティング・システム(OS)、Windows® Vista™が発売されました。Windows Vistaに標準で搭載されているシステム・フォント※1は、コンピュータ上で用いる文字の種類と文字コードを定めた日工業規格、JIS X 0213:2004(以後、JIS2004と略称)に対応していますが、これらのフォントと、JIS X 0208:1990(以後、JIS90と略称)※2に対応する、従来のWindows XP上でのシステム・フォントやアドビ システムズ社(以下アドビ)の主要な日語OpenType®フォント

  • Perl 5.8 Documentation - perljp - 日本語 Perl ガイド

    NAME perljp - 日Perl ガイド 説明 Perl の世界へようこそ! Perl 5.8.0 より、Unicodeサポートが大幅に強化され、その結果ラテン文字以外の文字コードのサポートが CJK (中国語、日語、ハングル)を含めて加わりました。Unicodeは世界中の文字を一つの文字コードで扱うことを目指した標準規格であり、東から西、はたまたその間の文字(ギリシャ文字、キリール文字、アラビア文字、ヘブライ文字、ディーヴァナガーリ文字、などなど)や、これまではOSベンダーが独自に定めていた文字(PCおよびMacintosh)がすでに含まれています。 Perl 自身は Unicode で動作します。Perl スクリプト内の文字列リテラルや正規表現は Unicode を前提としています。そして入出力のためには、これまで使われてきたさまざまな文字コードに対応するモジュール、「

  • Perl5.8 の UNICODE 対応

    perl は 5.8 から Unicode(utf-8) がサポートされました.5.6 でも Unicode に対応はしていましたが,ぜんぜん使い物にならず,ようやく 5.8 でまともに使えるようになったということです.ただせっかく使えるにもかか わらず perldoc などを見てもイマイチ使い方がわからないので,独自にまと めてみたのがこのページです. 誤った書き方や勘違いをしてい ることもあるので,形式的ですがこのページの内容は無保証です. 内容 文字コード変換 perlIO jperlからの移行 UTF-8フラグ 文字コード自動判別 Unicode Standard Unicode 正規化 その他 参考資料 文字コード変換 とりあえず perl5.8 で新しく組み込まれた機能を見るために,euc-jp から shift_jis への変換スクリプトをいくつか載せます. openを利用し

  • Perl/Unicode - BugbearR's Wiki

    2017-04-16 FreeBSD/mpd 2016-12-23 RecentDeleted Blogアプリ 日記 2016-11-17 当にあった怖いコード/1 2016-05-16 .NET 2015-07-06 書きたいこと 2015-07-05 postgres Java/変数の初期化に安易に空オブジェクトを代入しない 2015-06-30 PukiWiki/1.4/マニュアル/プラグイン/u 当にあった怖いコード/15 2014-10-01 日記/2014-10-01 2014-09-09 日記/2014-09-09 2014-08-13 日記/2014-08-10 2014-05-28 バグパターン/日時 バグパターン 2014-04-13 IPv6 2014-03-20 パスワード問題 2014-01-27 DNS/ルートサーバーは13台という神話 2014-01-25

  • perluniintro - Perl Unicode の手引き - perldoc.jp

    名前¶ perluniintro - Perl Unicode の手引き 説明¶ This document gives a general idea of Unicode and how to use Unicode in Perl. このドキュメントは、Unicode の一般的な考えと、 PerlでUnicodeをどのように使うかを書いています。 Unicode¶ Unicode is a character set standard which plans to codify all of the writing systems of the world, plus many other symbols. Unicode は、キャラクタセットの標準です。世界の全ての書記体系と、それに加えて、 他の多くのシンボルを体系化することを計画しています。 Unicode and ISO/IEC

  • 1