タグ

文字コードに関するnekonamiのブックマーク (4)

  • 文字コード・国際化 | Netsphere Laboratories

    文字コードに関して適当に考えるメモ。 文書 主要な文字コードとMIME名 シフトJIS / EUC-JPとUnicodeとの妥当な変換表 異なる文字コードのテキストを混在させるには ICU: International Components for Unicode ICUを使う ICUを使った文字コードの変換なども、こちら。 文字コードの変換 [C++] レガシーな文字コード (シフトJIS, EUC-JP) から Unicode への変換や、あるいはレガシーな文字コード同士の変換。 Unicode正規化 (icu::Normalizer2) [C++] Unicodeでの文字列照合・ソート [C++] Linux での描画 伝統的なXのテキスト描画 (Xft) Pango でテキスト描画 タイ語を表示する m17n library でテキスト描画 タイ語とクメール語を表示する 覚え書き

  • 文字コードの基本文献は? - もじのなまえ

    そういえば日曜日の「もじもじカフェ」、お出でくださった皆様どうもありがとうございました。いつも一番の楽しみは、終わった後の懇親会だったりするんですが、その席である学生さんから「文字コードを勉強するとっかかりになるような文章、ありませんか?」との質問が。 ネット上で入手できて、信頼性が高く、しかも読んだ後に次のステップが見えてくるような文章。つまり基文献ですね。もちろん、ぼくなどの原稿ではダメダメ。しばらく考えて挙げたのが以下のもの。皆さんならどんな文章を挙げますか? 漢字・日語処理技術の発展:漢字コードの標準化(芝野耕司) 日の漢字コードを前史の段階から詳述 JIS X 0221(ISO/IEC 10646)の目指すもの(芝野耕司) ISO/IEC 10646(Unicode)についての基文献ならこれ 文字コードと図書館(芝野耕司) 標題にとどまらず、国際規格の歴史を詳述 JIS漢

    文字コードの基本文献は? - もじのなまえ
  • - 株式会社エスロジカル - 技術ドキュメント UNIX の C言語:iconv()で文字コード変換

    技術ドキュメント目次 -> UNIX の C言語 -> iconv()で文字コード変換 技術ドキュメントは、2002~2004年頃に作成したものが多いです。 内容が古くなっていることもあるかと思いますが、ご了承ください。 【低価格SSL証明書】弊社運営の低価格SSL証明書販売サイト、翌月末払いなど請求書払いも可能。 ◆ iconv()で文字コード変換 iconv() 関数を用いるとことで、 UNIXのC言語のプログラム内から文字コードの変換を行うことができます。 ◆ iconv()サンプルプログラム 文字列をEUCからSJISに変換する簡単なサンプルを次に記載しますので、 よろしければ参考にされてください。 ※RedHat Linux 7.3 と FreeBSD 5.3 でコンパイルが通ることを確認しました。 ただし、FreeBSD ではデフォルトで iconv が入っていないことも多い

  • シフトJIS / EUC-JPとUnicodeとの妥当な変換表: Netsphere Laboratories

    2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。 最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなければ、文字化けが発生することになる。 おかしな変換表は、これまでは、特にLinuxなどの上で動作するオープンソースソフトウェアで多く見られた。おそらく規格原理主義者が多かったためだろう。そもそも、規格どおりに変換表を作ると、実用的な変換表にはならない。しかし、最近ではまともな変換表を実装しているものも増えてきて、うまく選ぶだけでいいようになってきている。 変換表の違いをまとめたページはよく見かけるが、実際にどのような条件を満たして変換するものを選べばいいか不明なので、まとめてみた。 変換表に求めら

  • 1