タグ

ブックマーク / www.shuiren.org (3)

  • Unicode―文字コード入門―

    Unicodeとは 多くの国でコンピュータが利用されるようになってきて、文字を扱うための仕組みである文字コードも、その国の数だけ増えていく状態であり、情報交換のために様々な不都合が生ずるようになってきました。また、企業の側でも各国個別の言語に合わせたソフトウェアを開発するためには膨大なコストが必要なため、これを解消する手段が求められるようになってきたのです。 そこでこの問題を解消すべく、IBM、MicrosoftApple等が加盟(他のメンバーについてはこちらを参照)するNGOであるUnicodeコンソーシアムが中心となって、全ての文字を16ビット(65536文字)に収録してしまおうという、野心的な多重言語文字セット規格の制定を企図していました。またそれとは別に、国際標準化機構(ISO)が、世界中の主要な文字を一括して扱う多重言語文字セット規格を開発していました。国際規格が複数制定される

  • 中華人民共和国の文字コード―文字コード入門―

    GB 2312-80 1980年に国家標準局が制定した7,445字の文字表です。俗に「GB(=国guó2家jiā標biāo準zhǔn。日のJISに相当)漢字」と呼ばれます。 中国の文字コードの基礎です。ちょっと前の中国の文字コードと言えばGB2312を指しました。 1986年に改訂(間違いの訂正など)されていますが、将来的には、後述のGB18030が「オペレーティングシステムへの実装が強制(利用出来ないと市販出来ないという原則)」されているため、そちらが主流になっていくでしょう。 日のJIS漢字コードも参考にしているため、実装方法が非常によく似ています。 まず文字表があり、全ての文字に「区位編号」(区点番号と同じ)が振られる のは全く同じですが、以下に見るように、第一級・第二級に分けている所もよく似ています。 Unicode2.1のCJK統合漢字領域に収録されていますので、日語オペレ

  • 『睡人亭』

    新着情報 2012/09/24 トップページをHTML5ベースで書き直しました。他にもぽちぽちHMTL5ベースで書き直し中。そのためあちこちでスタイルがばらばら。見にくくてすいません。 コンテンツ一覧 授業用 授業用トップページ Microsoft Office IME 2010を使いこなす MS Wordを使いこなす MS Excelを使いこなす 文字コード入門 電子テキスト入門 N-gramモデルを利用したテキスト分析 秀丸エディタを使いこなす 秀丸エディタで正規表現を使いこなす インターネットでの情報収集について 東洋史関連 中国史の論文やレポートを書くために 東洋学文献類目検索マニュアル 全国漢籍データベースマニュアル CHISE IDS FINDで漢字を検索 Wordで漢文入力 漢籍電子文献マニュアル 中西暦轉換工具マニュアル 文物圖象研究資料庫マニュアル 中国学用単位系の換算

  • 1