^ back to top • Original content ©2003 Webmonkey. Design, modifications and additions ©2004 Garrett Murray. Validate: XHTML Strict • CSS 2
チルダ(tilde)は、ダイアクリティカルマーク(発音区別符号)の一種で、記号「~」のこと。チルド、波線符号(はせんふごう)ともいい、鼻音に関する音をあらわす。もともと、字母の上に N を小さく書いたことから生じた記号である。 英語ではティルダ(tilde)、スペイン語ではティルデ(tilde)、ポルトガル語ではティウ(til)という。 また、単独で用いられるチルダ(freestanding tilde)は、例えば数学においては漸近的に等しいことや相似を表す記号として、UNIX系オペレーティングシステム上ではホームディレクトリを示す記号などとして用いられる。 各言語における用法[編集] スペイン語、バスク語など ñ は硬口蓋鼻音 /ɲ/ を表す。 ポルトガル語 ã, õ は鼻母音を表す。 エストニア語、ヴォロ語 õ は非円唇後舌半狭母音[ɤ]を表す。 グリーンランド語 1973年以前の旧正
Using HTML entities is the right way to ensure all the characters on your page are validated. However, often finding the right entity code requires scanning through 250 rows of characters. This lookup allows you to quickly find the entity based on how it looks, e.g. like an < or the letter c. HTML Entity Lookup Lookup HTML entities like, space separate for more: Options Small output Incl. extended
【おもなメニュー】 「クルミノ コーボー」トップページ ▼「クルミノ コーボー」について ▼こーしんりれき ●メールとウェブのお役立ちメモ ●パーソナル編集長を使うときのコツ ◎ことばと文字にかかわるおぼえがき ●ざっきちょー ▼おしらせ 2007.09.08:「表記の統一についてかんがえる(3)」を修正しました。 「ファイアーフォックス」を使ってみませんか。ファイアーフォックスなら、このサイトのトップページの写真に、小さなアナログ時計が表示されます。
朝鮮語の語彙には固有語と漢字語があり、古くは固有語に漢字を当てる例もあったが、現代では漢字語のみに漢字が使われる。 一方、現在の大韓民国(韓国)および朝鮮民主主義人民共和国(北朝鮮)では、建国後に両国それぞれが行った漢字廃止政策によりハングル(チョソングル)のみでの言語表記に転換された結果、漢字の使用は韓国では限定的な範囲にまで縮小され、北朝鮮ではほぼ全廃されている。この要因として、言語的な理由がある。朝鮮漢字音が1音節であり、音節文字であるハングル1字で漢字1字を表記でき、日本語の仮名表記と違ってハングル表記によって文字数が増えないことや、現代では日本語の訓読みに相当するものがないこと、などを挙げることができる。なお、日本国内に在住する在日韓国人の間(在日朝鮮語)では現在でも広く使用されている[1][2]。 漢字廃止政策の前後、または政策実行の程度によって習得率が変わり、つまり韓国での漢
2007年05月23日17:30 カテゴリLogos 日本語で確実に使える約物 via Unicode こちらに触発されて。 日本語と英語でよく使う約物の種類と名称 | コリス 以下のperl scriptに前処理をさせました。 #!/usr/local/bin/perl use strict; use warnings; use Encode; use Unicode::UCD; my $sjis = find_encoding('shiftjis'); my $eucjp = find_encoding('eucjp'); binmode STDOUT, ':utf8'; print "<table>\n"; for my $ord (0..0xD7FF,0xE000..0xFFFE){ my $sjischr; # check if it can be printed in gene
文字コード・エンコーディング体系として知られるUnicode UTF8さん(9歳)が11日、都内で自殺していたことがわかった。関係者によれば、このところ周囲で論争や誹謗中傷が絶えないのを苦にふさぎこむことが多かったという。葬儀は故人の遺志により密葬となる予定。 UTF8さんはエリートで有名なUnicode家の末妹。ここ数年、「I18Nでラクできる」「なんかカッコイイ」と勘違いしたプログラマのあいだで採用が進んだことから華やかなセレブ生活を送っていたが、 カネ(特に円)に弱い 波打ちぎわをダッシュすると右左もわからなくなる低脳 天然キャラの演出のつもりか、いつもデカい辞書を抱えていてウザい 実の親ではなく、サロゲート夫婦に産んでもらったらしい 古いワーキングブラウザに冷たい、格差社会の象徴 などの批判や中傷にさらされるようになり、最近は落ち込みがちに。親しかったBOMさんによれば心療内科に通
《愚者の後知恵》今は解散した電子ライブラリーコンソーシアムの機関誌のために連載していた「電子化文書規格シリーズ」の第1 回。 独立した全文データベースであれ,ネットワークを経由してアクセスするデータベースであれ,電子化されたテキストの問題を考えるとき,テキストを電子化する際用いられる文字コードを避けて通ることはできない.中でも,我々が電子ライブラリーという言葉で漠然と考えている学術文書や各国各分野の古典的な文書のアーカイブを対象とすると,文字コードの問題は,さらなる広がりを見せてくる. 今号から文字コードを中心に,電子ライブラリーの関係者を対象として,電子化文書の規格に係わる様々なトピックについての解説を試みる.対象読者の限定は難しいけれど,電子化テキストについての全くの素人ではないが情報規格の専門家でもないというレベルを想定する.すなわち,日ごろからコンピューターを通して様々な形で電子
2007年03月10日23:30 カテゴリCode シフトJISを残すべきか? Matzさん経由で知ったのだが、これはひどい。 シフトJISを捨てられるか?:ITpro では,今までのデファクトだったシフトJISはどうだろうか。シフトJISを使うと,(英文混じりの)日本語を表現する場合,そのデータ長はUTF-8/16/32に比べて短くなる。コンピュータを取り巻く通信環境は高速になり,ストレージは大容量化してきたとはいえ,データ長は短いに越したことはない。確かに、シフトJISで表現できるテキストをUTF-8で表現すると、最高で1.5倍になる(ただしここで言うシフトJISは、Shift_JISX0213は含まない)。しかし、テキストデータというのは圧縮率が高い。 未圧縮gzipbzip2 シフトJIS4,6822,2542,225 UTF-86,7672,5262,325 UTF-8/SJIS
Windowsにおいて「Unicode」は,長らく「使える」けれども「あまり使われない」存在だった。その状況が「Windows Vista」と「the 2007 Microsoft Office」で変わろうとしている。この2製品に付属する「Microsoft IME」で,「WindowsではUnicodeでしか扱えない文字」が,変換候補として頻出するようになったからだ。Unicodeはいよいよ,一般ユーザーが「知らずに使う」存在になるだろう。 マイクロソフトがUnicodeに対応したのは,「Windows 98」と「Windows NT 4.0」からだ。このとき,「JIS X 0212」の「補助漢字」も,エンコーディングにUnicodeを使えばWindowsで利用できるようになった。同時に,JIS X 0212の補助漢字などを使った単語が,Windows OSやMicrosoft Offi
2006年05月10日11:00 カテゴリLightweight LanguagesLogos Encode - 規格のバグまでは直せません それが規格だからです。 b:note: Encodeのナゾ 最近会う機会が無いので、トラックバックします。 $moji = "~"; Encode::from_to($moji, "euc-jp", "utf8"); print $moji; で出てきた文字をWindowsのメモ帳とか秀丸でみると、~の波形が反対になった文字になってしまいます。 ここでいう「~」はU+FF5E、Fullwidth Tildeのことです。 その答えは、「Unicode Consortiumが用意したJISX0212とUnicodeの変換表がそうだったから」ということになります。Encodeのせいではないのです。詳しくは、 Japanese <-> Unicode Map
Encode - 規格のバグまでは直せませんにコメントしながら思ったのだが、JIS X 0208の1区33点「波ダッシュ」をUnicodeに変換する際、U+FF5EのFULLWIDTH TILDEに変換するのは明らかに間違いだ。この件に関して、私が知る限りのことを、ここに記しておこうと思う。 平成5年度のUCS調査研究委員会WG1において問題となったものの一つが、既存のJISの文字コードとISO/IEC 10646との対応をどうするかだった。JIS X 0208-1990の1区33点「波ダッシュ」に対しては、U+223C、U+223D、U+223E、U+223F、U+301Cが候補となったが、結局U+301Cと対応させることとなった。U+301Cの名前がWAVE DASHだったからである。ただし、ISO/IEC 10646-1:1993のU+301Cの例示字形は、JIS X 0208の「波
波ダッシュ(なみダッシュ、wave dash[注釈 1])とは、日本語表記における約物のひとつで、波線「」(はせん、なみせん)を指している。ダッシュ記号(—)の波形であることからそう呼ばれる[注釈 2]。 日本語における用法の多くはダッシュ記号としての用法と長音符としての用法であり、中国語でも長音符などとして使われることがある。 Windows XP等における日本語環境下では、表示字形が「」ではなく、波形の反転した「」に変わってしまう問題が発生していた[注釈 3]。これに付随して、波ダッシュの代用として音声記号等として用いられる全角チルダが不適切に使われることがあるため、混乱の元となっている[1][注釈 4]。 用途[編集] 範囲[編集] 波ダッシュは、範囲を表すために用いられる[注釈 5]。 場所に対して: 東京〜大阪 時間に対して: 5時〜6時(もしくは5〜6時) 数量に対して: 10
Windowsでは、JIS基本漢字(JIS X 0208)コードの保留領域である09区〜15区および85区〜94区の一部、ならびに、JIS漢字の範囲外である95区〜114区の一部に、機種依存文字を配置しています。これらの文字は、このままインターネットで使用してはいけませんが、ユニコードに含まれていれば、文字参照を用いて記述できます。 NEC機種依存文字 PC-9800シリーズなど、NECのパソコンが日本で主流だったころに独自に定義されていた文字が13区に割り当てられています。 Windows以外のコンピュータをお使いの方は、画像ファイルでご覧ください。 区点 JIS SJIS +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 13区 2D20 873F
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く