一定期間更新がないため広告を表示しています
日本語EUC(EUC-JP)にはいろいろあって頭がこんがらがってきたので、サルにもわかるように(つまり、自分があとから見て理解できるように)まとめてみた*1。まず、EUC-JPにはどんな種類があるのだろうということで、わたしの環境で実装例を確認できるものをピックアップしてみた。下図のうちeucJP-openとIANAのEUC-JPについては身近な実装例を思いつかなかったが、これを外すわけにはいかないだろうと思って入れておいた。 各EUC-JPのレパートリをまとめたのが、下図。eucJP-openには上図に示したようなバリエーションがあるが、レパートリは共通。「JIS X 0208の国際基準版・漢字用8ビット符号 + JIS X 0201片仮名」については、これを一言で表現できる呼称を思いつかないので、以下の図では仮に「TextEdit」と表記する。 下図は、各EUC-JPのレパートリと符号
一部文字化けしたメールがあったのでこんな会話になった。 俺 「この文字とこの文字って組み合わせによって文字化けするんだっけ?」 隣 秀丸でポチッと文字コードを表示させた。 俺 (゜ロ゜;) 「それマクロ?」 隣 「秀丸の標準機能」 俺 (゜ロ゜;) 「知らなかった・・・・・・・・・」 確認方法 メニューバーの「その他」 > 「コマンド一覧」をクリック コマンド一覧の中から、「その他」 > 「文字コード表示」をクリック ダイアログボックスに文字コードが表示される 表示される文字コードは以下 Shift-JIS EUC JIS Unicode Unicode(UTF-8) それぞれの文字コードを1つずつコピーすることはできる。 Ctrl+Cでまとめてコピーできるとありがたいんだけどな。 よく確認擦る必要があるのなら、いちいち、上の操作するのは面倒くさいので、 「その他」> 「キー割り当て」で自
Opera for Android, Opera for iOS Starting on March 6, nearly 400M Europeans will get to choose their default browser on... March 6th, 2024 We're excited for March 6th, when hundreds of millions of Android and iOS users around the EU will have the... Gaming, Opera GX Pimp your smartphone with GX Mods, now available in Opera GX on Android and iOS February 8th, 2024 Transform the look and feel of you
ホーム > mysql | perl > mysqlでskip-character-set-client-handshakeはもう使わないほうがいいと思われ 新しい 古い skip-character-set-client-handshake を [mysqld] セクションに追記すると、クライアントがどんな文字コード設定をもっていようが問答無用で character_set_* を (_system をのぞいて) すべて同じ値に統一してくれる http://d.hatena.ne.jp/a666666/20090826/1251270979 ふーむ。 skip-character-set-client-handshakeを薦める文書がネット上にはやたら転がってるんだけど、これには大きな落とし穴がある。 たしかに表示されるcharacter_set_*は統一されるかもしれないがこれはあくま
Last Updated: 2002/03/26 Perl で、16進文字列、10進整数、2進文字列、バイナリー文字列の相互変換を行うための、スクリプトメモです。 特に断っていない限り、Perl 5.001 以上で動作します。 目次 16進文字列からの変換 10進整数からの変換 2進文字列からの変換 バイナリー文字列からの変換 16進文字列→10進整数への変換 hex() 関数は、16進文字列を整数値に、手軽に変換できます。 $num10 = hex("4A"); # $num10 には 74 が入る $num10 = hex("FFFFFF"); # $num10 には 16777215 が入る 余談ですが、数値リテラル中では 0x に続けて 16 進数で記述することで、数値を表すことができます。 $num10 = 0x4A; # 74 $num10 = 0xFFFFFF; # 1677
Landscape トップページ | < 前の日 2003-08-30 2003-08-31 次の日 2003-09-01 > Landscape - エンジニアのメモ 2003-08-31 Perl で url エンコードと url デコード 当サイト内を Google 検索できます * Perl で url エンコードと url デコードこの記事の直リンクURL: Permlink | この記事が属するカテゴリ: [Perl] いろんなところで使いそうなのでメモ。 大崎さんの perl メモの URIエスケープ・アンエスケープする に詳しい。 http://www.din.or.jp/~ohzaki/perl.htm#JP_Escape - url encodesub url_encode($) { my $str = shift; $str =~ s/([^\w ])/'%'.unp
This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.
Windows上で圧縮したzipアーカイブをLinuxでunzipすると日本語が文字化けするという話は割と有名で、googleなどで検索するとこちらのブログに解決法が書いてあったり、patch済みのrpmパッケージを配布しているページがあったりするが、実はUbuntuでは(たぶんDebianも) $ []unzip -O cp932 hogehoge.zip[]と-O cp932オプションを付けるだけでよいことに気づいた。 この方法はunzipのmanpageにはのっていず、unzip -hに表示される。 一方Fedoraではwine上でArchive decoderを起動し、zipアーカイブをドラッグアンドドロップが一番簡単だろう。 02/17追記 憩いの場で野良ビルドを配布してますね。こちらを使う方が簡単でしょう。
コマンド?何それ?というGUIにどっぷり浸かったマカーがOS9からDebianへの移行を模索するブログです(^▽^) 他環境からDebianにファイルを持ってきた場合、文字コードの違いから日本語ファイル名が文字化けすることがあります。対処法としては以前このブログでも紹介した「convmv」を使い変換する方法があります。しかし、zipファイルから解凍したファイルには「convmv」で変換しても文字化けが直らないものがあります。 通常Debianでzipファイルを解凍するには「unzip」を使用します。「unzip」は解凍の際に文字コードを自動的に変換する機能を有していてるのですが、これが曲者で強制的にラテン語ベースで変換を行ってしまうらしいのです。これにより日本語のファイル名が破損し「convmv」で変換しても文字化けが直らないのです。当然これはバックエンドとして「unzip」を使用している
Unicode の雪だるま Unicode Snowman for You というサイトを知りました。Unicode の雪だるま (U+2603 SNOWMAN ☃) が表示されるだけのサイトです。が、ソースを見ると font-face で EOT 形式のウェブフォントが使われていることに気づきました。 この EOT (Embedded Open Type) 形式のウェブフォントは IE しか対応していないようです。IE で表示するとこのような雪だるまが表示されました。これはおそらく Arial Unicode MS の雪だるまです。ちょっとこわいような。。 一方、他のブラウザで表示すると、このような雪だるまが表示されました。これは私がデフォルトのフォントに設定しているメイリオの雪だるまです。これはかわいい。意外なところにも力が入っています。
ライセンスはどうなっていますか?商用利用ではどうすべきですか? † GPL か 有料のライセンスか。 2007年1月1日時点では Community : GPL Enterprise : 有料で別のライセンス GPL については http://www.gnu.org/home.ja.html をご覧ください。 ↑ mysqld が最低必要とする物 † basedir/share/ ディレクトリ以下(shareファイル。errmsg.sys や charsets/) datadir/mysql/ (mysql 権限データベース、テーブル) 権限テーブルや charsets/ がなければ mysqld は起動しない。 errmsg.sys はバージョンによって数が違うので、違うバージョンの errmsg.sys を使用していると mysqld が起動しない。 これらが起きた場合、.err ファ
重箱の隅で恐縮ですが。弾さんは (function(e){ e.innerHTML = e.innerHTML.replace( /東京都?([\u3200-\u4DBF\u4E00-\u9FFF\uF900-\uFAFF]+)/g, '首都$1東京' ) })(document.body)漢字を判定する正規表現が工夫のしどころでしょうか。[一-龠]はUnicode時代にはちょっと古い。grep CJK /usr/local/lib/perl5/5.10.0/unicore/Blocks.txtが参考資料代わりです。CJK Unified Ideographだけ欲しければ[\u4E00-\u9FFF]でも行けます。 404 Blog Not Found:javascript+regexp - ていうか首都最強東京bookmarklet とおっしゃってるけど、[\u4E00-\u9FFF]
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く