海外ドラマが好き♪:日本語テストやってみない? など、いろんなところで書かれているのを見て、私もやってみました。 ATOK & 一太郎 presents 第二回全国一斉!日本語テスト 結果は…84点。結構いいですよね。 まあ、各所で微妙にネタばれしている部分があって、 それに助けられた部分はあるのですが…。 で、ふと思ったのが、こんな問題。 問題:次の漢字の読みになるように、解答欄「□」をかなでうめよ。 問題
とします。Perl で文字コードを操作する方法は、Encode.pm と旧Jcode.pm (0.8系)がメジャーどころなので、その2つについて調査しました。Encode.pm に関しては、Encode::JP と Encode::JIS2K を対象としました。 まず結論から。Encode::JIS2K を使う限り、文字化けする SJIS コードは以下の35文字です。 JIS2004 で追加された10文字:879F 889E 9873 989E EAA5 EFF8 EFF9 EFFA EFFB EFFC カ行に半濁音(゜)を付けた文字など一部の文字: 82f5 82f6 82f7 82f8 82f9 8397 8398 8399 839a 839b 839c 839d 839e 83f6 8663 8667 8668 8669 866a 866b 866c 866d 866e 8685 8
「日本語文字セットがVista最大の問題として急浮上:ITpro」 が初めのネタになったのですが、なかなか時間もとれず、この記事を書き始めてはや3週間も経ってしまいました・・・orz Windows Vistaは、新しい文字セットに関するJIS規格「JIS X 0213:2004」に準拠した日本語フォントを標準で搭載する。これにより、既存の漢字のうち122文字の字形が変更になり、約900文字の漢字、約200文字の非漢字(英語の発音記号や記号、アイヌ文字など)が新たに表示可能になる。 〜中略〜 さらに、追加される新しい文字の一部をUnicodeで表現すると、通常の2バイトではなく4バイトで表現されるものがある。 をみて、SJIS → UTF-8 → SJIS とかやると文字化けするものとかでるじゃん!大丈夫だっけ?大丈夫じゃなかったら、どんな対策をとったらいいんだっけ?ってのを考察しています
昨日(7日)、辺見庸氏の講演会「個体と状況について~改憲と安倍政権」(明治大学アカデミーコモン・ホール)に参加した。開場30分前には100人近い列ができる盛況ぶりで、バッハが流れる中、辺見氏が麻痺した右半身を引きずるように登場すると、大きな拍手が湧き起こった。 脳出血後のリハビリに励みつつ、抗がん剤も服用されている辺見氏は、副題の「○○の固有名詞」(我々の飼い犬と揶揄されていた)を口にすると体調が悪化すると話し、笑いを誘っていた。辺見氏は以下に留意し、闘病生活を送っているという。第1は<今が最終到達点と考え、今という永遠に生きる>、第2は<自分の内面の声に耳を澄まし、承認できないことは拒む>、第3は<単独者として生きる>……。この3点は今回の講演の基調になっていた。 第1章は<言葉と記憶の死>である。ここ数年、自衛隊出兵、共謀罪、教育基本法と憲法の改悪と状況は悪化しているが、根底にあるのは
私は、ソーシャルブックマーク(以下SBM)として、はてなブックマークとLivedoorClipの両方を使ってます。 はてなブックマークは完全にプライベートモードで、仕事関連のページをクリップしています。「あのトラブル、どうやって解決するんだっけ」という場合に、タグの絞込みで簡単にその情報を探せるので、かなり重宝してます。 LivedoorClipの方は基本的に公開。ただ、今から書く記事のモトネタページなど、公開したくないものがある場合は、個別にプライベートにしてます。 (LivedoorClipにした一番の理由がこの「個別に非公開」の機能です) で、メインの目的は「コメント管理」コメントしたところに「commented」タグをつけて、たまに反応をチェックしたり…。 SBMなどで行われるタグ付けによる情報の管理は、ある目的を持ってクリップした情報を探し出すのにはすごく向いていると思います。
Text::MeCabは導入が楽 2006-09-24-3 [Programming][NLP] Text::MeCabはCPANに登録されているMeCabのPerlモジュール。 - Daisuke Maki / Text-MeCab-0.13 - search.cpan.org http://search.cpan.org/~dmaki/Text-MeCab-0.13/ - きまぐれ日記: Text::MeCab が公開された http://chasen.org/~taku/blog/archives/2006/05/textmecab.html MeCab.pm [2006-02-25-4]よりもこっちの方がインストールが 手軽そうなので、サンプルプログラムに使おうかと。 インストール方法: MaCab本体は事前にインストールしてあると仮定。 (取得はこちらから→
本日、キーワード名とふりがなが対になっている、はてなダイアリーキーワードふりがなリストを公開しました。ユーザー様が独自に作成されている辞書などで、名詞の読み仮名などでご活用いただくと便利かと思います。 以下のURLを右クリックでファイルに保存してご覧ください。 http://d.hatena.ne.jp/images/keyword/keywordlist_furigana.csv http://d.hatena.ne.jp/images/keyword/keywordlist_furigana_with_kid.csv (キーワードID つき) ※タブ区切りの csv 形式、文字エンコードは EUC で改行コードは LF となっております。 ※ファイルサイズが本日現在 4M 強ほどあります。ブラウザで開く際はご注意下さい。 このリストをは定期的に最新情報に更新しています。どうぞご利用下さ
こんにちは、ジュンヤです。 30歳を超えたあたりで急速に脳が老化し始め、物事をすぐ忘れるようになってしまいました。歌手やタレントの名前なんかはなかなか出てきません。若いウノウの他のつわものプログラマーはviやEmacsでコードを書いていたりしますが、僕の場合は、補完機能が優れたIDEでないともうだめです。 というわけで、補完機能が充実した最強の IDE を追い求めてみました。環境は Windows XP です。 Eclipse 最近 Aptana という Web エディタが良いと聞いたので、まずはこれから用意します。Aptana は Eclipse をベースに開発されていて、スタンドアロン版と Eclipse のプラグイン版があるのですが、他にも使いたい IDE があるので、Eclipse をまずインストールした上で、プラグインで拡張していくことにします。 Eclipse はeclipse
MySQL 4.1.x な環境で phpMyAdmin を EUC-JP で使う方法 2006-06-17-1: [MySQL][PHP] MySQL 4.1.x から文字コード関係のトラブルが多いみたい. phpMyAdmin を使ってみたら,EUC-JP に設定して,phpMyAdmin の言語を「日本語 - Japanese (euc)」にしても, 画面は文字化けするし,「MySQL の文字セット」も UTF-8 Unicode (utf8) のままで,データの挿入などが行えない. そこで,ちょっと強引に,phpMyAdmin のファイルを書き換えることにする. - phpMyAdmin/libraries/database_interface.lib.php function PMA_DBI_postConnect($link, $is_controluser = false) :
前回の記事について、説明が不足していたようで、404 Blog Not Found様からmultipart/form-data を忘れている とお叱りを頂いてしまいました。 えっと、誤解です。 multipart/form-dataを使っても状況はまったく変わらないことが分かったので説明を省略しただけです。 誤解をとくために前回の調査結果を簡単にまとめさせてください。 ・Webの世界でEUCといったらCP51932がデファクトスタンダードである ・これは本来のEUCから補助漢字をなくして、かわりにWindows機種依存文字を 追加したものである。 ・しかし、FirefoxだけはCP51932+補助漢字という独自拡張EUCを採用している。 ・これはURL Encoding の%エスケープを解いたあとのデータが補助漢字に ついて生EUCとするか、数値文字参照とするか、という違いとして現れてくる
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く