ActionScriptのByteArrayクラスにはreadMultiByteとwriteMultiByteというメソッドがあり、 こいつを使えば、日本語の文字コードも変換できます。 ということになっているのですが、環境によって動作が不安定なようです。 実際に、自分もこれらのメソッドを利用していて、 Leopardで通ってたテストがSnow Leopard(64bitモード)で実行したらこけるという場面に遭遇しました。 原因(SDKのバージョンとか, JDKが64bitだとどうとか)はまだ探りきれてません。 さらに、半角カナの扱いなど、日本語独特の問題もありますし、今後も適切なメンテが行われるか分かりません。 (というかそもそも、バイト列を扱う機能と、文字コードの変換を扱う機能を同じクラスにしてしまうのはいかがなものか) そんなわけで、as3jcodeを書いてみました。 http://g
基本的には、ここの内容をそのままGitHubに登録してpagesの設定をすれば良い。例えば「Reveal.js、Markdown、Githubでスライドを作成する。」が良くまとまっている。だが1つ謎の事象が起きて悩んだ。 index.htmlの中に、直接markdownを書く時には良いのだが、以下のようにdata-markdown属性でmdファイルを指定すると、不可思議な動作をする。 <section data-markdown="./md/firstpage.md" data-separator="\n---\n$" data-vertical="\n--\n"> <script type="text/template"> </script> </section> 最初にcommit/pushした時は表示されるものの、変更してcommit/pushしても変更が反映されなかったり、そもそも
Working with hugedomains.com was a quick and easy process. We got to speak to multiple real people located in Colorado without having to wait on hold! Our only complaint was we felt we had to overpay more than this particular domain was worth, and we weren't able to negotiate it down to a level that we felt was fair. However, payment and delivery were seamless, and within a few hours we had all of
Servlet / JSP で GET/POST パラメータを受け取るときは request#setCharacterEncoding() を事前に読んでおく。 これは今時常識ですが、Tomcat でどうしても文字化けしてしまい、2時間くらいハマりました。 WebLogic ではどのバージョンでも setCharacterEncoding() で指定した文字セットでデコードしてくれるのに、Tomcat だと ISO-8859-1 として文字列が取得できてしまうという状況です。 Apache のバグデータベースにも Open 中のバグはなく、ぶらぶら調べてみたら@IT の記事に答えがありました! なんと Tomcat 5.x から GET パラメータに対しては setCharacterEncoding() が効かなくなったそうです。 ・@IT - Javaの文字化け対策FAQ(3) 対策方法
Java | Apache-Tomcat連携時のURL文字化け The Apache Tomcat Connector - Reference Guide JkOptions ForwardURIEscaped, the forwarded URI is escaped and Tomcat (since 3.3 rc2) will do the decoding part.http://d.hatena.ne.jp/keyword/%a5%bb%a5%c3%a5%af%a5%b9%a5%d5%a5%ec%a5%f3%a5%c9 のようにURLの一部に(URLエンコードした)日本語を含むものをApache経由でTomcatに渡すと、日本語がひどく文字化けして困ったことになっていた。?name=valueのようなGETパラメータとしてなら問題なかったのだけど。 で、mod_jkのドキュメ
困ったちゃんです。 絵文字を壊さずにsjis⇔utf8変換をしようと思ったわけです。 でついでに全角⇔半角もやろうと思ってタイトルの通りにやってみた所、$sに絵文字が含まれていると何故か絵文字が化けるのです。 なんで化けるんだ?と思ってz2h覗いてみたらびっくり仰天。 なななんと一旦文字コードをeucに変換してEncode::JP::H2Zを使って全角⇔半角変換をし、元の文字コードに戻すということをやっているわけです。 なんでそんな実装になってるのかというとEncode::JP::H2Zがeucを前提としているからです。 Encode::JP::H2Zがutf8前提で作られてばモウマンタイなのですが・・・。 で、色々調べてみたら同じこと言ってる人もいたんだけど結局どーすんのが一番いいのかなぁと。 とりあえずUnicode::Japanese使って、 use Unicode::Japanes
NAME Encode::JIS2K - JIS X 0212 (aka JIS 2000) Encodings SYNOPSIS use Encode::JIS2K; use Encode qw/encode decode/; $euc_2k = encode("euc-jisx0213", $utf8); $utf8 = decode("euc-jisx0213", $euc_jp); ABSTRACT This module implements encodings that covers JIS X 0213 charset (AKA JIS 2000, hence the module name). Encodings supported are as follows. Canonical Alias Description ---------------------------
Thunderbirdから日本語ファイル名の添付ファイルを送信すると、Windows MailやOutlook Expressでは文字化けする理由 Thunderbirdから日本語ファイル名の添付ファイルを送信すると、Outlook Expressでは「ATT0437.pdf」のように「ATT」で始まる英数字のファイル名に文字化けする現象があります。この問題の原因及び解決方法は、 http://www.mozilla-japan.org/kb/solution/3067 に書いてあります。抜粋させていただくと、 Thunderbird 1.5 は、RFC 2231 と呼ばれる標準規格に準拠し、メッセージを送信する際ヘッダ (本文の前に付加されるメタ情報) に書き込む添付ファイル名の形式に変更を行いました。(・・・中略・・・)この規格に対応していないメールクライアント (Outlook、Ou
Chat (Lingr.com) Informaiton コンセプト 注意事項 About Us メーリングリスト コメントの入力方法 RSSの配信 Daily 今日の一行(2008-10-10) Column MySQL日本語の旅(5/1) 一風変ったHaskellλ門(6/13) SICP Answer Book (5/31) 問題3.26追加 Zope Solution Zope3 幕の内 Zopeとは なぜZopeなのか Extra JavaCube 電気の使えるカフェ情報(1/8) アーカイブ Project Looking Glass XPで楽しい人生を OSS案内所 書籍の紹介 技術者のブックマーク 読書会、勉強会 Site Info Recent Changes アクセス統計情報 関連リンク
All Microsoft Global Microsoft 365 Teams Copilot Windows Surface Xbox Deals Small Business Support Software Windows Apps AI Outlook OneDrive Microsoft Teams OneNote Microsoft Edge Skype PCs & Devices Computers Shop Xbox Accessories VR & mixed reality Certified Refurbished Trade-in for cash Entertainment Xbox Game Pass Ultimate PC Game Pass Xbox games PC and Windows games Movies & TV Business Micro
NAME Data::Visitor::Encode - Encode/Decode Values In A Structure (DEPRECATED) SYNOPSIS # THIS MODULE IS NOW DEPRECATED. Use Data::Recursive::Encode instead use Data::Visitor::Encode; my $dev = Data::Visitor::Encode->new(); my %hash = (...); # assume data is in Perl native Unicode $dev->encode('euc-jp', \%hash); # now strings are in euc-jp $dev->decode('euc-jp', \%hash); # now strings are back in u
Blog Post Featured post Sprinkle delicious dishes as a cook with gourmet cookware Continue reading Points to Note When Shopping for a Washing Machine There are different washing machines brands in New Zealand. When shopping, therefore, you need to ensure that first, you get a quality machine; a machine that will last through many years without breaking down. You check product warranties and review
文字化けは Web アプリ開発で最も頭の痛い問題のひとつです。(少なくとも日本人向けの Web アプリでは) 今回のチュートリアルでは、文字化けが発生する理由から、発生箇所の特定および文字化け解消の方法までを、理解します。 なぜ、文字化けが発生するのでしょうか?そして、なぜ、その解決は難しいのでしょうか? その理由は Web システム(分散システム)特有の複雑なアーキテクチャが原因です(少なくとも私はそう思います)。 ここでは、Struts アプリケーションが動作する仕組みを整理し、文字化けが発生する箇所を特定します。 第1回でも簡単に触れましたが、Struts アプリケーションは ユーザのアクセスに応じて下図のようにメッセージ通信を行い、アプリケーションとして動作します。 「文字化け」は、これらのメッセージ通信の間で文字コードの違いが存在する場合に発生します。 ユーザが Web
とします。Perl で文字コードを操作する方法は、Encode.pm と旧Jcode.pm (0.8系)がメジャーどころなので、その2つについて調査しました。Encode.pm に関しては、Encode::JP と Encode::JIS2K を対象としました。 まず結論から。Encode::JIS2K を使う限り、文字化けする SJIS コードは以下の35文字です。 JIS2004 で追加された10文字:879F 889E 9873 989E EAA5 EFF8 EFF9 EFFA EFFB EFFC カ行に半濁音(゜)を付けた文字など一部の文字: 82f5 82f6 82f7 82f8 82f9 8397 8398 8399 839a 839b 839c 839d 839e 83f6 8663 8667 8668 8669 866a 866b 866c 866d 866e 8685 8
「日本語文字セットがVista最大の問題として急浮上:ITpro」 が初めのネタになったのですが、なかなか時間もとれず、この記事を書き始めてはや3週間も経ってしまいました・・・orz Windows Vistaは、新しい文字セットに関するJIS規格「JIS X 0213:2004」に準拠した日本語フォントを標準で搭載する。これにより、既存の漢字のうち122文字の字形が変更になり、約900文字の漢字、約200文字の非漢字(英語の発音記号や記号、アイヌ文字など)が新たに表示可能になる。 〜中略〜 さらに、追加される新しい文字の一部をUnicodeで表現すると、通常の2バイトではなく4バイトで表現されるものがある。 をみて、SJIS → UTF-8 → SJIS とかやると文字化けするものとかでるじゃん!大丈夫だっけ?大丈夫じゃなかったら、どんな対策をとったらいいんだっけ?ってのを考察しています
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く