[B! encoding] dannのブックマーク

HttpClient - Character Encodings

dann 2010/09/29

リンク

ActionScriptでの日本語文字コード変換 - Codin’ In The Free World

ActionScriptのByteArrayクラスにはreadMultiByteとwrit eMultiByteというメソッドがあり、こいつを使えば、日本語の文字コードも変換できます。ということになっているのですが、環境によって動作が不安定なようです。実際に、自分もこれらのメソッドを利用していて、 Leopardで通ってたテストがSnow Leopard(64bitモード)で実行したらこけるという場面に遭遇しました。原因(SDKのバージョンとか, JDKが64bitだとどうとか)はまだ探りきれてません。さらに、半角カナの扱いなど、日本語独特の問題もありますし、今後も適切なメンテが行われるか分かりません。 (というかそもそも、バイト列を扱う機能と、文字コードの変換を扱う機能を同じクラスにしてしまうのはいかがなものか) そんなわけで、as3jcodeを書いてみました。 http://g

dann 2010/01/22

リンク

トップ

基本的には、ここの内容をそのままGitHubに登録してpagesの設定をすれば良い。例えば「Reveal.js、Markdown、Githubでスライドを作成する。」が良くまとまっている。だが1つ謎の事象が起きて悩んだ。 index.htmlの中に、直接markdownを書く時には良いのだが、以下のようにdata-markdown属性でmdファイルを指定すると、不可思議な動作をする。 <section data-markdown="./md/firstpage.md" data-separator="\n---\n$" data-vertical="\n--\n"> <script type="text/template"> </script> </section> 最初にcommit/pushした時は表示されるものの、変更してcommit/pushしても変更が反映されなかったり、そもそも

dann 2007/12/01

リンク

HisasAnn.com is for sale | HugeDomains

Working with hugedomains.com was a quick and easy process. We got to speak to multiple real people located in Colorado without having to wait on hold! Our only complaint was we felt we had to overpay more than this particular domain was worth, and we weren't able to negotiate it down to a level that we felt was fair. However, payment and delivery were seamless, and within a few hours we had all of

dann 2007/12/01

リンク

侍ズム | Samuraism - Tomcat メモ - GET リクエストのパラメータのエンコーディング

Servlet / JSP で GET/POST パラメータを受け取るときは request#setCharacterEncoding() を事前に読んでおく。これは今時常識ですが、Tomcat でどうしても文字化けしてしまい、2時間くらいハマりました。 WebLogic ではどのバージョンでも setCharacterEncoding() で指定した文字セットでデコードしてくれるのに、Tomcat だと ISO-8859-1 として文字列が取得できてしまうという状況です。 Apache のバグデータベースにも Open 中のバグはなく、ぶらぶら調べてみたら@IT の記事に答えがありました！なんと Tomcat 5.x から GET パラメータに対しては setCharacterEncoding() が効かなくなったそうです。・@IT - Javaの文字化け対策FAQ（3）対策方法

dann 2007/12/01

encoding

リンク

エンタープライズIT日記 Tomcat(JBoss) GETで文字化け対応

dann 2007/12/01

mod_jkを使っている場合、TomcatではHTTPコネクタではなく、AJPコネクタが使われています。そして上記の設定は、AJPコネクタに対して行わなければなりません。以下のようにします。

リンク

OZACC.blog: Apache-Tomcat連携時のURL文字化け

Java | Apache-Tomcat連携時のURL文字化け The Apache Tomcat Connector - Reference Guide JkOptions ForwardURIEscaped, the forwarded URI is escaped and Tomcat (since 3.3 rc2) will do the decoding part.http://d.hatena.ne.jp/keyword/%a5%bb%a5%c3%a5%af%a5%b9%a5%d5%a5%ec%a5%f3%a5%c9 のようにURLの一部に(URLエンコードした)日本語を含むものをApache経由でTomcatに渡すと、日本語がひどく文字化けして困ったことになっていた。?name=valueのようなGETパラメータとしてなら問題なかったのだけど。で、mod_jkのドキュメ

dann 2007/12/01

リンク

Jcode->new($s,'cp932')->z2hで絵文字が化ける件 - Unknown::Programming

困ったちゃんです。絵文字を壊さずにsjis⇔utf8変換をしようと思ったわけです。でついでに全角⇔半角もやろうと思ってタイトルの通りにやってみた所、$sに絵文字が含まれていると何故か絵文字が化けるのです。なんで化けるんだ？と思ってz2h覗いてみたらびっくり仰天。なななんと一旦文字コードをeucに変換してEncode::JP::H2Zを使って全角⇔半角変換をし、元の文字コードに戻すということをやっているわけです。なんでそんな実装になってるのかというとEncode::JP::H2Zがeucを前提としているからです。 Encode::JP::H2Zがutf8前提で作られてばモウマンタイなのですが・・・。で、色々調べてみたら同じこと言ってる人もいたんだけど結局どーすんのが一番いいのかなぁと。とりあえずUnicode::Japanese使って、 use Unicode::Japanes

dann 2007/06/09

リンク

[Namazu-devel-ja 1489] Encode::Guess が複数報告する際への対応　Re: 文字 N-gram ぽい実験 (Re: フレーズ検索って N-gram ですよね

dann 2007/04/29

> という判別用テスト用プログラムです。たぶん、この程度で使い物に > なるはず。 > おそらく複数候補としてあげられるのは utf8, shiftjis, euc-jp > だろうと思うので、とりあえずこの3つだけ

リンク

Encode::JIS2K

NAME Encode::JIS2K - JIS X 0212 (aka JIS 2000) Encodings SYNOPSIS use Encode::JIS2K; use Encode qw/encode decode/; $euc_2k = encode("euc-jisx0213", $utf8); $utf8 = decode("euc-jisx0213", $euc_jp); ABSTRACT This module implements encodings that covers JIS X 0213 charset (AKA JIS 2000, hence the module name). Encodings supported are as follows. Canonical Alias Description ---------------------------

dann 2007/04/29

リンク

Thunderbirdから日本語ファイル名の添付ファイルを送信すると、Windows MailやOutlook Expressでは文字化けする理由 - WEBプログラミング NOW!

Thunderbirdから日本語ファイル名の添付ファイルを送信すると、Windows MailやOutlook Expressでは文字化けする理由 Thunderbirdから日本語ファイル名の添付ファイルを送信すると、Outlook Expressでは「ATT0437.pdf」のように「ATT」で始まる英数字のファイル名に文字化けする現象があります。この問題の原因及び解決方法は、 http://www.mozilla-japan.org/kb/solution/3067 に書いてあります。抜粋させていただくと、 Thunderbird 1.5 は、RFC 2231 と呼ばれる標準規格に準拠し、メッセージを送信する際ヘッダ (本文の前に付加されるメタ情報) に書き込む添付ファイル名の形式に変更を行いました。（・・・中略・・・）この規格に対応していないメールクライアント (Outlook、Ou

dann 2007/04/29

リンク

Error | kahua-web

Chat (Lingr.com) Inform aiton コンセプト注意事項 About Us メーリングリストコメントの入力方法 RSSの配信 Daily 今日の一行(2008-10-10) Column MySQL日本語の旅(5/1) 一風変ったHaskellλ門(6/13) SICP Answer Book (5/31) 問題3.26追加 Zope Solution Zope3 幕の内 ZopeとはなぜZopeなのか Extra JavaCube 電気の使えるカフェ情報(1/8) アーカイブ Project Looking Glass XPで楽しい人生を OSS案内所書籍の紹介技術者のブックマーク読書会、勉強会 Site Info Recent Changes アクセス統計情報関連リンク

dann 2007/04/29

リンク

Microsoft Support

All Microsoft Global Microsoft 365 Teams Copilot Windows Surface Xbox Deals Small Business Support Software Windows Apps AI Outlook OneDrive Microsoft Teams OneNote Microsoft Edge Skype PCs & Devices Computers Shop Xbox Accessories VR & mixed reality Certified Refurbished Trade-in for cash Entertainment Xbox Game Pass Ultimate PC Game Pass Xbox games PC and Windows games Movies & TV Business Micro

dann 2007/04/24

リンク

[pgsql-jp: 31881] 日本語データーのソートができない

dann 2007/04/21

●2) ロケールとエンコーディングに関する設定を調べましょう。 SELECT * FROM pg_settings WHERE name like 'lc%' or name like '%encoding'

リンク

Data::Visitor::Encode

NAME Data::Visitor::Encode - Encode/Decode Values In A Structure (DEPRECATED) SYNOPSIS # THIS MODULE IS NOW DEPRECATED. Use Data::Recursive::Encode instead use Data::Visitor::Encode; my $dev = Data::Visitor::Encode->new(); my %hash = (...); # assume data is in Perl native Unicode $dev->encode('euc-jp', \%hash); # now strings are in euc-jp $dev->decode('euc-jp', \%hash); # now strings are back in u

dann 2007/04/18

リンク

Site Cooler NZ | Points to Note When Shopping for a Washing Machine

Blog Post Featured post Sprinkle delicious dishes as a cook with gourmet cookware Continue reading Points to Note When Shopping for a Washing Machine There are different washing machines brands in New Zealand. When shopping, therefore, you need to ensure that first, you get a quality machine; a machine that will last through many years without breaking down. You check product warranties and review

dann 2007/04/13

encoding
jsp

リンク

Web アプリケーションの日本語はなぜ化ける？

文字化けは Web アプリ開発で最も頭の痛い問題のひとつです。(少なくとも日本人向けの Web アプリでは) 今回のチュートリアルでは、文字化けが発生する理由から、発生箇所の特定および文字化け解消の方法までを、理解します。なぜ、文字化けが発生するのでしょうか？そして、なぜ、その解決は難しいのでしょうか？その理由は Web システム(分散システム)特有の複雑なアーキテクチャが原因です(少なくとも私はそう思います)。ここでは、Struts アプリケーションが動作する仕組みを整理し、文字化けが発生する箇所を特定します。第１回でも簡単に触れましたが、Struts アプリケーションはユーザのアクセスに応じて下図のようにメッセージ通信を行い、アプリケーションとして動作します。「文字化け」は、これらのメッセージ通信の間で文字コードの違いが存在する場合に発生します。ユーザが Web

dann 2007/04/13

リンク

HTML::Entities使って文字化けするのはutf8フラグが立ってないから。 - ヒルズで働く@robarioの技ログ

XML::RSSを使っていて文字化けするので調べてみたら一般実体参照へ変換する場合HTML::Entitiesと言うモジュールを使います。ただし日本語を扱う場合注意が必要で、utf8フラグがたって無いと文字化けします。なるほど。とりあえずXML::RSS::_encodeを上書きしてやった。ｃ⌒っ*ﾟдﾟ)φ　ﾒﾓﾒﾓ...

dann 2007/04/09

一般実体参照へ変換する場合HTML::Entitiesと言うモジュールを使います。ただし日本語を扱う場合注意が必要で、utf8フラグがたって無いと文字化けします。

リンク

JIS X 0213:2004(JIS2004) で本当に文字化けする文字

とします。Perl で文字コードを操作する方法は、Encode.pm と旧Jcode.pm （0.8系）がメジャーどころなので、その２つについて調査しました。Encode.pm に関しては、Encode::JP と Encode::JIS2K を対象としました。まず結論から。Encode::JIS2K を使う限り、文字化けする SJIS コードは以下の３５文字です。 JIS2004 で追加された１０文字：879F 889E 9873 989E EAA5 EFF8 EFF9 EFFA EFFB EFFC カ行に半濁音（゜）を付けた文字など一部の文字： 82f5 82f6 82f7 82f8 82f9 8397 8398 8399 839a 839b 839c 839d 839e 83f6 8663 8667 8668 8669 866a 866b 866c 866d 866e 8685 8

dann 2007/04/05

リンク

Vista で導入される JIS X 0213:2004(JIS2004) のまとめ（お勉強編）

「日本語文字セットがVista最大の問題として急浮上：ITpro」　が初めのネタになったのですが、なかなか時間もとれず、この記事を書き始めてはや３週間も経ってしまいました・・・orz Windows Vistaは、新しい文字セットに関するJIS規格「JIS X 0213:2004」に準拠した日本語フォントを標準で搭載する。これにより、既存の漢字のうち122文字の字形が変更になり、約900文字の漢字、約200文字の非漢字（英語の発音記号や記号、アイヌ文字など）が新たに表示可能になる。〜中略〜さらに、追加される新しい文字の一部をUnicodeで表現すると、通常の2バイトではなく4バイトで表現されるものがある。をみて、SJIS → UTF-8 → SJIS とかやると文字化けするものとかでるじゃん！大丈夫だっけ？大丈夫じゃなかったら、どんな対策をとったらいいんだっけ？ってのを考察しています

dann 2007/04/05

encoding

リンク

はてなブックマーク

タグ

関連タグで絞り込む (26)

encodingに関するdannのブックマーク (37)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス