サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
パリ五輪
hirothin.hatenadiary.org
Pythonのコードをテストする時はコマンドプロンプト上で実行結果を確認しながらの作業をしているんだけど、ある実行結果を表示する部分で UnicodeEncodeError: 'cp932' codec can't encode character u'\u2014' in position 21: illegal multibyte sequence というエラーで失敗する。 どうやら文字エンコーディングの関係だという事は分かったが、どうすれば解決するのか分からない。。。 そこで、色々調べていたら[Java]文字エンコーディング毎のUnicodeマッピングの違いについて。という場所にたどり着き、そこにあった表を引用させて貰うと、 字形 ¢ £ ¬ ‖ − 〜 ― 〜(JIS X 0212) マッピング Windows-31J, MS932 \uFFE0 \uFFE1 \uFFE2 \u2
今の仕事で、RSS形式のURL一覧から指定文字列が見つかるリンクのみを抽出する処理を全てC++で1件ずつダウンロードして、本文から検索してっていうアプローチでとてもパフォーマンスが悪い。 だから、ダウンロードせずにサーバー側で抽出を行って、その結果だけを返すようにしようと考えている。 しかも高速にしなければならない。 そこで、PythonからXMLを扱うために色々調べてたら、二十代は模索のときブログさんの所に有益な情報があったので、メモさせて貰います。 PythonでXMLを扱う(1) PythonでXMLを扱う(2) PythonでXMLを扱う(3) PythonでXMLを扱う(4) PythonでXMLを扱う(5) PythonでXMLを扱う(6) PythonでXMLを扱う(7) PythonでXMLを扱う(8)
このページを最初にブックマークしてみませんか?
『hirothin.hatenadiary.org』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く