You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Documentation Download Apache Parquet is an open source, column-oriented data file format designed for efficient data storage and retrieval. It provides high performance compression and encoding schemes to handle complex data in bulk and is supported in many programming language and analytics tools.
少し前から vim で ファイルを utf-8 で保存し、そのファイルを開くと文字化けをするようになった。 必ずなるというわけではなくて、たまに起きるから始末が悪い。 文字化けはファイルを utf-8 なファイルを cp932 に変換して、開いている。 e++enc=utf-8 とすれば、utf-8 なファイルになって、文字化けが解消されるけど、 毎回毎回 コマンドで変換するのは鬱陶しい。 文字コードの認識の部分は ずん Wiki のを vimrc を書いている。 http://www.kawaz.jp/pukiwiki/?vim#cb691f26 で、ずん Wiki に以下のように記述されている。 vim の文字コード判定の仕組みは以下の通りです。 fileencodings の設定を前から順に試してはじめにマッチしたものが採用される encoding や fileencoding の設
織田信長 ぼちぼち、元気にやっています。少し薬にも慣れた...んかなぁ。相変わらず食べられないけど。朝、指がこわばって文字なんて入力できなかったけど、それはほぼなくなった。関節もどこも痛くない。薬効いてきたんやろな。 で、ブログを書こうと言う気がまた起きてきた。 …
最近、ときどきTwitterで「Python」を検索して眺めていたのだが、Pythonの分かりにくいところとして「UnicodeDecodeErrorが出てうざい」という不満をよく見かけるようだ。 確かに、Pythonでは、数字やアルファベット以外のユニコード文字を使おうとすると、対応する処理を書かなければUnicodeEncodeErrorやUnicodeDecodeErrorが出てしまう。Python3では色々改善されているのだが、Python2では分かりにくい点も多い。 このUnicodeDecodeErrorを見て、「Pythonは日本語が苦手だ」と考えてしまう人も多いだろう。確かにそう思ってしまっても仕方がないが、それは正しくない。日本人だけでなく、アメリカ人でもフランス人でもドイツ人でも、ユニコードを使う時はみんな等しく平等にこのエラーを出しているのである。 もちろん、慣れてし
単に環境変数を追加するだけで大丈夫みたい (pbcopyで日本語もコピーできるようにする - テックノート@ama-ch )。 ちゃんとテストしてないけど複数のソースでそんなことが書いてあるのを読んだので、たぶん大丈夫だと思う。下のやつは用無しになるけど一応置いておく。 やっぱ環境変数を変えるのはよくない。ターミナルから open -n /Applications/Firefox.app がエラーを吐くようになったりしてしまった。 最良の方法が見つかった。コメント欄うめさんに感謝。 alias pbcopy="nkf -w | __CF_USER_TEXT_ENCODING=0x$(printf %x $(id -u)):0x08000100:14 pbcopy" 以下は既に用無し。 UTF-8 で pbcopy/pbpaste するための Wrapper Mac OS Xの標準関数pbc
Character encoding auto-detection in Python. As smart as your browser. Open source. >>> import urllib >>> urlread = lambda url: urllib.urlopen(url).read() >>> import chardet >>> chardet.detect(urlread("http://google.cn/")) {'encoding': 'GB2312', 'confidence': 0.99} >>> chardet.detect(urlread("http://yahoo.co.jp/")) {'encoding': 'EUC-JP', 'confidence': 0.99} >>> chardet.detect(urlread("http://amazo
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く