マニアックだが便利そうなのでご紹介。 プログラミング言語のPythonを使う人なら「バージョン2でいくべきか、3でいくべきか?」と一度は悩んだことがあるだろう(でもない?)。 そうしたときに使えるのがCan I use Python3?だ。 このサイトではDjangoなどのPython系フレームワークやツールがPython3で使えるかどうかを教えてくれる。 この情報をもとに開発方針を決めてもいいのではなかろうか。覚えておいてもいいですな。

Microsoft Office Wordファイルの検索クローラをPythonで作成する際、表題の通り、*.docからテキストデータに変換する必要がある。本記事ではwin32comライブラリを用いてPythonスクリプトからWordファイルのテキストデータを抽出するスクリプトを紹介する。 (尚、世には多数のOfficeファイルコンバーターが有るので、このソースを使うことが最適とは限らない) ソースコード エラーハンドリングは必要最低限である為、扱うファイル特性に応じて追加が必要な場合もある。 # coding: Shift_JIS import win32com.client def word2text(file_path): text = "" doc = win32com.client.gencache.EnsureDispatch("Word.Application") doc.Vi
Pythonを使ってこの方さまざまな点につまずいたが、ここではそんなトラップを回避して快適なPython Lifeを送っていただくべく、書き始める前に知っておけばよかったというTipsをまとめておく。 Python2系と3系について Pythonには2系と3系があり、3系では後方互換性に影響のある変更が入れられている。つまり、Python3のコードはPython2では動かないことがある(逆もしかり)。 Python3ではPython2における様々な点が改善されており、今から使うなら最新版のPython3で行うのが基本だ(下記でも、Python3で改善されるものは明記するようにした)。何より、Python2は2020年1月1日をもってサポートが終了した。よって今からPython2を使う理由はない。未だにPython2を使う者は、小学生にもディスられる。 しかし、世の中にはまだPython3に
pystone benchmark PythonJS using the dart backend is 6x faster than CPython. pystone.py nbody benchmark PythonJS using the fast javascript backend is faster than CPython and even 2x faster than PyPy. nbody.py richard's benchmark PythonJS using the dart backend is 7x faster than CPython. richards.py float benchmark PythonJS using the dart backend is 3x faster than CPython. float.py Micro-Benchmarks
何度かBeautifulSoupについては書いているのですが、未だに使い方が覚えられずにイライラします。仕方が無いのでまとめて置く事にしました。BeautifulSoupはHTMLから情報を取得するだけ無く、HTMLの編集もできますが、ここではスクレイピング用途のみに絞っています。 使用するのは以下のHTMLです。 このHTMLを使って色々と情報を取得したのが以下です。覚えるべきはfindAllだけです。注意する必要があるのは、textを指定した場合にタグオブジェクトが取れずに、テキストオブジェクトが取れるので、一旦parentで親のタグ取りましょうという事と、正規表現で条件指定する場合は、re.compileで正規表現オブジェクトを渡すという事位ですか。 #!/usr/bin/python # -*- coding: utf-8 -*- import re import urllib f
Beautiful Soup¶ Beautiful Soup は、 HTMLおよびXMLファイルからデータを抽出するためのPythonライブラリです。 お気に入りのパーサー(構文解析器)と連携して、パースツリー(構文木)のナビゲート、検索、修正を行うための慣用的な方法を提供します。 これにより、プログラマーは数時間から数日分の作業を節約することがよくあります。 (訳注) 石鹸は食べられない¶ この文章は Beautiful Soup 4.12.0 Documentation の日本語訳です。 以前、”Beautiful Soup”を”ビューティフルソープ”と読んでしまう英語が苦手でちょっぴりHな後輩のために Beautiful Soup 4.2.0 Documentation を翻訳しました。それから10年が経ち、内容が古くなったので、2024年8月時点で最新のドキュメントをあらためて訳し
概要¶ これは Google Python Style Guide Revision 2.29 を日本語に訳したものです。 本家ガイドは CC-By 3.0 ライセンス の基で公開されています。また、本ガイドも同ライセンスを継承します。 本家ガイドの著者は以下の通りです。 Amit Patel Antoine Picard Eugene Jhong Jeremy Hylton Matt Smart Mike Shields また、本ガイドの翻訳者は以下の通りです。 Kosei Kitahara 本ガイドに誤植、誤訳があった場合は issue で教えてください。 その他本ガイドに関する問い合わせは、サイト最下部に記載のメールアドレスか @Surgo にお願いします。 はじめに¶ Python は Google で使われている主要なスクリプト言語です。 このスタイルガイドは Python によ
Python coding rules and tips used in Cybozu. We believe that this is minimal but just enough for most teams using Python! Coding rules Use python 2.7. Note that Python 3.x is not compatible with Python 2.x. Standard modules can be used freely without permission. Our modules should be defined as sub-modules of cybozu module. Use 4 spaces for indents. Do not use tabs. Use LF (0x0a) as end-of-line c
長々書く前に結論から言うと、良い!! 間違いなく良書です。 この本はその名の通りPythonの本で、Python3を用いてPythonの解説を行なっています。 この記事を書いている時点で、ほとんどのCGソフトはPython2系しか対応していないため、CG屋さん的にはちょっとどうなの?と思われるかもしれません。 ですがこの本にもある通り、いずれは全てが3系に統一されます。 現在2系は2.7が最新バージョンですが、同時にこれは2系の最終バージョンと確定しているため、今後2系は保守などのために存続されるのみとなります。 遅かれ早かれいずれはCGソフトも3系に移行されると思うので、予習も兼ねて読んでみるのもいいかもしれません。 個人的には、3系が出てしばらく経つのに全くのノータッチだったので少しもぞもぞしていたところで、個人的には非常にナイスタイミングでした。 この本の対象は、Pythonのエキス
米Dropboxは4月3日、オープンソースのPython実装「Pyston」を発表した。LLVMのJITエンジンを利用するPython実装で、より高いパフォーマンスを目指すという。 PystonはLLVMおよびLLVMのJIT(Just In Time)実行エンジンを使用して構築されたPython実装。Python 2.7互換の実装で、現時点ではx86_64プラットフォームでのみ動作し、動作テストはUbuntuで行っているという。 パースされたPythonコードをLLVMの中間表現(IR)に変換し、LLVMのオプティマイザを経てLLVM JITエンジンで実行可能なコードを生成する。LLVMには最適化パスなど最適化のための仕組みが多数含まれており、高速なコードを精製できるとしている。現時点での性能については「CPythonよりも上だがPyPyよりは劣る」と報告されている。 Dropboxでは
CheckiOを始めて3週間。1日1~2問のペースで、ほぼ毎日続いている。 現在のステータスはこんな感じ。 レベル 10 経験値 1139 クリアしたミッション 29 集めたバッジ 8 http://www.checkio.org/user/natsuki/ CheckiOのここがイイ やってて楽しい よくプログラミングの本に、章末の例題が付いてたりするが、ああいうのってやったことがない。じゃあ、なんでCheckiOだと毎日やってしまうのか考えてみると、 問題を解くと経験値がもらえて、レベルアップしていくのが嬉しい 経験値を貯めると、新しく行ける場所が増えるのも嬉しい 自分の解答を他の人に「いいね!」されると嬉しい 我ながら単純だなぁと思うけど、本当にこんなもんで、やる気が出るのだから人間って面白い。 他の人の解答がとても参考になる CheckiOでは、まず自分で解いてからでないと、他の人
2016-12-09追記 「Pythonクローリング&スクレイピング」という本を書きました! Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド- 作者: 加藤耕太出版社/メーカー: 技術評論社発売日: 2016/12/16メディア: 大型本この商品を含むブログを見る 2015年6月21日 追記: この記事のクローラーは動かなくなっているので、Scrapy 1.0について書いた新しい記事を参照してください。 2014年1月5日 16:10更新: デメリットを修正しました。 以下の記事が話題になっていたので、乗っかってPythonの話を書いてみたいと思います。 Rubyとか使ってクローリングやスクレイピングするノウハウを公開してみる! - 病みつきエンジニアブログ 複数並行可能なRubyのクローラー、「cosmicrawler」を試してみた - プログラマにな
http://www.amazon.co.jp/gp/product/4873116554?ie=UTF8&camp=1207&creative=8411&creativeASIN=4873116554&linkCode=shr&tag=kinnekosblog-22 NumPy、SciPy、pandas、matplotlibをはじめ、高機能で使いやすい数学・科学計算用ライブラリが充実しているPythonは、データサイエンス分野での利用が急速に広がっています。 従来高価な商用ツールでしか提供されていなかった機能がオープンソースツールで行えるとあって、プログラマだけでなく、大量のデータを処理する金融アナリストやデータ解析を行う研究者たちの間でもPython人気は高まる一方です。 本書はPythonの代表的なデータ解析用ツール、pandasのメイン開発者による、Pythonでデータサイエンスを
訳者まえがき まえがき 1章 はじめに 1.1 この本で説明する内容 1.2 なぜPythonはデータ分析者におすすめなのか 1.2.1 「糊(グルー)」としてのPython 1.2.2 「2つの言語を利用する」ことの問題を解決する 1.2.3 Pythonを使わない場合 1.3 本書で扱う重要なPythonライブラリ 1.3.1 NumPy 1.3.2 pandas 1.3.3 matplotlib 1.3.4 IPython 1.3.5 SciPy 1.4 インストールとセットアップ 1.4.1 Windows 1.4.2 Apple OS X 1.4.3 GNU/Linux 1.4.4 Python 2とPython 3の相違点 1.4.5 統合開発環境(IDE) 1.5 コミュニティとカンファレンス(会議) 1.6 この本の読み方の案内 1.6.1 コード例 1.6.2 例として用
PostgreSQL Advent Calendar 2013 12/11 です。 DBに格納したデータに対して機械学習のアルゴリズムを適用したくなったとします。 DBからデータを出力して他のプログラム言語で処理してもいいのですが、PostgreSQLで処理が完結した方が便利なこともあるでしょう。 しかし、PostgreSQLで処理するために機械学習のアルゴリズムを一から自分で実装するのは大変です。 PL/Pythonを使えば、pythonで書かれたライブラリを利用して手軽に機械学習を行うことができます。 また、pythonの機械学習ライブラリはC言語で書かれていることが多いので、速度面でも悪くないです。 インストール PL/Python PostgreSQLをソースコードからインストールしている場合は、configureのオプションに--with-pythonをつけてビルドします。 今回
これまでデータ・サイエンティストの選ぶプログラミング言語はRだったのだが、急激にPythonに置き換わろうとしている。 このシフトの理由はいくつかあるようだが、第一にはPython自体が汎用的で比較的学びやすい言語であるのに対し、Rが習得するにあたってやや複雑であることがあげられるだろう。 データにますます依存しつつある現代社会とデータに飢えたサイエンティストにとっては「簡単さ」こそが鍵となるのだ。 Rは実際にはプログラミング言語ではないRを覚えることに苦労する人が多い理由として考えられるのは、Rが実際にはプログラミング言語ではないからかもしれない。R専門家のジョン・クックいわく、Rとは「統計のためのインタラクティブな環境」であり、厳密にはプログラミング言語ではないのだ。彼はさらに「Rをプログラミング言語だと考るのではなく、Rがプログラミング言語を内包しているのだと考えた方が良いと分かった
Bokeh documentation# Bokeh is a Python library for creating interactive visualizations for modern web browsers. It helps you build beautiful graphics, ranging from simple plots to complex dashboards with streaming datasets. With Bokeh, you can create JavaScript-powered visualizations without writing any JavaScript yourself. Finding the right documentation resources# Bokeh’s documentation consists
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く