[B! Python] kimutanskのブックマーク

kimutansk id:kimutansk

Pythonに関するkimutanskのブックマーク (29)

How to define UDAF over event-time windows in PySpark 2.1.0
kimutansk 2017/12/08
リンク先からもわかりますが、やはり2.2系の時点だとSparkの世界のみでPythonでUDAF開発は無理か。aggにカラムと関数渡すことで、基本的な集計はカラム別に可能ではありますが。

spark

python
リンク
Efficient UD(A)Fs with PySpark
Nowadays, Spark surely is one of the most prevalent techno logies in the fields of data science and big data. Luckily, even though it is developed in Scala and runs in the Java Virtual Machine (JVM), it comes with Python bindings also known as PySpark, whose API was heavily influenced by Pandas. With respect to functionality, modern PySpark has about the same capabilities as Pandas when it comes to
kimutansk 2017/10/30
Pyspark、UDAF書くためにはScalaで書かなければいけないので面倒だなぁ、と思ってましたが、Pandasに変換すれば一応できるわけですか。やりたいかはさておき。

spark

python
リンク
Usage of Python 2.7 version in Pyspark
kimutansk 2017/05/10
PYSPARK_PYTHON、PYSPARK_DRIVER_PYTHON、SPARK_YARN_USER_ENVの環境変数でPyspark用のPythonのパスが設定できますか。

Python

spark
リンク
AWS Release Notes
Your profile helps improve your interactions with select AWS experiences.
kimutansk 2017/04/19
おー、ついにLambdaでデフォルトでPython3.6が使用可能に。今までも強引に入れることは可能でしたが、何か間違っている感がありましたからねぇ。

lambda

AWS

Python
リンク
Grumpy: Go running Python!
The latest news from Google on open source releases, major projects, events, and student outreach programs. Google runs millions of lines of Python code. The front-end server that drives youtube.com and YouTube’s APIs is primarily written in Python, and it serves millions of requests per second! YouTube’s front-end runs on CPython 2.7, so we’ve put a ton of work into improving the runtime and adap
kimutansk 2017/01/05
CPythonのランタイムの並行実行性能に問題があったからGoランタイム上でPythonを実行可能にして、Goモジュールも読めると。Go＞Python呼び出しで、Goランタイム上で実行できる流れもある・・？

python

golang
リンク
Cloudera Blog
Cloudera customers run some of the biggest data lakes on earth. These lakes power mission critical large scale data analytics, business intelligence (BI), and machine learning use cases, including enterprise data warehouses. In recent years, the term “data lakehouse” was coined to describe this architectural pattern of tabular analytics over data in the data lake. […] Read blog post
kimutansk 2016/02/18
Apache ArrowでJVMプロセスと非JVMプロセス間がよりシームレスになると。ここで普通にArrow出ますか。カラムナメモリデータストアフォーマットとして様々な言語で発展する勢い？

Arrow

Python

Spark
リンク
非公開サイト
サイトの構築。作品の販売。ブログの投稿。この他にもさまざまな機能があります。ログインサイトをはじめよう非公開サイトこのサイトは現在プライベート設定になっています。
kimutansk 2014/01/19
python

プログラミング

機械学習
リンク
botoライブラリのインストールをしようとしたらeasy_installがhard_installになった - orenoblog
こんばんはブータです。 Macにbotoライブラリをeasy_installでインストールして遊んでみようと思ったところ、スタックトレースが・・・ $ sudo easy_install boto Traceback (most recent call last): File "/usr/bin/easy_install-2.7", line 10, in <module> load_entry_point('setuptools==0.6c12dev-r85381', 'console_scripts', 'easy_install')() File "/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/pkg_resources.py", line 318, in load_entry_
kimutansk 2013/12/16
見事に一度はまったので・・　setuptools入れたらこんな症状になりましたね

python

library
リンク
GitHub - hannes-brt/hebel: GPU-Accelerated Deep Learning Library in Python
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
kimutansk 2013/12/10
GPUを活用できる自然言語処理用のPythonライブラリ、と。Pythonから実際に活用できるなら、中々大きいです。

GPU

DeepLearning

python
リンク
Pythonista も �ls を読むべきか？
Python Developers Festa 2013.11 での発表資料です。 https://github.com/pyspa/pyfes/blob/develop/201311.rst 性能計測結果は Solaris 系の OpenIndiana 151a 上で実施したものですので、他の OS の場合は異なる傾向となる可能性もあります。 Read less
kimutansk 2013/12/02
Linux

Mercurial

performance

python
リンク
RubyとPythonの違いからガベージコレクタを理解する - ワザノバ | wazanova.jp
http://patshaughnessy.net/2013/10/24/visualizing-garbage-collection-in-ruby-and-python Pat Shaughnessyが、ブタペストで開催されたRUPY2013でのプレゼンの前半を自らのブログで紹介しています。ガベージコレクタは、「ゴミを集める」という行為だけでなく、「新しいオブジェクトのためにメモリをあてがう。」「不要なオブジェクトを見つける」「不要なオブジェクトからメモリを取り戻す。」という、人間の心臓が血液を浄化するような働きをしている。この簡単なコードサンプルを見ると、RubyとPythonの記述はよく似ているが、それぞれの言語の内部でのインプリの仕組みは違う。 1) Rubyのメモリ Rubyは、コードが実行される前に、数千のオブジェクトを先につくり、それをリンクされたfree listに置
kimutansk 2013/10/28
Ruby側は知っていましたが、Pythonは参照カウント方式のガベージコレクタだったんですねぇ。こういう違いがありましたか。

python

Ruby
リンク
Pythonで複数プロセスたちあげて結果を非同期で処理する - Study08.net 対シンバシ殲滅用人型機動兵器
python で複数プロセス立ち上げてそれぞれのコマンドの結果を非同期に処理するのどうやったらいいんだろ— ねじめ (@drillbits) October 3, 2013 ていうのを見かけたので殺伐とした心を癒すためにやってみる心。やりたい事 Pythonスクリプトから複数外部コマンドを実行実行結果を非同期に処理する割とお手軽にやりたい。よしググる(クズやろう) asynchronous - How can I run an external command asynchronously from Python? - Stack Overflow あった。試してみるそれぞれ 1秒, 2秒, 3秒まってprintするようなスクリプトを3つ用意 # こんな感じ from time import sleep sleep(1) print "echo1" これを参考のまんま下記のよう
kimutansk 2013/10/05
意外にこういうのは簡単に出来るわけですか。参考になります。

python

非同期
リンク
pythonでオフィス快適化計画
23. OpenPyXL+BioPython •  OpenPyXL – Excel 2007 xlsx/xlsmを読み書きするパッケージ •  BioPython – PythonでBioinformatics(ゲノム配列やタンパク質立体構造を扱う) – PubmedのAPI(xmlが返ってくる)にも対応 25. コード from Bio import Entrez, Medline from openpyxl import load_workbook Entrez.em ail = ”_____@gmail.com" handle = Entrez.efetch(db="pubmed", id=["21982300"], re"ype="medline", retmode="text") records = Medline.parse(handle) record = list(r
kimutansk 2013/09/23
他の言語にもこういうのはあれど、Pythonでやる方がお手軽なのでいいですね。

python

msoffice
リンク
Dropboxは全部Pythonで信頼性の高いソフトウェアを作った（後編）～PyCon APAC 2013
Pythonユーザーが集まり、情報交換し、交流するためのカンファレンス「PyCon APAC 2013」が9月13日、14日に都内で開催されました。PyCon APACはこれまでシンガポールで開催されており、今回初めて日本で開催されました。（本記事は「Dropboxは全部Pythonで信頼性の高いソフトウェアを作った（前編）～PyCon APAC 2013」の続きです） Pythonは遅いのか？でもたぶん、あなたのアプリはCPUによって制約されているわけではないでしょう。ごく限られた分野、例えばゲームとか科学計算ではないのならば、多くの制約はハードディスクやネットワーク、もしくはメモリから来ているのではないでしょうか。それにもしも本当にCPUによって制約されているのであれば、そういうアプリはだいたいCやC++で書かれているとは思うけれど、Pythonにも選択肢はあって、それはCyth
kimutansk 2013/09/19
結局のところ「何で開発するか」より「誰が」「どうやって」開発するかの方が質としては圧倒的に重要だ、というだけなんじゃないですかね。多分。

python

DropBox
リンク
Dropboxは全部Pythonで信頼性の高いソフトウェアを作った（前編）～PyCon APAC 2013
Pythonユーザーが集まり、情報交換し、交流するためのカンファレンス「PyCon APAC 2013」が9月13日、14日に都内で開催されました。PyCon APACはこれまでシンガポールで開催されており、今回初めて日本で開催されました。 Pythonは日本ではあまり利用事例が多くありませんが、海外ではGoogleやDropboxなどで使われていることが知られ、人気のあるスクリプティング言語の1つです。Pycon APAC 2013の2日目の基調講演には、そのDropboxの3番目の社員であるRian Hunter氏が登壇、Dropboxの社内事例も交えてPythonの大規模開発について紹介しています。基調講演の内容をダイジェストで紹介しましょう。 One Million Lines of Python このカンファレンスに呼んでいただけて大変光栄です。日本には初めて来ました。僕が初
kimutansk 2013/09/19
Win用の同期クライアントまでpythonだったとは初めて知りました・・・

DropBox

python
リンク
Python vs Go - Requests per Second - dustinrcollins
Python vs Go - Requests per Second I’ve been working in Python for a few years now and have recently started to investigate Go, mostly as an experiment to alleviate some bottlenecks without having to scale out webservers. I wrote a simple REST server in each language and used the ab tool to check the requests/second. Python server.py from bottle import route, run @route('/') def home(): article =
kimutansk 2013/08/22
goとpythonでWebサーバを作って比較。この条件だと10倍もgoの方が早いわけですか。

go

server

python
リンク
Pythonコードのプロファイリング - shkh's blog
普段、Pythonのコードは何となく速かろうという、言ってみれば勘で書いているのだけど、その勘とやらは往々にしてウンコードを生むものである。そこで、プロファイラを使っていきたいと思う。使えそうなツールそういうわけで、いくつか使えそうなツールをリストアップした。経過時間のプロファイラツール名メモ profile ビルトイン, ピュアPythonの決定論的プロファイラ cProfile ビルトイン, C拡張の決定論的プロファイラ line_profiler 行単位の決定論的プロファイラ Plop 統計的プロファイラ, Dropboxの人が作ってる statprof 統計的プロファイラ, 開発停止？ yep 拡張モジュール用の統計的プロファイラ, バックエンドにgoogle-perftools メモリのプロファイラツール名メモ memory_profiler 行単位でメモリ消費量の
kimutansk 2013/08/21
色々種類があるんですね。使えるようメモ。困った時にはまた見ましょう。

profiler

python
リンク
https://jp.techcrunch.com/2013/07/12/20130711how-did-dropbox-scale-to-175m-users-a-former-engineer-details-the-early-days/
kimutansk 2013/07/12
pythonの数百行のコードでDropboxを成り立たせていたわけですか。

python

DropBox
リンク
CodingBat Java
Array-3 Harder array probl ems -- 2 loops, more complex logic
kimutansk 2013/02/25
JavaとPythonの勉強サイトですか。Pythonはこの後復習してみましょうか。

python

Java

practice

programming
リンク
Pythonでの日本語処理：Unicode型と文字列型 - 思い立ったら書く日記
Pyhton の XML/HTML パーサ・ライブラリ BeautifulSoup を使って、Google の検索結果を整形する Python スクリプトを書いたところ、Python の日本語処理で UnicodeEncodeError、UnicodeDecodeError ではまった。いい機会なので、Python で日本語処理に関して、自分なりに整理してみる。この記事は Windows での Python 2.5.1 で動作確認している。Python 3.x では改善しているかもしれないので、この記事を読む方はご注意を。Python 3.x については時間があれば確認したい。というより、早くバージョンアップしなさい！という感じですが。 [2009.09.22 追記] Python 3.0 で Unicode まわりがかなり修正かかっていました。この記事を読む方は、Python 2.5.
kimutansk 2013/01/24
ようやく文字コードの扱いについて少しは理解できた気が。。。

python

プログラミング

文字コード
リンク
1 2 次のページ