[B! python] [3ページ] takuya-aのブックマーク

2to3を使ってコードをPython 3に移植する - Dive Into Python 3 日本語版

takuya-a 2018/09/25

python

リンク

ユーザ定義クラスのpickle, unpickle処理のまとめ - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

takuya-a 2018/09/21

“PythonはLISPではない。”

python

リンク

AWS SageMaker上でMobileNet SSDのモデルを学習する - Taste of Tech Topics

皆さんこんにちは。@Ssk1029Takashiです最近、AWSのSageMakerがいくつかアップデートがありました。個人的にはPyTorchのサポートがアツいですね。さて、今回はSageMaker上で公式がサポートされていないアルゴリズムを学習する場合に、どのような方法があるのかを紹介していきます。モデルはMobileNet SSDを題材として見ていきましょう。 SDK？コンテナ？ SageMaker上で自前のモデルを作成する方法は２つあります。 SageMaker Python SDKを使う自作のDockerコンテナを利用する 1の方法は、各フレームワークごとにSageMaker上で学習するためのスクリプト仕様が決まっていて、その仕様に沿って書けば学習・推論ができるようになっています。例えばTensorflowであれば以下のページに仕様が載っています。 docs.aws.a

takuya-a 2018/09/14

リンク

Python: range is not an iterator

After my Loop Better talk at PyGotham 2017 someone asked me a great question: iterators are lazy iterables and range is a lazy iterable in Python 3, so is range an iterator? Unfortunately, I don’t rem ember the name of the person who asked me this question. I do rem ember saying something along the lines of “oh I love that question!” I love this question because range objects in Python 3 (xrange in

takuya-a 2018/08/28

python

リンク

便利で超強力なWSGIサーバー uWSGI を使ってみよう - 檜山正幸のキマイラ飼育記 (はてなBlog)

「Nginxをダウンタイム・ゼロで入れ替える方法」で書いたように、/usr/local/nginx/ のNginxを version 1.0.13 に更新しました。これとは別に、catyというユーザーアカウントのホームディレクトリ内にNginxをインストールして、Nginx+uWSGIとCatyの実験をしようとしています。 Nginx+uWSGIは、Catyに限らず一般的なWSGIアプリケーションを稼働させる良い環境を提供します。簡単に紹介しましょう。内容： WSGIとuWSGI なぜ Nginx+uWSGI にしたのか uWSGIについて少しインストールとりあえず動かしてみるソレナリに動かしてみるプロセスの制御など WSGIとuWSGI WSGI（Web Server Gateway Interface）*1は、Pythonで書かれたWebアプリケーションとアプリケーションサー

takuya-a 2018/08/20

リンク

Documenting Python Code: A Complete Guide – Real Python

Watch Now This tutorial has a related video course created by the Real Python team. Watch it together with the written tutorial to deepen your understanding: Documenting Code in Python Welcome to your complete guide to documenting Python code. Whether you’re documenting a small script or a large project, whether you’re a beginner or a seasoned Pythonista, this guide will cover everything you need

takuya-a 2018/07/27

リンク

python-create-iterator-protocol-class.html

今回は Python のイテレータ生成クラスを使う方法についてご紹介します。 Python でイテレータ（ iterator ）を生成する関数のことを「ジェネレータ」（ generator ）と呼びますが、関数と同様にクラスを使う形でもイテレータを生成することができます。具体的には、 __iter__() メソッドを定義してこれがイテレータを返すようにすれば OK です。その最もかんたんな方法は yield を使う方法です。逆に yield を使わない場合は __iter__() に加えて __next__() （ Python 2 の場合は next() ）メソッドを定義する必要がありますが、シンプルなケースでは __iter__() と yield を使った方法がシンプルかつかんたんです。サンプルとして、与えられた整数の因数を返すジェネレータクラスを見てみましょう。 # 因数を返

takuya-a 2018/07/10

python

リンク

KaggleのWinner solutionにもなった「K近傍を用いた特徴量抽出」のPython実装 - u++の備忘録

今回は、KaggleのWinner solutionにもなった「K近傍を用いた特徴量抽出」を紹介します。 Rでの実装は公開されていますが、Pythonでの実装は確認できなかったので、自前のPython実装も公開しています。 github.com アルゴリズムの概要 Pythonでの例可視化のためのパッケージ読み込みサンプルデータの生成可視化 K近傍を用いた特徴量抽出可視化 iris での例追記20180624 実装の修正はてなホットエントリ入りアルゴリズムの概要近傍数を、分類するクラス数をとした場合に、アルゴリズムは個の特徴量を生成します。生成される特徴量は下記のように、観測値と各クラス内の最近傍点との間の距離から計算されます。とあるクラスに属する訓練データの中の第1近傍までの距離を1つ目の特徴量とするとあるクラスに属する訓練データの中の第2近傍までの距離の和を2つ目の

takuya-a 2018/06/24

ml
python

リンク

Pythonでネットワークプログラミング / fujimisakari blog

この記事はPythonのAdventCalandar2016の15日目の記事です。 Goでネットワークプログラミングの投稿に引き続き、Pythonでネットワークプログラミングのいくつかのパターンを実装してみましたのでサンプルコードと簡単な解説をしたいと思ってます。以前、このLinuxネットワークプログラミングバイブルを読んで第5章のIOの多重化の部分が非常に興味深くハンズオンしてきちんと理解したいと思ってたので C言語で書かれていたロジックをPython3.5.2で書き直してみました。まず、投稿タイトルのネットワークプログラミングについては、 TCPプロトコルを利用したサーバ側のSocket通信の実装を指してます。 Socket通信にて、シンプルな通信からI/O多重化、非同期I/O、ノンブロッキングI/Oを利用したパターンを紹介し、これらの実装を実現するための技術として、sele

takuya-a 2018/06/01

リンク

自然言語処理の前処理・素性いろいろ - Debug me

ちゃお・・・† 舞い降り・・・† 先日、前処理大全という本を読んで自分なりに何か書きたいなと思ったので、今回は自然言語処理の前処理とそのついでに素性の作り方をPythonコードとともに列挙したいと思います。必ずしも全部やる必要はないので目的に合わせて適宜使ってください。前処理大全[データ分析のためのSQL/R/Python実践テクニック] 作者:本橋智光技術評論社Amazon 前処理余分な改行やスペースなどを除去 with open(path) as fd: for line in fd: line = line.rstrip() アルファベットの小文字化 text = text.lower() 正規化 (半角/全角変換などなど) import neologdn neologdn.normalize('ﾊﾝｶｸｶﾅ') # => 'ハンカクカナ' neologdn.normalize

takuya-a 2018/05/29

リンク

Using NumPy efficiently

An intermediate presentation about some of NumPy main features: broadcasting, indexing, basic internals.

takuya-a 2018/05/12

python
numpy

リンク

Benchmark of Python JSON libraries - Artem Krylysov

A couple of weeks ago after spending some time with Python profiler, I discovered that Python’s json module is not as fast as I expected. I decided to benchmark alternative JSON libraries. Libraries # json simplejson 3.8.2 ujson 1.35 python-rapidjson 0.0.6 python-cjson, yajl-py and jsonlib are not included in the benchmark, they are not in active development and don’t support Python 3. simplejson

takuya-a 2018/04/06

python

リンク

Pythonでの数値計算ライブラリNumPy徹底入門

NumPyは、多次元配列を扱う数値演算ライブラリです。機械学習だけでなく画像処理、音声処理などコンピュータサイエンスをするならNumPyを学んでおくことで、あなたの日々の研究や開発の基礎力は格段にアップするはずです。プログラミングの初心者から、Webエンジニア、これから研究する人など、初学者にも分かりやすく優しく説明することを心がけて必要な知識が身につくように解説しています。腰を据えて学習する時間と余裕のある方は、Step1から順に進めていくことで、苦手意識のあった方でも一通り読み終わる頃には理解できなかったPythonとNumPyのソースコードがスラスラと読めるようになるはずです。上級者の方は、分からない記事だけ読むだけでも、力になると思われます。あなたのプログラミング能力を向上する手助けになることをお約束します。このサイトを通して、コンピュータサイエンスに入門しましょう。 Ste

takuya-a 2018/03/23

リンク

KaggleのCTR予測コンペで上位10%に入るまでの試行錯誤 - yasuhisa's blog

週末KagglerとしてavazuのCTR予測コンペに参加しました。Kaggleは機械学習版のISUCONだと思ってもらえばよいです。コンペ自体は終わっているので、late submiteであまり意味はないかもしれません、練習です。leaderboard上で上位10%以内に行けたので、そこまでの試行錯誤をメモしておきます。謎ノウハウ(?)を持っているガチ勢じゃないと上位に行けないものかと思っていましたが、基本に忠実にやればこれくらいの順位(上位7.6%)に行けましたし、他の人の工夫を垣間見えるという意味でも現場の機械学習やり始めたエンジニアにお薦めできそうでした。参加の動機目標感: 頑張りすぎずに上位10%以内に入る試行錯誤 AthenaとRedashによる探索的データ解析ベンチマークをまず超える線形分類器でシンプルな特徴量時系列要素を忘れていて過学習発生特徴量エンジニアリン

takuya-a 2018/03/19

リンク

過学習の恐怖，またはいかにして私は1分間でランキングを50位も落としたか(要約) - 糞ネット弁慶

データマイニングのコンペティンションサイトKaggle: Your Home for Data Scienceに投稿された記事であるThe Dangers of Overfitting or How to Drop 50 spots in 1 minute | No Free Hunchの自分用まとめ．要約あるコンペにて「勝った！！！！！！！！！！！」と思ったが蓋を開けてみれば2位から52位に落ちてた過学習ダメ絶対 cross validation は適切に行わないといかんそもそも Kaggle で Online Privacy Foundation が主催していた，Twitterアカウントごとに0/1を予測するコンペに参加した． Kaggle のランキングシステムは Public と Private で分かれていて，コンテストが終了するまではテストデータの一部だけを使った答え合わ

takuya-a 2018/03/07

リンク

10 Minutes to Pandas — pandas 0.19.2 documentation

takuya-a 2018/03/07

リンク

Pandas DataFrameの表示を省略したくない時

Jupyter NotebookでPandasのDataFrameを表示する時、カラム数が多すぎると省略されてしまうことがある。そんな時は、 pd.set_option('display.max_columns', 100)とやると良い。100の部分は表示したいカラム数。また、表示する行を増やしたい場合は、 pd.set_option('display.max_rows', 500)上は、500行表示するように設定している。 KaggleのKernelを見ていたところ、知ることができた。

takuya-a 2018/03/07

リンク

高次元ベクトルデータ検索技術「NGT」のpythonライブラリ公開のお知らせ

ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog はじめに検索技術の菅原です。以前にこのTech Blogで紹介されたNGT（Neighborhood Graph and Tree）という高速な近傍探索を実現するソフトウエアのpython用インターフェースが公開されました。pythonは機械学習のライブラリが多く公開されており、より手軽にNGTを組み合わせて使うことができるでしょう。そこで今回はword2vecのベクトルを近傍探索する実践的な内容を紹介します。word2vecを扱うライブラリとしてgensimを使用します。word2vecやgensimの詳しい説明は省略しますが、分からなくてもpythonの文法を知っていれば理解できると思います。今回使用した環境はMacBo

takuya-a 2018/02/20

リンク

PyPIデビューしたい人の為のPyPI登録の手順 - Qiita

はじめに最近PyPIデビューを果たしました。そこで同じ用にPyPIデビューを考えている人の為に登録手順を書きます。 PyPIってなに？おいしいの？ Python Package Indexの略らしいです。 Pythonパッケージを管理するためのサービスで、誰でもパッケージを登録できます。ここに登録されたパッケージは pip installでインストール出来る様になります。ちなみにパイピーアイって読むらしいです。パッケージの準備まずは登録するパッケージを準備します。今回は例として「pypipkg」というパッケージを作成した事にします。ファイル構成はこんな感じです。 pypipkgディレクトリ直下にsetup.py等、PyPIの登録に必要な情報を用意し、pypipkgのソースのディレクトリも置きます。 pypipkg $ tree ├── MANIFEST.in ├── RE

takuya-a 2018/01/28

python

リンク

scipy array tip sheet

Arrays are the central datatype introduced in the SciPy package. (The same array objects are accessible within the NumPy package, which is a subset of SciPy. For consistency, we will simplify refer to to SciPy, although some of the online documentation makes reference to NumPy. And technically, array objects are of type ndarray, which stands for "n-dimensional array".) The array interface is acces

takuya-a 2018/01/22

リンク

はてなブックマーク

タグ

関連タグで絞り込む (33)

pythonに関するtakuya-aのブックマーク (66)

お知らせ

月間はてなブックマーク数ランキング（2025年7月）

今週のはてなブックマーク数ランキング（2025年7月第4週）

今週のはてなブックマーク数ランキング（2025年7月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス