タグ

numpyに関するmahler-5のブックマーク (6)

  • pandasで条件に応じて値を代入(where, mask) | note.nkmk.me

    pandasで条件に応じて値を代入する方法を説明する。if文を使うわけではないが、if then ...あるいはif then ... else ...的な条件分岐の処理が可能。 特定の値の置換、欠損値NaNの置換や削除については以下の記事を参照。 関連記事: pandas.DataFrame, Seriesの要素の値を置換するreplace 関連記事: pandasで欠損値NaNを削除(除外)するdropna 関連記事: pandasで欠損値NaNを置換(穴埋め)するfillna 以下のpandas.DataFrameを例とする。 import pandas as pd import numpy as np df = pd.DataFrame({'A': [-20, -10, 0, 10, 20], 'B': [1, 2, 3, 4, 5], 'C': ['a', 'b', 'b', '

    pandasで条件に応じて値を代入(where, mask) | note.nkmk.me
    mahler-5
    mahler-5 2019/01/31
    whereについて
  • Universal functions (ufunc) — NumPy v1.26 Manual

    A universal function (or ufunc for short) is a function that operates on ndarrays in an element-by-element fashion, supporting array broadcasting, type casting, and several other standard features. That is, a ufunc is a “vectorized” wrapper for a function that takes a fixed number of specific inputs and produces a fixed number of specific outputs. For detailed information on universal functions, s

  • pandasで要素・行・列に関数を適用するmap, apply, applymap | note.nkmk.me

    pandasでDataFrameやSeriesの要素・行・列に任意の関数を適用するには、map(), apply(), applymap()メソッドを使う。 後半で述べるように、一般的な処理はDataFrameやSeriesのメソッドとして提供されている。また、NumPyの関数にDataFrameやSeriesを渡して処理することもできる。map()やapply()は遅いので、可能であれば専用のメソッドやNumPyの関数を使うほうがよい。 記事のサンプルコードのpandasおよびNumPyのバージョンは以下の通り。バージョンによって仕様が異なる可能性があるので注意。 import pandas as pd import numpy as np print(pd.__version__) # 2.1.2 print(np.__version__) # 1.26.1

    pandasで要素・行・列に関数を適用するmap, apply, applymap | note.nkmk.me
  • 統計の素人だけどPythonで機械学習モデルを実装したい、そんな人のための第一歩 - Qiita

    はじめに 『統計にそんなに詳しくないけど、機械学習とかのモデルを自分で実装してみたい!』 ってことよくありますよね? 『そんなこと全くないわー(#^ω^)』って思った人も素直になってください。 絶対に一度は思ったことがあるはずです。 とくにPythonでロジスティック回帰を実装したいと思ったことがある人は多いと思います。 多いはずです。 ここでは、統計の知識をヌルくと説明しつつPythonで実際に動くLogistic回帰モデルを実装します。 統計に詳しくない方でも無理なく出来るよう、統計の説明➔実装 を1ステップづつ進められるようにしました。 なんでかんで、統計モデルとか機械学習も自分で実装しながら覚えると効率がよかったりします。 この記事の対象読者 基的にはデータサイエンスに多少興味ある方向けです。 ロジスティック回帰って聞いたことあるけど、よくわからん 上司がロジスティック回帰でクラ

    統計の素人だけどPythonで機械学習モデルを実装したい、そんな人のための第一歩 - Qiita
  • Python pandas データのイテレーションと関数適用、pipe - StatsFragments

    pandas ではデータを 列 や 表形式のデータ構造として扱うが、これらのデータから順番に値を取得 (イテレーション) して何か操作をしたい / また 何らかの関数を適用したい、ということがよくある。このエントリでは以下の 3 つについて整理したい。 イテレーション 関数適用 pipe (0.16.2 で追加) それぞれ、Series、DataFrame、GroupBy (DataFrame.groupbyしたデータ) で可能な操作が異なるため、順に記載する。 まずは必要なパッケージを import する。 import numpy as np import pandas as pd イテレーション Series Series は以下 2つのイテレーション用メソッドを持つ。各メソッドの挙動は以下のようになる。 __iter__: Series の値 ( values ) のみをイテレーシ

    Python pandas データのイテレーションと関数適用、pipe - StatsFragments
  • Python pandas データ選択処理をちょっと詳しく <中編> - StatsFragments

    こちらの続き。 上の記事では bool でのデータ選択について 最後にしれっと書いて終わらせたのだが、一番よく使うところなので中編として補足。 まず __getitem__ や ix の記法では、次のような指定によって 行 / 列を選択することができた。 index, columns のラベルを直接指定しての選択 index, columns の番号(順序)を指定しての選択 index, columns に対応する bool のリストを指定しての選択 ここでは上記の選択方法をベースとして、ユースケースごとに Index や Series のプロパティ / メソッドを使ってできるだけシンプルにデータ選択を行う方法をまとめる。 補足 一部の内容はこちらの記事ともかぶる。下の記事のほうが簡単な内容なので、必要な方はまずこちらを参照。 簡単なデータ操作を Python pandas で行う - S

    Python pandas データ選択処理をちょっと詳しく <中編> - StatsFragments
  • 1