タグ

pandasに関するgrattのブックマーク (5)

  • 【翻訳】Minimally Sufficient Pandas(エッセンシャル版) - Qiita

    Overview この記事は pandasクックブック-―Pythonによるデータ処理のレシピ の著者である Ted Petrou 氏の以下の記事、 Minimally Sufficient Pandas の一部を、許可を得て翻訳したものです。 https://twitter.com/arc279/status/1095511875050033152 全文は「何故そうしたほうが良いのか?」などにも詳しく言及していて長文のため、具体例だけ先に訳しました。 詳しい理由などは元記事を参照してください。 元記事の全文はこちらです。 不自然な点、間違っている点などがありましたら指摘してもらえると助かります。 リポジトリはここにあります。 以下、忙しい人のための意訳です。 カラム(Series)の選択にドット表記を使わない。ブラケット表記を使う。 OK) df[“count”] NG) df.coun

    【翻訳】Minimally Sufficient Pandas(エッセンシャル版) - Qiita
    gratt
    gratt 2020/04/14
  • 【翻訳】Minimally Sufficient Pandas(全文) - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Overview この記事は pandasクックブック-―Pythonによるデータ処理のレシピ の著者である Ted Petrou 氏の以下の記事、 Minimally Sufficient Pandas を、許諾を得て翻訳したものです。 https://twitter.com/arc279/status/1095511875050033152 不自然な点、間違っている点などがありましたら指摘してもらえると助かります。 リポジトリはここにあります。 また、長文のため、具体例だけざっくり訳した版も用意しました。 以下、翻訳です。 Mini

    【翻訳】Minimally Sufficient Pandas(全文) - Qiita
  • Kaggleで戦いたい人のためのpandas実戦入門 - ML_BearのKaggleな日常

    はじめに 自分は元々pandasが苦手でKaggleコンペ参加時は基的にBigQuery上のSQLで特徴量を作り、最低限のpandas操作でデータ処理をしていました。 しかし、あるコードコンペティションに参加することになり、pythonで軽快にデータ処理をこなす必要が出てきたので勉強しました。 そこで、当時の勉強メモをもとに「これだけ知っていればKaggleでそこそこ戦えるかな」と思っているpandasの主要機能をまとめました。 注記 実戦入門 のつもりが ほぼ辞書 になってしまいました orz pandasとはなんぞや的な内容は書いていません (import pandasやDataFrameとは何かなど) pandas1.0系でも動くように書いたつもりですが間違ってたらすみません 目次 はじめに 注記 目次 Options DaraFrame 読み書き CSVファイル 読み込み 書き出

    Kaggleで戦いたい人のためのpandas実戦入門 - ML_BearのKaggleな日常
  • DataFrameで特徴量作るのめんどくさ過ぎる。。featuretoolsを使って自動生成したろ - Qiita

    前にSQLで言う所のcase when x then y else z end的な処理をpandasでやる時にすぐやり方を忘れるから記事にした。あれはあれでいいのだけれど、まだまだ前処理にすごく時間がかかる!!めっちゃめんどい なんとかしたい... 今までpandas.DataFrameで色々特徴量生成(feature creationとかfeature engineering)する時に、ごちゃごちゃpandasのネイティブな機能を使って生成してたけど、kagglerのエレガントなデータの前処理を見ていると下記モジュールを使っている人が多い印象。 scikit-learn.preprocessing category_encoders featuretools 特に大量に特徴量を生成したい場合、**featuretools**がすごく便利そうな予感!!! よっしゃ!! 使ってみよ!!! F

    DataFrameで特徴量作るのめんどくさ過ぎる。。featuretoolsを使って自動生成したろ - Qiita
  • PythonでPandasのPlot機能を使えばデータ加工からグラフ作成までマジでシームレス - Qiita

    Pandasのグラフ描画機能 この記事ではPandasのPlot機能について扱います。 Pandasはデータの加工・集計のためのツールとしてその有用性が広く知られていますが、同時に優れた可視化機能を備えているということは、意外にあまり知られていません。 この機能は Pandas.DataFrame.plot() もしくは Pandas Plot と呼ばれるものです。 Pandas Plotを使いこなすことが出来るようになれば、 データの読み込み、保持 データの加工 データの集計 データの可視化 というデータ分析の一連のプロセスを全てPandasで完結させることが出来る、つまり分析の「揺りかごから墓場まで」を実現することが出来ます。 Pandasのプロット以外の機能について この記事ではPandasのデータハンドリングなどに関わる機能は説明しません。 そちらにも興味がある方は下記の記事などを

    PythonでPandasのPlot機能を使えばデータ加工からグラフ作成までマジでシームレス - Qiita
  • 1