[B! pandas] khtno73のブックマーク

【1行で】Pandasだけで相関行列をヒートマップっぽく可視化する - Qiita

import pandas as pd from sklearn import datasets boston = datasets.load_boston() df = pd.DataFrame(boston['data'], columns=boston['feature_names']) df.corr().style.background_gradient(axis=None)

khtno73 2020/08/26

わざわざSeaborn使ってた。これは便利。

リンク

Pandasのread_csvは、ただ単にデータが読み込めるだけではない - データサイエンス＆サイバーセキュリティ備忘録

Pythonのライブラリの一つ、Pandasはデータサイエンスに欠かせないものです。 Pandasの中でも、read_csvはデータサイエンスの勉強をしている方やデータサイエンティストの方にとって、特に馴染みのある関数かと思います。 read_csvを初めて聞いた人向けに説明すると、この関数はcsv形式のファイルをPandasのDataFrameに読み込むという役割を持っています。*1 基本的な使い方は、以下の通りです。 import pandas as pd df = pd.read_csv("fileName.csv") もし、csvファイルに日本語が含まれている場合はエンコーディングを引数で指定します。 import pandas as pd # cp932 が日本語用のコード df = pd.read_csv("ファイル名.csv", encoding="cp932") ロシア語や

khtno73 2020/06/19

pandas

リンク

pandasメソッドのチートシート - Qiita

pandasとは、pythonにおいてデータ操作を行うことのできるライブラリで、集計やデータ分析で非常によく利用されています。目次・検索用・データフレームの表示設定（set_option）・データフレームの作成（DataFrame）・連番の列をつくる（RangeIndex）・ファイルの読込からデータフレームを作成する（read_csv,read_excel）・ファイルを書き込む（to_csv,to_excel）・クリップボードにコピーする（to_clipboard）・データ型の変更（astype）・欠損値を特定の値で埋める（fillna）・欠損値のある行や列を削除する(dropna) ・特定の行を抽出する（[ ]）・ＳＱＬのように行を抽出する（query）・列ごとの合計、または行ごとの合計を求める(sum) ・指定した列へ関数の適用（apply）・他の列でグループ

khtno73 2020/06/19

pandas

リンク

pandas の DataFrame と SQL の記述方法の比較 - Qiita

動機仕事で AI や機械学習、データ分析といった技術を身に付ける必要性ができ、まずは Python を使ったデータ分析を修得するために pandas を利用したデータ分析にチャレンジしています。自分にはシステム開発経験があり SQL には使い慣れているのですが、 pandas のデータ分析の記述方法があまり理解できない状況でした。巷では「pandas は SQL と似ている」といった表現をよく聞くので、それならば SQL での書き方を pandas の書き方と比較したら理解が深まるのではないかと思い、今回まとめてみました。なお本記事は、ある程度のターミナル操作や MySQL、Python、pandas についての知識がある方を対象としています。なお、ここからの説明は長いためコードの比較結果のみを見たい場合は、比較結果まとめを参照ください。環境項目内容

khtno73 2020/06/18

pandas

リンク

Pandas cheatsheet for SQL people

Explore and run machine learning code with Kaggle Notebooks | Using data from [Private Datasource]

khtno73 2020/06/05

SQL people向けのpandas チートシート超便利

pandas

リンク

うわっ…私のpandas、遅すぎ…?って時にやるべきこと（先人の知恵より） - Lean Baseball

※あくまでもイメージです（適当）仕事じゃなくて、趣味の方の野球統計モデルで詰まった時にやったメモ的なやつです.*1 一言で言うと、約19万レコード（110MBちょい）のCSVの統計処理を70秒から4秒に縮めました. # 最初のコード $ time python run_expectancy.py events-2018.csv RUNS_ROI outs 0 1 2 runner 0_000 0.49 0.26 0.10 1_001 1.43 1.00 0.35 2_010 1.13 0.68 0.32 3_011 1.94 1.36 0.57 4_100 0.87 0.53 0.22 5_101 1.79 1.21 0.50 6_110 1.42 0.93 0.44 7_111 2.35 1.47 0.77 python run_expectancy.py events-2018.c

khtno73 2020/06/05

ありがたやありがたや

リンク

はてなブックマーク

タグ

関連タグで絞り込む (3)

pandasに関するkhtno73のブックマーク (6)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス