このページでは、Pandas で作成したデータフレームを操作して、特定の行・列を取得し、目的の形へ加工する手順について紹介します。 なお、特定の行、列を除外する方法については、「Pandas のデータフレームの特定の行・列を削除する」の記事をご参照ください。 特定の列を取得する カラム名 (列名) を指定して、特定の列を抽出できます。
このページでは、Pandas で作成したデータフレームを操作して、特定の行・列を取得し、目的の形へ加工する手順について紹介します。 なお、特定の行、列を除外する方法については、「Pandas のデータフレームの特定の行・列を削除する」の記事をご参照ください。 特定の列を取得する カラム名 (列名) を指定して、特定の列を抽出できます。
下記のようなカラムの数が一定でないtsvを読み込みたかった。 105497 101731 90359 107575 105320 76175 96971 95604 109100 72563 105730 109194 96971 95604 read_csvで読み込んでみる。 pd.read_csv( 'foo.tsv', sep='\t', header=False ) #=> CParserError: Error tokenizing data. C error: Expected 3 fields in line 4, saw 8 怒られた。途中で3列だと早とちりして4行目で落ちている。 列の数をnamesで指定してあげれば、通るらしい。仮に最大で10列あるとする。 # これをカラム名にする col_names = [ 'c{0:02d}'.format(i) for i in
簡単な欠損値の確かめ方 欠損値を削除する方法 基本的な使い方 全てが欠損値の行を削除する 削除したい列を指定する 変更を元のデータに反映させる 行あたりに残したいデータ数を指定 削除する方向を指定 欠損値を穴埋めする方法 基本的な使い方 列ごとに埋める値を変える 前後の値を使って穴埋めをする 平均値や最頻値などで穴埋め 個別に穴埋めする値を指定する まとめ 参考 実際のデータで分析を行うとデータが不完全で欠損値が含まれていることがあります。 欠損値の扱い方が変わるだけで分析の結果が変化する場合もあります。 そこで本記事では欠損値の処理をすることができるように 簡単な欠損値の確かめ方 欠損値を削除する方法 欠損値を穴埋めする方法 の3つについて解説していきます。 簡単な欠損値の確かめ方 とりあえず各列に欠損値があるかどうかを知りたい、というときはisnull関数とany関数の組み合わせとno
エラー内容 原因 解決法 解決法1:オプションで指定 解決法2:エラーを放置してshift-jisに変換 関連ページ エラー内容 例えば、以下のようなエラーメッセージが表示される。 UnicodeDecodeError: 'utf-8' codec can't decode byte 0x92 in position 0: invalid start byte UnicodeDecodeError: 'utf-8' codec can't decode byte 0x95 in position 0: invalid start byte UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte 'utf-8' codec can't decode byte 0x??
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く