pandas.DataFrame, pandas.Seriesから重複した要素を含む行を検出・抽出するにはduplicated()、削除するにはdrop_duplicates()を使う。 pandas.DataFrame.duplicated — pandas 0.22.0 documentation pandas.DataFrame.drop_duplicates — pandas 0.22.0 documentation また、重複した要素をもとに値を集約するgroupby()についても最後に簡単に触れる。 以下の内容について説明する。 重複した行を抽出: duplicated() 残す行を選択: 引数keep 重複を判定する列を指定: 引数subset 重複した行の数をカウント 重複した行を削除: drop_duplicates() 引数keep, subset 引数inplace
![pandas.DataFrame, Seriesの重複した行を抽出・削除 | note.nkmk.me](https://cdn-ak-scissors.b.st-hatena.com/image/square/a076bfae2f80e7966338f79b7ecb6f174c0cd014/height=288;version=1;width=512/https%3A%2F%2Fi.gyazo.com%2F0ca8b947309400b43e9fbd9f2baef889.png)