タグ

Pandasに関するrockenotaのブックマーク (2)

  • 文字列から数値を抽出し、合計したい

    「国語20数学30」から20+30=50を求めたい。データには、このペアが1000件ほど存在します。 re.matchを使えると思うのですが、どうもうまく行きません。ヒントをご教示頂けるとありがたいです。 reを使わないバージョンですが、現在のところ、下記のように書いているのですが、 うまく行きません。 import pandas as pd import numpy as np df = pd.DataFrame( {'x': ['国語20数学60', '160', '国語100数学20']}, index=[1, 2, 3]) # index no.2には、国語と数学の合計点が入っています。 print(df) df['total'] = np.zeros((len(df),1)) lang = list(range(1, 101)) math =list(range(1, 101))

    文字列から数値を抽出し、合計したい
  • データ分析で頻出のPandas基本操作 - Qiita

    はじめに 機械学習や深層学習が人気の昨今ですが、それらのモデルの精度に最もクリティカルに影響するのはインプットするデータの質です。データの質は、データを適切に把握し、不要なデータを取り除いたり、必要なデータを精査する前処理を行うことで高めることができます。 頁では、データ処理の基ツールとしてPandasの使い方を紹介します。Pandasには便利な機能がたくさんありますが、特に分析業務で頻出のPandas関数・メソッドを重点的に取り上げました。 Pandasに便利なメソッドがたくさんあることは知っている、でもワイが知りたいのは分析に最低限必要なやつだけなんや…!、という人のためのPandasマニュアルです。 また、単に機能を説明するだけでは実際の処理動作がわかりにくいため、ここではSIGNATE(旧DeepAnalytics)のお弁当の需要予想を行うコンペのデータを拝借し、このデータに対

    データ分析で頻出のPandas基本操作 - Qiita
  • 1