タグ

ブックマーク / note.nkmk.me (10)

  • pandasで特定の文字列を含む行を抽出(完全一致、部分一致) | note.nkmk.me

    pandas.DataFrameから特定の文字列を含む要素を持つ行を抽出する方法(完全一致・部分一致)について説明する。 ここではブーリアンインデックス(Boolean indexing)を用いた方法を説明するが、query()メソッドを使うことも可能。 関連記事: pandas.DataFrameの行を条件で抽出するquery データ(要素)ではなく、行名・列名が特定の文字列を含む行・列を抽出するにはfilter()メソッドを使う。以下の記事を参照。 関連記事: pandas.DataFrameの行・列を行名・列名の条件で抽出するfilter 記事のサンプルコードのpandasのバージョンは以下の通り。以下のpandas.DataFrameを例として使う。 sample_pandas_normal.csv import pandas as pd print(pd.__version__

    pandasで特定の文字列を含む行を抽出(完全一致、部分一致) | note.nkmk.me
    TOM555
    TOM555 2024/06/10
  • Pythonで文字列を分割(区切り文字、改行、正規表現、文字数) | note.nkmk.me

    区切り文字で分割: split() 区切り文字で分割するには文字列(str型)のsplit()メソッドを使う。 組み込み型 - str.split() — Python 3.11.4 ドキュメント デフォルトは空白文字(スペースや改行\n、タブ\tなど)で分割する。連続する空白文字はまとめて処理される。 戻り値はリスト。 s_blank = 'one two three\nfour\tfive' print(s_blank) # one two three # four five print(s_blank.split()) # ['one', 'two', 'three', 'four', 'five'] print(type(s_blank.split())) # <class 'list'>

    Pythonで文字列を分割(区切り文字、改行、正規表現、文字数) | note.nkmk.me
    TOM555
    TOM555 2024/06/04
    “re.split(r'\d+', s_nums)”
  • PythonのCounterでリストの各要素の出現個数をカウント | note.nkmk.me

    Pythonでリストやタプルの全要素の個数は組み込み関数len()、各要素の個数(要素ごとの出現回数)はcount()メソッドで取得できる。さらに、Python標準ライブラリcollectionsのCounterクラスを使うと、出現回数が多い順に要素を取得可能。

    PythonのCounterでリストの各要素の出現個数をカウント | note.nkmk.me
    TOM555
    TOM555 2024/06/04
  • Pythonでリスト(配列)から重複した要素を削除・抽出 | note.nkmk.me

    Pythonで、リスト(配列)から、 重複した要素を削除(一意な要素・ユニークな要素のみを抽出) 重複した要素を抽出 して、新たなリストを生成する方法について説明する。 なお、リストではなくタプルの場合も同様の考え方で実現可能。 リストやタプルが重複した要素を持っているかどうかを判定したい場合、一つのリストではなく複数のリスト間で共通する要素や共通しない要素を抽出したい場合は以下の記事を参照。 関連記事: Pythonでリスト(配列)に重複した要素があるか判定 関連記事: Pythonで複数のリストに共通する・しない要素とその個数を取得 なお、リストは異なる型のデータを格納可能で、厳密には配列とは異なる。配列を扱いたい場合はarray(標準ライブラリ)やNumPyを使う。 関連記事: Pythonのリストと配列とnumpy.ndarrayの違いと使い分け numpy.ndarrayに対する

    Pythonでリスト(配列)から重複した要素を削除・抽出 | note.nkmk.me
    TOM555
    TOM555 2024/06/01
  • Pythonで文字列を置換(replace, translate, re.sub, re.subn) | note.nkmk.me

    Pythonで文字列を置換するには、replace()やtranslate()、正規表現reモジュールのre.sub(), re.subn()などを使う。スライスで位置を指定して置換することもできる。 いずれの場合も、置換後の文字列として空文字列''を指定することで、元の文字列を削除する処理としても利用できる。 関連記事: Pythonで文字列の一部を削除(stripなど) 置換するのではなく、文字列の中から条件を満たす部分文字列を抽出したい場合やその位置を確認したい場合は以下の記事を参照。 関連記事: Pythonで文字列を抽出(位置・文字数、正規表現) 関連記事: Pythonで文字列を検索(〜を含むか判定、位置取得) 大文字と小文字を変換する場合は専用のメソッドが用意されている。 関連記事: Pythonで大文字・小文字を操作する文字列メソッド一覧 テキストファイルの中身を置換したい

    Pythonで文字列を置換(replace, translate, re.sub, re.subn) | note.nkmk.me
    TOM555
    TOM555 2024/06/01
  • Pythonで文字列を連結・結合(+演算子、joinなど) | note.nkmk.me

    複数の文字列を連結・結合: +, +=演算子 +演算子で連結 +演算子を使って、文字列リテラル('...' or "...")および文字列の変数を連結できる。 s = 'aaa' + 'bbb' + 'ccc' print(s) # aaabbbccc s1 = 'aaa' s2 = 'bbb' s3 = 'ccc' s = s1 + s2 + s3 print(s) # aaabbbccc s = s1 + s2 + s3 + 'ddd' print(s) # aaabbbcccddd

    Pythonで文字列を連結・結合(+演算子、joinなど) | note.nkmk.me
    TOM555
    TOM555 2024/06/01
  • Pythonで文字列を抽出(位置・文字数、正規表現) | note.nkmk.me

    Pythonで文字列strから部分文字列を抽出する方法について説明する。任意の位置・文字数を指定して抽出したり、正規表現のパターンで抽出したりできる。 文字列を検索して一致する部分の位置を取得したい場合や、文字列中の部分文字列を別の文字列に置換したい場合は以下の記事を参照。 関連記事: Pythonで文字列を検索(〜を含むか判定、位置取得) 関連記事: Pythonで文字列を置換(replace, translate, re.sub, re.subn) テキストファイルから抽出したい場合は、ファイルを文字列として読み込めばよい。 関連記事: Pythonでファイルの読み込み、書き込み(作成・追記)

    Pythonで文字列を抽出(位置・文字数、正規表現) | note.nkmk.me
    TOM555
    TOM555 2024/06/01
  • Pythonの正規表現モジュールreの使い方(match, search, subなど) | note.nkmk.me

    Pythonで正規表現の処理を行うには標準ライブラリのreモジュールを使う。正規表現パターンによる文字列の抽出や置換、分割などができる。 re --- 正規表現操作 — Python 3.11.3 ドキュメント 正規表現 HOWTO — Python 3.11.3 ドキュメント ここではまずreモジュールの関数やメソッドについて説明し、そのあとで、reモジュールで使える正規表現のメタ文字(特殊文字)・特殊シーケンスについて説明する。基的には標準的な正規表現のシンタックスだが、フラグの設定(特にre.ASCII)は要注意。 正規表現パターンをコンパイル: compile() reモジュールで正規表現の処理を実行する方法は2つある。 関数で実行 1つ目は関数。re.match(), re.sub()のように正規表現パターンを用いた抽出や置換などの処理を行う関数が用意されている。 関数の詳細に

    Pythonの正規表現モジュールreの使い方(match, search, subなど) | note.nkmk.me
    TOM555
    TOM555 2024/06/01
  • Pythonで改行を含む文字列の出力、連結、分割、削除、置換 | note.nkmk.me

    改行を含む文字列を作成、print出力(表示) 改行コード \n(LF), \r\n(CR+LF) 文字列内に改行コード\nや\r\nを挿入すると改行される。 s = 'Line1\nLine2\nLine3' print(s) # Line1 # Line2 # Line3 s = 'Line1\r\nLine2\r\nLine3' print(s) # Line1 # Line2 # Line3

    Pythonで改行を含む文字列の出力、連結、分割、削除、置換 | note.nkmk.me
    TOM555
    TOM555 2024/06/01
  • Pythonのinput関数でキーボードからの入力を取得 | note.nkmk.me

    ターミナルやコマンドプロンプト(cmd.exe)、PowerShellなどで実行したPythonプログラムの中でキーボードからの入力を受け付けて値を取得するには組み込み関数input()を使う。キーボードに限らずパイプなどから送られる標準入力を受け取る際にも使われる。 組み込み関数 input() — Python 3.7.2 ドキュメント ここでは以下の内容について説明する。 Python2とPython3の違い: raw_input()とinput() Python2のraw_input(), Python3のinput() Python2のinput() エラーが発生する場合 input()の基的な使い方 int()やfloat()で数値として取得 複数の値を入力・取得 改行を含む値を入力・取得 split()でリストlistとして取得 最初に説明するように、Python2系とPy

    Pythonのinput関数でキーボードからの入力を取得 | note.nkmk.me
    TOM555
    TOM555 2024/06/01
  • 1