タグ

2021年8月24日のブックマーク (5件)

  • python; np.meanにて Python int too large to convert to C long と出る

    リスト内のTimedeltaをnp.meanで平均しようとしたのですが、Python int too large to convert to C longと出てしまいます。 リスト内の時間がCのlongの範囲を超えてしまったということなのでしょうが、これをどうにか計算できるようにすることは可能なのでしょうか。 listを間引きすれば計算できる様にはなるのですが、間引きせずに計算できる方法があれば教えていただきたいです。 よろしくお願いします。 リスト(kakuteiList_np) [[0 Timedelta('18 days 00:24:58')] [1 Timedelta('17 days 23:59:23')] [2 Timedelta('0 days 03:23:49')] ... [17202 Timedelta('0 days 19:49:57')] [17203 Timede

    python; np.meanにて Python int too large to convert to C long と出る
    teddy-g
    teddy-g 2021/08/24
    PandasのTimedeltaを1万回繰り返すと頭が来るって死ぬ。ナノ秒からマイクロ秒にすればOKとあるが面倒なので日数計算にして解決したっていう。
  • 先読みと後読みを使ったパターンの記述

    正規表現における先読みと後読みは、マッチするかどうか確認は行うけれどマッチした文字列としては取得しないときに利用します。先読みには肯定先読みと否定先読み、後読みには肯定先読みと否定先読み、がそれぞれ用意されています。ここでは Python を使って正規表現で先読みと後読みを使用する方法について解説します。

    先読みと後読みを使ったパターンの記述
    teddy-g
    teddy-g 2021/08/24
    肯定先読みとか否定先読みとかのシンプルな説明。これなら理解できる。
  • 正規表現:文字列を「含まない」否定の表現まとめ | WWWクリエイターズ

    「〜を含まない」といった、否定の意味を持つ正規表現を記述する場合、下記のように、大きく分けて2種類のケースがあります。 「特定の1文字を含まない」といった否定表現か、もしくは「正規表現パターンを含まない」といった表現かで、大きく解決の方針が異なる点に注意して下さい。 特定の1文字だけを否定したい場合は非常にシンプルです。この場合、「文字クラス」、もしくはエスケープシーケンスで表される文字型を利用する事で表現できます。 一方で、特定の正規表現パターンを否定したい場合、少し記述が複雑になります。今回は「否定先読み」を利用した表現を、この記事の後半にご紹介します。 基的な正規表現の記法はこの記事では触れませんので、不安な方はこちらの記事も合わせてご参照下さい: 正規表現とは?基構文とメタ文字一覧(サンプル付) それでは、順番に詳しく見ていきます。 任意の一文字を含まない文字列の正規表現 a「

    teddy-g
    teddy-g 2021/08/24
    肯定先読みとか否定先読みとかこの説明を読んでいくとなんだか混乱してくる
  • 正規表現:AND(かつ)の表現方法 | WWWクリエイターズ

    正規表現の「AND(かつ)」の表現 正規表現において、複数のパターンの論理積「AND」、すなわち「A、かつB」といったパターンの並列表現はややトリッキーです。初学者にはややハードルが高いかもしれませんが、記事後半に解説を加えておきましたので、よくわからない方はご一読下さい。 〇〇を含む、AND(かつ)、〇〇を含む AND(かつ)条件の例として、リテラル(=ただの文字)のマッチを考えてみます。下記は、「ラーメンを含む、かつ、カレーを含む」という、お子様も大好きなメニューの定番をマッチングする正規表現です。 // ラーメンを含み、かつ、カレーを含む文字列の表現 ^(?=.*ラーメン)(?=.*カレー).*$ 注目すべきは、「(?=」「)」の括弧です。これは肯定先読みを言いますが、こちらについては、追って解説します。 〇〇を含む、AND(かつ)、〇〇を含むまない 同様に、否定先読みを組み合わせて

    teddy-g
    teddy-g 2021/08/24
    肯定先読みとか否定先読みとか学ぶ前にまずAND条件をよく理解したほうが良い
  • How to aggregate unique count with pandas pivot_table

    teddy-g
    teddy-g 2021/08/24
    Panadsのpivot_tableでユニークカウントで集計する方法について。NAがないなら aggfunc=lambda x: len(x.unique())、あったらlen(x.dropna().unique())でオケ。