タグ

2021年6月14日のブックマーク (2件)

  • Pandas の groupby の使い方 - Qiita

    Python でデータ処理するライブラリの定番 Pandas の groupby がなかなか難しいので整理する。特に apply の仕様はパラメータの関数の戻り値によって予想外の振る舞いをするので凶悪に思える。 まず必要なライブラリを import する。

    Pandas の groupby の使い方 - Qiita
    HHR
    HHR 2021/06/14
    Group ごとに複数行を返すパターンが色々あってつらい
  • bzip2 - Wikipedia

    Seward made the first public release of bzip2, version 0.15, in July 1996. The compressor's stability and popularity grew over the next several years, and Seward released version 1.0 in late 2000.[not verified in body] Following a nine-year hiatus of updates for the project since 2010, on 4 June 2019 Federico Mena accepted maintainership of the bzip2 project.[4] Since June 2021, the maintainer is

    bzip2 - Wikipedia
    HHR
    HHR 2021/06/14
    Wikiにも分割可能に関する記載あった。Hadoopにも言及してた。“The compressed blocks in bzip2 can be independently decompressed, without having to process earlier blocks. This means that bzip2 files can be decompressed in parallel”