タグ

ブックマーク / qiita.com/mwmsnn (2)

  • dplyr のアレを Pandas でやる - Qiita

    Pandas と dplyr のより網羅的な対比は、既に記事が出ています。 私が参考にしたものをこの記事の末尾で紹介していますので、詳しくはそちらをご覧ください 。 前置き|テーブルのキーの扱い方の違い Pandas を使い始める前に理解すべきこととして、dplyr と Pandas ではテーブルのキーの扱い方に大きな違いがあります。この違いを認識していなかった私はかなり苦戦しました…… 以下の2点を理解して (覚悟して?) おくと、学習コストが多少減るのではないでしょうか。 Pandas ではテーブルのキーが Index という別オブジェクトで管理されていること Pandas ではキーや列名に階層構造を持たせられること dplyr におけるキーの扱い R のデータフレームにはテーブルのキーを表す方法として row names という仕組みが用意されています。しかし、dplyr (が利用し

    dplyr のアレを Pandas でやる - Qiita
  • ナンバーズ予想で学ぶ PowerShell によるデータ分析 - Qiita

    PowerShell には CSV ファイルを読み込むコマンドや、集計するためのコマンドがあります。そのため、ちょっとした集計作業であれば実行することが可能です。ここでは、ナンバーズ予想を題材に、PowerShell によるデータ分析(と呼べるほど高級な処理はやりませんが……)の方法についてまとめます1。 ※「ナンバーズ予想で学ぶ ~」と言いつつも、この記事の大半は「予想に至るまでに必要な前処理やデータ俯瞰を PowerShell で行う方法」の説明です。予想の部分だけ読みたい方は「各当せん番号のストレート口数の平均を求める」へ飛んでください! 準備 データのダウンロード ナンバーズ3の過去データを用意します。 今回は ナンバーズ34 データダウンロードサービス からデータをお借りしました。 PowerShell の基を習得 この記事では PowerShell の基的な部分については説

    ナンバーズ予想で学ぶ PowerShell によるデータ分析 - Qiita
  • 1