タグ

Pythonに関するtsubotyのブックマーク (4)

  • Python pandas 欠損値/外れ値/離散化の処理 - StatsFragments

    データの前処理にはいくつかの工程がある。書籍「データ分析プロセス」には 欠損など 前処理に必要なデータ特性の考慮とその対処方法が詳しく記載されている。 が、書籍のサンプルは R なので、Python でどうやればよいかよく分からない。同じことを pandas でやりたい。 データ分析プロセス (シリーズ Useful R 2) 作者: 福島真太朗,金明哲出版社/メーカー: 共立出版発売日: 2015/06/25メディア: 単行この商品を含むブログ (2件) を見る とはいえ、pandas 自身は統計的 / 機械学習的な前処理手法は持っていない。また Python には R と比べると統計的な前処理手法のパッケージは少なく、自分で実装しないと使えない方法も多い。ここではそういった方法は省略し、pandas でできる前処理 / 可視化を中心に書く。 また、方法自体の説明は記載しないので、詳細

    Python pandas 欠損値/外れ値/離散化の処理 - StatsFragments
  • 私が選ぶ2015年の”新しい”Pythonモジュール トップ5 | POSTD

    最近、このモジュールをに紹介したところ、そのシンプルさと実用性に驚いていました。 joblib joblibの存在は以前から知ってはいたものの、実際のところはよく理解しておらず、いろいろな機能を寄せ集めたようなモジュールだと思っていました。まあ、その印象は今もあまり変わりませんが、実は非常に便利なモジュールだったのです。私は Flowminder の同僚から再度joblibを勧められて、このモジュールをデータ分析用のコードに幅広く使用しました。では、その機能について紹介しましょう。joblibは大きく分けて、 キャッシング 、 並列化 、 永続化 (データの保存と読み込み)の3つの機能から成ります。実を言うと、私はまだ並列プログラミングの機能は使ったことがないのですが、あとの2つの機能は頻繁に使ってきました。 キャッシング機能とは、シンプルなデコレータを使って、関数を簡単に”メモ化”する

    私が選ぶ2015年の”新しい”Pythonモジュール トップ5 | POSTD
  • Python 入門に役立つ情報源

    ここでは Python 入門に役立つ情報源をご紹介しています。 お断り: 最近増えてきた海外の動画系サイトや日語書籍についてはチェックできていません。 目次 ウェブサイト 書籍 オンラインコース サービス 記事 その他 ウェブサイト Python 公式ドキュメント(英語英語に抵抗のない方には公式のドキュメントがおすすめです。 Python 2 系、 Python 3 系それぞれにドキュメントが用意されています。ただし、これらは他の言語で多少のプログラミング経験がある方を前提としている感じなので、「プログラミングそのものが未経験」という方にはおすすめしません。「プログラミングがはじめての方」や「ブランクがありプログラミングを学び直したい方」等には下の方でご紹介している書籍などからスタートされることをおすすめします。 Python v2.* documentation Python v3

    Python 入門に役立つ情報源
  • http://localhost:8000/

    tsuboty
    tsuboty 2015/03/27
    pyhon -m SimpleHTTPServer
  • 1