タグ

PythonとRに関するclavierのブックマーク (15)

  • Pythonプログラマが30分でわかるR - Qiita

    Pythonで統計処理をしているが、Rでコードを書いたことがない方々のために、30分から1時間で読めるR入門を書きました。この記事の R Markdown 文書と実行環境は、こちらの GitHubレポジトリ にあります。 目次 準備 プログラミング言語Rの基型 演算 Assertion ベクトルの要素数とrange リスト DataFrame (tibble) Matrix 関数 いろいろな処理と込み入った話題 文字列処理 強制型変換 等差数列 集合演算 日時と時刻 クラス 参照渡しと copy-on-modify デフォルト値 Assertionで実行を止める コマンドライン引数を解析する CSVファイルを読んで集計する ディレクトリを作る CSVファイルを読む グラフを描く CSVファイルを加工する それぞれの行を集計する それぞれの列を集計する 行をグループ化する カテゴリ変

    Pythonプログラマが30分でわかるR - Qiita
  • Pythonで実装するアヒル本「StanとRでベイズ統計モデリング」 - Qiita

    アヒルとは アヒル「StanとRでベイズ統計モデリング」、ベイズ界隈では有名な書籍です。 ベイズ推定を実装したい、と思ったときにまず最初に手に取ると良いでしょう。 しかし、ベイズとは何かという点について解説しているではないため、ベイズの枠組みで事例を積み重ねることで事後分布を更新できるために得られる利点などについて納得ができていない方は、ベイズ自体の基礎的な解説を読んでからチャレンジしたほうが良いと思います。 なぜPythonか 上記のオフィシャルでは、タイトルどおり実装はRなんですね。 Pythonで実装したい方も多いと思います。 私もその一人でしたので、Python実装をつくりました。 Python実装にあたって Stanのインターフェイスについては、PyStanでRとほぼ変わらない使いごこちを実現できます。 一方で、データ整形についてはPandasを使うので、Rとはかなり異な

    Pythonで実装するアヒル本「StanとRでベイズ統計モデリング」 - Qiita
  • Pythonで実装する「RとStanではじめるベイズ統計モデリングによるデータ分析入門」 - Qiita

    Pythonで実装するベイズ統計モデリング 「RとStanではじめるベイズ統計モデリングによるデータ分析入門」はアヒルよりも手軽にベイズ推定の実装に入門できる書籍です。 アヒルは統計モデルの座学的章がありますが、こちらはほとんどありません。 まずはやってみよう、というところから入るです。 また、階層ベイズについての考え方は、アヒルと合わせて読むことでより理解が深まるかもしれません。 何故Pythonで実装するのか オフィシャルではこちらもRで実装があります。 最近はPythonを使う方が多いので、アヒルだけでなくこちらもPythonで実装してみました。 コード PythoとPyStanで実装しています。 Github 何かありましたらプルリクエストをいただけると助かります。 点推定だけでなく、ベイズ推定も一般的に広まっていくといいのかな、と個人的に思っています。

    Pythonで実装する「RとStanではじめるベイズ統計モデリングによるデータ分析入門」 - Qiita
  • 時系列データ関連の本10冊読んだので書評書く。+4冊更新 2021年11月 - Qiita

    #各の立ち位置について どんな軸で立ち位置を説明しようか悩みますが、今回は「対象読者レベル」と「時系列との関係」についての二軸で「独断と偏見」で位置づけしてみました。 #はじめに 仕事データ分析に関して種々のデータに色々な手法を使ったりするのですが、分析していると時系列のデータが意外と多い。 数値予測や異常検知などは時刻と共に記録されていることが多いです。 この時系列データに関する知識を付けるために網羅的にを読んで、知識を付けようと思いました。 今回はその中で、「どのにどんな事が書いてあって、他のとの関係性は?」を書評にすることで、皆さんのの購入の手助けになればと思っています。 「このの立ち位置も調べて」 「時系列ならこの入れなアカン」 などあれば教えてください。 時系列分析のためのブックガイドと同じようなコンセプトの記事です。 #時系列データに対する「python,Rど

    時系列データ関連の本10冊読んだので書評書く。+4冊更新 2021年11月 - Qiita
  • アスキーアートを自動生成する - Pythonでいろいろやってみる

    画像をテキストで置き換えるいわゆるアスキーアートを自動生成します。変換したい画像と使用する文字列を与えると、画像の濃いところは画数の多い字で薄いところは画数の少ない字で置き換えることで濃淡を表現します。ただし画数情報はわからないので、文字列の字を一文字ずつ画像に変換して濃さ(輝度)を測定して画数の代わりに使用しています。 環境 windows10 home Anaconda 3/ jupyter notebook 5.6.0 Python 3.7.0 Pillow 5.2.0 準備 画像ファイルはフリー写真素材ぱくたそからダウンロードさせていただき、jupyter notebookファイル(***.ipynb)と同じディレクトリに保存しました(使用した画像サイズは800x1195)。 model.jpg 置き換える文字列は小学校1年生で習う漢字を用いました。また空白の描画のため全角スペース

    アスキーアートを自動生成する - Pythonでいろいろやってみる
  • R ユーザーへの pandas 実践ガイド - Qiita

    概要 R で tidyverse (dplyr+tidyr) に使い慣れているが, Python に乗り換えると pandas がどうも使いにくい, と感じている人の視点で, Rの dplyr などとの比較を通して, pandas の効率的な使い方について書いています. そのため, 「R ユーザーへの」と書きましたが, R経験のない pandas ユーザーであってもなんらかの役に立つと思います. また, 自社インターン学生に対する教材も兼ねています. どちらかというと, 初歩を覚えたての初心者向けの記事となっています. データ分析は一発で終わることはまずなく, 集計・前処理を探索的に行う必要があります. よって, プログラムを頻繁に書き直す必要があり, 普段以上に保守性のある書き方, 例えば参照透過性を考慮した書き方をしたほうが便利です. R の tidyverse の強みとして, 再帰代

    R ユーザーへの pandas 実践ガイド - Qiita
  • Practical Data Science with R and Python: 実践的データサイエンス

    実践的データサイエンス はじめに データ分析のためにコンピュータを利用する際、RおよびPython言語のいずれかを使うことが多いと思います(Julia言語は高レベル・高パフォーマンスな技術計算のための言語で今後期待が膨らみます)。これらの2つの言語では、データ操作や可視化、データ分析、モデリングに使われるライブラリが豊富にあり、 どれを使うのが良いのか迷うような状況が続いていました。しかしその状態は落ち着きを見せ、成熟期を迎えつつあります。 R言語ではパイプ演算子の登場によりデータフレームに対する操作に大きな変化が生じ、tidyverseによるデータ読み込みからデータ整形、可視化までが可能になりました。またtidyverseのような、機械や人間の双方が扱いやすいパッケージが増えてきました。特にR言語の強力な一面でもあったデータ分析の操作はtidymodelsに代表されるパッケージがユーザの

  • Why are you using Python ? Rによる自動集計ガイド - Qiita

    ※タイトルで煽るのは良くないと思ったのでタイトルを変えました。 まだExcelで消耗してるの?Pythonによる自動集計ガイド 基礎編 - Qiitaを読んでいて(Rのが絶対便利…!)というお気持ちが強まってきたので勢い余って書きました。 はじめに PythonColaboratoryで手軽に試せて非常に良いです。実は、RもColaboratoryから使うことができます。ColaboratoryにはRのカーネルが既に入っているのですが、表から見えないようになっているだけなのです。 そこで、見えるようにしたものを用意しました。 R Example - Colaboratory このノートブックを使えば、Rだってすぐ試せます(もうちょっと詳しい説明はColaboratoryでRやSwiftを使う - Qiitaをどうぞ)。 試して下さい。今すぐ。 使用するパッケージ 主にdplyrを使います

    Why are you using Python ? Rによる自動集計ガイド - Qiita
  • GitHub - FavioVazquez/ds-cheatsheets: List of Data Science Cheatsheets to rule the world

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - FavioVazquez/ds-cheatsheets: List of Data Science Cheatsheets to rule the world
  • 【Python】RプログラマーのためのPython入門 - 歩いたら休め

    会社に優秀な後輩が入ってきて、優秀な先輩(私でゎない)の助けを得ながら、立派な分析者・Rプログラマーとして成長しつつあります。 しかし、R言語だけで全ての作業が完結できるわけではありません。手元でデータを加工・分析するための環境としては素晴らしいのですが、大規模な計算では遅かったり(パフォーマンスを上げるにしても工夫が必要だったり)、クラスベースのオブジェクト指向が無いため、プログラムが大きくなるにつれて関数の整理が難しかったり、言語としてつらい面も多いです。 また、データ分析して作ったモデルをサービスに乗せる際には別の言語を使う必要があると思います。一応、shinyというWEBアプリを作るためのライブラリもあるものの、「社外向けのサービスでバリバリ使ってるぜ!」という話は聞いたことがありません。 というわけで、R言語メインのプログラマーが、一歩進んでスクリプト言語(Python)が抵抗な

    【Python】RプログラマーのためのPython入門 - 歩いたら休め
  • データ分析環境の構築にDockerを利用しよう

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 📜 要約 コンテナー管理ソフトウェアのDockerを利用することで、データ分析の場面で利用頻度の高いRおよびPythonの分析環境として実行することが出来るRStudio Server、Jupyter、Beaker Notebookを容易に構築可能になる。Dockerを使うことの利点として、複数人でのデータ分析や将来の利用面においてデータ分析結果の再現性を高められると考えられる。 🍵 前置き〜データ分析者が直面する再現性への挑戦 データ分析の結果が、自分以外では再現できない、同じデータを使っているのにナンデ!?ということが時々ありま

    データ分析環境の構築にDockerを利用しよう
  • Python pandas + folium で Leaflet をもっと使いたい - StatsFragments

    先日参加させていただいた Japan.R でこんな話を聞いた。 RPubs - leafletではじめるRによる地図プロット Python でも folium というパッケージを使うと JavaScript を書かなくても Leaflet.js の一部機能が使えるのだがあまり情報がない。上の資料に書いてあるようなことが folium でもできるのか調べたい。 folium については前にこんなエントリを書いた。 sinhrks.hatenablog.com データの準備 import numpy as np np.__version__ # '1.10.2' import pandas as pd pd.__version__ # u'0.17.1' サンプルデータとして Wikipedia にある アメリカの国立公園 のデータを使う。まずは pd.read_html でデータを読みこむ。

    Python pandas + folium で Leaflet をもっと使いたい - StatsFragments
  • Python for R Users

    A side by side comparison of using Python for R users using a standard data science/ analytics workflow

    Python for R Users
  • 最適化超入門 - tkm2261's blog

    SlideShareだけでなく、ブログの記事にもすることに 先日、TokyoWebMning #40にて最適化について熱く語ってきました。 最適化超入門 from tkm2261 個人的にも結構やりきった感があり、網羅的に最適化手法を紹介出来たと思います。 その後飲んだ研究室の同期には『難しすぎる』と言われましたが、どうなんでしょう・・・ 一応はてブが400を超えており、大丈夫だったと信じたい。 というか、最適化の話題ではてブこんなに頂けるのは予想外でした。ありがとうございます! はてなブックマーク - 最適化超入門 PyData Tokyoの方にもお声掛け頂いたのでまたどこかでお話出来ればと思ってます。 次はセクシー女優みたいにしょーもない話にする予定ですw 今回は修士卒の人間が最適化の入門資料を作る事のは、おこがましいと戦々恐々していたのですが、 Twitter上では概ね好評であり、安

    最適化超入門 - tkm2261's blog
  • 櫻田潤 | インフォグラフィック・エディター

    ビジュアルの力で世界を丸くする。 地球の形状が「丸い」のは、そこで暮らす僕たちにひとつの「ビジョン」を指し示しています。地球の形と同じように、世界で起こっていることのすべてが丸く収まっていれば良いのですが、現実は違います。 大小いろいろな規模の摩擦がいたるところに発生し、繰り返されます。その解決に必要なのは、お互いの「考え」や「価値観」「立場」、「状況」「状態」を示し、認め合うことです。そのために、「ビジュアル」の力を活用していきます。

    櫻田潤 | インフォグラフィック・エディター
  • 1