2022年8月28日に実施された統計思考院 オンラインワークショップ「探索的ビッグデータ解析と再現可能研究」https://sites.google.com/view/ws-ebda-rr-2022/ の発表資料です。 スライドの中のRコードは https://github.com/uribo/220828ism_ws にあげています。
![Rによるデータ可視化と地図表現](https://cdn-ak-scissors.b.st-hatena.com/image/square/f0afb7ceb838a591ca5c9e27904cac9029cfda01/height=288;version=1;width=512/https%3A%2F%2Ffiles.speakerdeck.com%2Fpresentations%2Fdedef953150148ecaae7e7c2a493529b%2Fslide_0.jpg%3F22471815)
From Data to Viz leads you to the most appropriate graph for your data. It links to the code to build it and lists common caveats you should avoid. What kind of data do you have? Pick the main type using the buttons below. Then let the decision tree guide you toward your graphic possibilities. Alternatively, check the complete decision tree.
国土数値情報のデータの読み込みやデータの列名、コードリストを簡単に変換できるパッケージの紹介です。大変便利です。 国土数値情報「鉄道時系列データ」のN05-20_GML.zipを読み込んだ例で紹介します。 国土数値情報「鉄道時系列データ」:https://nlftp.mlit.go.jp/ksj/gml/datalist/KsjTmplt-N05-v1_3.html パッケージバージョンは1.0.0。実行コマンドはwindows 11のR version 4.1.2で確認しています。 #パッケージの読み込み library("kokudosuuchi") #ダウンロードしたzipファイルを選択 library("tcltk") TestData <- paste0(as.character(tkgetOpenFile(title = "zipファイルを選択", filetypes = '{
ggplot2でグラフを作っているときに困ること ggplot2を用いてR上で作図を行っていると なんかデフォルトだとx軸とy軸見えないから書き込みたいな 背景を灰色じゃなくて白にしたい! x軸のタイトルを消して、x軸のラベルをななめ書きにしたいな… などのグラフの見た目に関わる変更を行いたいときがあると思います。 しかし、このような変更をどのようなコードで実行すればよいのかわからず困るかもしれません。 そんな時には… themeで軸の書き込み! # Before ggplot(iris, aes(x = Sepal.Length, Sepal.Width, color = Species)) + geom_point() # After ggplot(iris, aes(x = Sepal.Length, Sepal.Width, color = Species)) + geom_poi
PythonやR対応の統合開発環境「JupyterLab 3.0」正式リリース。ビジュアルデバッガー搭載、レスポンシブ対応でモバイルデバイスの狭い画面でも使いやすく Project Jupyterは、オープンソースで開発されているWebIDE「JupyterLab 3.0」の正式リリースを発表しました。 JupyterLab 3.0 is released! - visual debugger - support for multiple display languages - table of content for notebooks - improved extension system. Check out the announcement blog post.https://t.co/pUBiZEYH4c — Project Jupyter (@ProjectJupyter) J
都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト はじめに 今回は、今後仕事で使いたいという思いもあり、RでUplift Modelingに関して便利なパッケージがないか探した結果、2019年に登場したばかりのtools4upliftの存在を知りました。アップリフトモデリングのモチベーションに関しても簡単に説明しながら、サンプルデータで実践してみようと思います。 ・Uplift Modelingとはなにか ・Uplift Modelingの卑近な例え話 ・Uplift Modelingのサンプルデータ ・tools4
2021/9/10 追記: 改めて更新された話を統合して整理して書き直しました. 以降はこちらを参考にしてください: ill-identified.hatenablog.com 2021/1/15 追記: RStudio 1.4 がリリースされたのでなるべくアップデートしましょう 2020/12/06 追記: Japan.R で今回の話の要約+新情報を『Mac でも Windows でも, PNG でも PDF でもRのグラフに好きなフォントで日本語を表示したい (2020年最終版)/Display-CJK-Font-in-Any-Gpraphic-Device-and-Platform-2020 - Speaker Deck』として発表した. ハイライトは「近々出るRStudio 1.4 があれば fontregisterer はほぼいらなくなる」 2020/10/31 追記: geom
僕が筆者なので、この記事は書評ではなく紹介になります。まずこの本はRのシリーズの一冊にもかかわらずStanという統計モデリングのためのプログラミング言語の方がメインです。このようなわがままを許してくれた、ゆるいふところの深い石田先生と共立出版には感謝しかありません。 StanとRでベイズ統計モデリング (Wonderful R) 作者:健太郎, 松浦発売日: 2016/10/25メディア: 単行本 目次と概要 共立出版のページを見てください。GitHubのリポジトリもあります。 前提とする知識 「はじめに」の部分で触れていますが、確率と統計の基本的な知識はある方、R(やPython)で簡単なデータ加工や作図が一通りできる方を想定しています。そのため、確率分布なんて聞いたことがない、プログラミングがはじめて、Rがはじめて、という方が読み進めるのは厳しいかもしれません。なお、Rの基本的な関数し
概要・前置き 以前も何度か R で地図を作る方法を紹介していたが, 自分のプログラミングテクが雑なこともあり, 冗長なコードの掲載であまり便利でないのではという印象を持たれる恐れもあった. そこで, GUI で操作のできるわりに高機能な QGIS (Quantum GIS; QGISプロジェクトへようこそ!) の使い方についても紹介したいと考えていた. すると先日, 岩波DSが発売され, CAR モデルが取り上げられていたので, これと絡めて書くことにした. ただ, 実際は QGIS で直接 CAR の推定はできないので, 今回はあまり QGIS の出番はなく, 空間統計モデルの説明と R へのつなげ方がメインになってしまった…… 次回以降にデータハンドリングの場面での QGIS の強みを紹介したい…… 分量は PDF 換算 6ページ. 空間計量経済モデル主題である CAR ( Condi
ヒートマップをインタラクティブに操作する「d3heatmap」パッケージがリリースされました。本パッケージのメインコマンド”d3heatmap”はgplotsの「heatmap.2」コマンドと多くが共通しているので、これらパッケージの使用経験があるとすぐに使いこなせると思います。 ためしに本パッケージより「400*50の20,000データ」を出力したところ、多少のモタつきはありますがぐりぐり動きました。サーバー経由でなければ一般的な使用方法には十分かと思います。なお、距離の計算は搭載メモリに依存しますのでデータ数は使用環境により異なります。 また、紹介する出力結果は利便性を考えて「50*10の500データ」としています。最下部に表示しています。ぐりぐり動かしてみてください。 Rを使用し始めたころから考えると、これほど多くのインタラクティブな結果を出力するパッケージがリリースされるとは思って
HijiyamaR#3で発表しました。 階層ベイズを使った場合に,最尤法のAICと結果が大きく異なります。その問題についてどのように考えたらいいかについて発表しました。
◆教材 里洋平著 「戦略的データマイニング」 7章 ◆内容 1.効果測定の基本的な考え方 2.因果(施策)効果の推定 ・ランダムに割り当てられる場合 ・割当がランダムでない場合 ・共変量で調整する場合 3.傾向スコア解析 ・概要 ・傾向スコアを用いた調整法 ・Rによる実行Read less
berobero11さんが作った緑本(データ解析のための統計モデリング入門)のGLMのスライド(分布から見た線形モデル・GLM・GLMM)が素晴らしかったので、コードを参考にしつつアニメーションバージョンを作ってみた。データは緑本の第3章「一般化線形モデル(GLM)」図3.9で使ったもの。ggplot2を動画で保存する方法がわからなかったので、ImageMagickでGIF化した。GLMMはまだ作成中。 線形モデル(正規分布 / 恒等リンク関数 / β_0 + β_1 x) library(ggplot2) # データ読み込み # wget http://hosho.ees.hokudai.ac.jp/~kubo/stat/iwanamibook/kubobook_2012.zip # unzip kubobook_2012.zip # cd kubobook2012/chapter03
概要 ショートショートを予め用意したカテゴリに自動分類する。 R環境を通して、MeCabで形態素解析しナイーブベイズを使ってカテゴリを推測する。 環境設定 -> RMeCab のインストールと R を用いたテキスト処理(形態素解析など) -> ニコニコ大百科データからMeCab辞書を生成する 入力 フォルダにショートショートを格納する。 yyMMddhhmmss(フォルダ) |ーakga_01.txt(ショートショート) |ー : |ー : |ーakga_06.txt |ーnkmk_01.txt |ー : |ー : |ーnkmk_06.txt |ーxxxx_01.txt |ー : |ー : |ーxxxx_04.txt ※ファイルの接頭辞がカテゴリ名を表す。 akga/nkmkファイルが訓練データ。xxxxファイルが検証データ。 xxxx_01.txt,xxxx_02.txt=akga xx
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く