You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Detect the location of keypoints on face images
ggplot2にはデータを分割プロットする「facet_wrap」や「facet_grid」コマンドが収録されています。これらコマンドは非常に便利ですが、分割前のプロットは別途コマンド実行が必要です。本パッケージには分割前と指定したグループを拡大表示してくれる「facet_zoom」コマンドが収録されています。「facet_wrap」や「facet_grid」コマンドと使用目的が異なりますが便利なので紹介します。 なお、「facet_zoom」コマンドの例は散布図ですが箱ひげ図や折れ線グラフなども適応可能です。 パッケージバージョンは0.4.1。実行コマンドはwindows 11のR version 4.2.1で確認しています。 パッケージのインストール下記コマンドを実行してください。 #パッケージのインストール install.packages("ggforce")実行コマンドの紹介詳細
応用範囲が広く幅広い視点からの説明になりがちなベイズ最適化について、本記事では機械学習のハイパーパラメータ探索に利用することに限定して解説します。 1. はじめに 最近、ベイズ最適化という手法が注目を集めています。 ベイズ最適化 (Bayesian Optimization) とは、形状がわからない関数 (ブラックボックス関数) の最大値 (または最小値) を求めるための手法です。 ベイズ最適化についての入門記事は Web 上にすでにいくつかありますが、ベイズ最適化は応用範囲が広く、入門記事は様々な応用に向けた幅広い視点からの説明になりがちです。 本記事では、機械学習ユーザに向けて、ベイズ最適化を機械学習のハイパーパラメータ探索に利用することに限定して説明します。 これにより、機械学習に対して、ベイズ最適化がどのように利用できるのかを分かりやすく解説したいと思います。 2. ハイパーパラメ
この記事が想定する読者層 もしあなたが「プログラマー」ならば、この記事はまるで不要かもしれません。 ここで言うプログラマーとは、たとえば以下のような習慣を持っている人です。 ほとんど同じ処理をソースコード中に2回以上書いていたら違和感を感じる 出力結果が変わらなくても、実行速度や理解しやすさのためにソースコードを書き直すことがある Gitなどのバージョン管理システムを使うことができ、過去のソースコードを「日付の含まれたファイル名でバージョンごとに別ファイルとして保存しておけばよい」とは考えない 動作テストを自動化し、ソースコードを書き換えてもそれぞれの関数の挙動が意図したものになっているかを確認できる この記事は、ひょんなことからRに出会い、コードをコピペで動かせるようになり、 「いつかコピペじゃないコードが書けるようになりたい」 「他のプログラミング言語もできるようになりたい」 とぼんや
1. はじめに ブートストラップ信頼区間について調べていたんですが、理論的な求め方は教科書などに載っているのですが、実践的な情報が少ないように思います。 今回、少し調査してみて、実際に適用する際に注意が必要だなと感じたことについて書いておきます。 2. ブートストラップ信頼区間 ブートストラップ法は、理論的に求めるのが難しい統計量を、経験分布からのシンプルなリサンプリングによって推定できるという手法です。 ブートストラップ法では、推定された統計量に対して、その信頼区間を求めることもできます。 このような信頼区間をブートストラップ信頼区間といいます。 ブートストラップ信頼区間を求める方法については色々議論があるようですが、主な手法は次の5つです。 正規分布近似法 ベーシック法 パーセンタイル法 BCa法(bias-corrected and accelerated percentile me
I look at differences in a side-by-side, from a practitioner’s perspective. In R, the open source statistical computing language, there are a lot of ways to do the same thing. Especially with visualization. R comes with built-in functionality for charts and graphs, typically referred to as base graphics. Then there are R packages that extend functionality. Although there are many packages, ggplot2
geom_lineするとき、NAが入っているとそこで線が途切れてしまう。 library("ggplot2") smp <- data.frame(x = 1:5, y = c(1:3, NA, 5)) ggplot(smp, aes(x = x, y = y, group = 1)) + geom_line() + geom_point() あらかじめNAを除いておけば、線をつないでくれる。 ggplot(subset(smp, !is.na(y)), aes(x = x, y = y, group = 1)) + geom_line() + geom_point() なんだか毎回やり方を調べてる気がするのでメモ。
Rでテキストファイルの読み込みからデータ加工の流れ(前処理)で覚えておくとかなり便利、あるいはよくハマるポイントを中心に。 細かい知識が多いのだがまとまったものがなかったのでまとめてみた。 ありがちなハマりを回避して作業効率を上げるために。 データの読み込み データファイルの読み込み プロジェクトごとにワーキングディレクトリをセットするといい CSVファイルの読み込み read.csv()はヘッダありが前提。 文字コード fileEncoding="文字コード名"で指定できる。Windowsで作ったCSVを読み込む際、BOMが付いていることがあるのでfileEncoding="UTF-8-BOM"とする 文字列の扱い 文字列が自動的にfactor型になるので、不都合な場合はstringsAsFactors=Fを指定する 欠損値の扱い 欠損値が空欄であったり、データベースからエクスポートした
Rには豊富な外部パッケージがあり、それらを使うことで より大きなデータ(「ビッグデータ」ではないが)や新しい手法を扱えるようになる。 パッケージを知っているのと知らないのとで分析作業効率に雲泥の差がある一方で、 パッケージ数は多く、同じような目的のパッケージが複数ある。 日本語で詳細に説明されたものも少ない。 単純な日本語訳は http://www.trifields.jp/statistical-analysis-r-cran-packages-341 にある(ありがたい!)が、 よく使うもの、この目的・手法ではこれがいいのではないかというものを目的別に分類して厳選してみた。 以下に記載のないものはデフォルトで組み込まれているか、以下のパッケージが自動で使用する(依存関係)パッケージである。 data.table系 → {data.table} sparse matrix系 → {Mat
RでPDFを生成する際にフォントの扱いが問題になる。特に最近はすべてのフォントを埋め込む(embedする)よう指示されるので,それに対応する方法をまとめておく。 PDFにフォントが埋め込まれているかどうか調べるには,Adobe Readerで開いてファイル→プロパティ→フォントで調べるか,あるいはXpdfの pdffonts コマンドで調べる。 以下はMac(El Capitan)および一部Windows 10,CentOS 7上のR 3.2.3でテストした。 pdf() による方法 関数 pdf() を使う方法である。フォントについては R News の Volume 6/2 pp.41-46 に詳しい。 pdf("pdf-ex.pdf", family="Japan1GothicBBB", width=7, height=4) par(mgp=c(2,0.8,0)) curve(dno
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く