サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ノーベル賞
kusanagi.hatenablog.jp
『英語教育のエビデンス』 2021年度はコロナ禍もあり,所属組織が変わったりなどといっているうちに,すっかりこのブログからも手が離れてしまいました。この間に,研究社から私も複数章執筆した『英語教育のエビデンス―これからの英語教育研究のために』が出版されました。 www.amazon.co.jp 私は以下の章を担当しました。 第一章「英語教育研究の新たな原則―エビデンスについて考える前に」 第八章「測定モデルと共通変数を問う―PK-Testを事例に」(工藤洋路先生と分担執筆) 第九章「これからの英語教育研究のあり方を考えて」 『英語教育のエビデンス』へのコメント 幸いなことに,私を含む著者らが思っている以上に多くの方が手に取っていただいているようです。著者陣の中では比較的無名というか,一番の若手である私のところにすら,相当数のコメント,感想,質問などが届いて,とてもびっくりしました。先日も関
英語教育研究の査読で困った!サドコマシリーズ第4弾!とてもご好評いただいております!シェアしてくださると嬉しいです!! このシリーズについては↓ kusanagi.hatenablog.jp 第4弾では,英語教育研究における「効果量(effect size)に関わる誤解」についての私見を述べます。国内の英語教育研究では,2010年頃から効果量を報告する論文が徐々に増加しました。しかし,それに伴って効果量について根本的な誤解をもったまま研究を進める例が目立つようになりました。そのもっとも典型的な例は,「検定結果は有意ではなかったが,効果量が大を示した。このことから,実質科学的にこの指導法の効果はあったものと考えられる」といった主張です。この主張のどのような点が問題になるのでしょうか?そして英語教育研究において,効果量の報告にはどのような意義があるのでしょうか? *あくまでもこの記事は英語教育
英語教育研究の査読で困った!サドコマシリーズ第三弾!とてもご好評いただいております!シェアしてくださると嬉しいです! このシリーズについては↓ kusanagi.hatenablog.jp こんにちは,草薙です!第3弾では,英語教育研究において頻繁に見られる「検定を多数繰り返している論文」(多重検定論文)についての私見を述べます。はっきり言って,この問題は深刻です。英語教育研究の発展を妨げるもののランキングがあったら,漏れなく5位には入るでしょう。そのため,今回の記事は特に長いです。なにせ,このシリーズの中で一番気合を入れて書いてますから。 さて,統計的帰無仮説検定において,検定の繰り返しはよくないこととして広く知られています。英語教育研究においても,1990年代後半から現在に至るまで,検定の多重性の問題は一部の研究者によって繰り返し指摘されてきました。しかし,2020年においても検定の多
このシリーズについて 私の動機 英語教育研究の現状認識 個人的な動機といきさつ 取り上げるトピック 現在公開中の記事 このシリーズについて このシリーズでは,英語教育研究でしばしば問題になる統計処理のあり方について私見を述べます。後で詳しく書きますが,毎週1本程度,「英語教育研究の統計関係に関して査読で困ったら読む記事」という体裁でカジュアルな統計記事を定期的にアップしていきたいと思います。略してサドコマです。現在のところ10回のシリーズものとして計画しています。(ということで自分自身にペースを課しています) 想定する読者さまは,査読者として,統計関係の評価に悩んでいる方と,投稿者として,査読者対応に悩んでいる方の両方です。内容は,あくまでも,私,草薙個人の私見によります。一研究者としての知見の陳述としてのみ,責任を持つ所存です。私の所属先や,私が所属する学会の見解ではないことに留意してく
よくわからない研究の話に巻き込まれる! 私は,大学において外国語科目の授業を行い,外国語の教育,特に高等教育におけるそれに関することを一応研究上の専門としているのだけど,この分野は「〇〇学」と一括りにできるようなものではない。たとえば,私の学位は学術であって〇〇学ではないし,関連学会にはさまざまな「学」を名乗る方が混在している。まあ,平たくいえば,学際分野のひとつになっているわけ。 学際分野といえば聞こえはいいけど,要するにさまざまな経歴,背景,信条,技術をお持ちの方が近くにいっぱいいらっしゃるわけで,具体的にいえば,文学,言語学,教育学,心理学,最近では工学,経済学,社会学などに関連するキャリアをおもちの方々がひとつの学会に集まったり,査読をしあったりするというわけだ。上記のような名前が入る学会にこちらから勉強しにいくこともある。 根本的に私が不勉強なだけなのかもだけど,当然ながら,この
どうでもいいことなんだけど,ジニ係数はいくつかの分布であれば,分布の母数から直接的にもとまるんだそうだ。 ワイブル分布,対数正規分布,ガンマ分布を例に取ると,ワイブル分布とガンマ分布なら形状母数k(またはα)のみから,対数正規分布ならσのみから直接ジニ係数がもとまる。これらを計算するRの関数を作ってみる。 #ガンマ分布 gamma.gini<-function(a){ gini<-gamma((2*a+1)/2)/k/gamma(a)/sqrt(pi) gini } #ワイブル分布 weibull.gini<-function(k){ gini<-1-2^(-1/k) gini } #対数正規分布 lognorm.gini<-function(s){ gini<-2*pnorm(s/2*sqrt(2))-1 gini } あるデータの分布がワイブル分布に従っているとして,その形状母数kが2
最近,モデルってことばが思ったよりもすげえ重要だなって思うようになった。自分の分野(外国語教育)だとあまり聞かない用語だから,避けてたけど,これむしろ積極的に使ったほうがいいな。 モデルってのはモデル化したいものそのものじゃない。別にこの世に斉一性をもたらす,この世を統率している原理だとか,そんな中二病的なもんじゃない。 よくある例のように,たかしくんが一時間で5km歩くってのを時速5kmというモデルで表せるわけだけど,たかしくんが頑張って歩いている現象それ自体ではないし,たかしくんがそのルールに支配されているわけでもない。たまたま,それ以外は捨象シテヨシ!っていう条件下で,結果としてうまくいくってだけのこと。この,何なら捨象シテヨシか,そして何なら捨象ダメかって考えるかってのもすげえ重要なことだ。それは俺達の現実世界のさまざまな秩序とかに与えられている。帰結に何が求められるかってことで
ある確率分布を手持ちの単変量データに当てはめ,その母数を最尤推定するという方法があって,Rでは通常MASSパッケージのfitdistr関数を使うのがお手軽なんだけど,fitdistrplusという便利なパッケージが出ていてこれがとてもいいかも。ま,結局はoptimにかぶせているだけだが。 例えば, さまざまな可視化 ブートストラップ 任意の母数を固定した状態での別の母数の推定 最尤推定以外の方法 適合度比較 みたいなのをかなり手軽にやってくれる。いちいち自分で書かなくてもいい。 可視化 たとえば,可視化に関してならば, #数値例の作成 library(fitdistrplus) dat<-rgamma(300,2,3) #分布の確認 hist(dat) plot(ecdf(dat)) #これをガンマ分布に当てはめてみる fit<-fitdist(dat,"gamma") plot(fit)
今更だけど,BESTっていうパッケージなんだって。 Bayesian Estimation Supersedes the T-testということでBESTパッケージ。うむうむ。 https://cran.r-project.org/web/packages/BEST/vignettes/BEST.pdf CRAN - Package BEST なるほどね。 基本はまずJAGSでMCMCするってことらしい。Rに通訳さんパッケージがいるのね。 なのでJAGSをインストールしないと使えない。 JAGS: Just Another Gibbs Sampler - Browse /JAGS/4.x at SourceForge.net まあ,要は2つのベクトルの母平均差や差得点の母標準偏差や効果量などの分布を求めたいってことね。 結局,例えば「標準化平均差のベイズ信用区間(credible inte
これで外国語教育でやるような処理は大体できると思う。ご自由にどうぞ。 library(retimes) #ない場合はインストールすること library(MASS) library(ks) x<-rexgauss(1000,300,200,500) #数値例の生成 #基礎 x<-x[!is.na(x)] #欠損の除外(ここにはない) summary(x) #5数要約+平均 skew(x) #歪度 quantile(x,seq(0,1,.1)) #10%点ずつ quantile(x,seq(0,1,.05)) #5%点ずつ data.frame("Counts"=hist(x)$counts,"Breaks"=hist(x)$breaks[-1]) #度数分布表 #外れ値 y1<-x[x<mean(x)+2*sd(x)] #2SD以上を除去 length(y1)/length(x) #除去率
背景 卒業論文や修士論文で,指導教官や先輩,または投稿論文で査読者から「標準偏差」を報告しなさいと言われたことがある方も多いと思います。 ただ,「標準偏差とはなにか」を理解することは簡単じゃありません(と考えるひともいるようです)。 ここでは,外国語教育を専攻している方を念頭に置いて,標準偏差とはなにか,できるだけわかりやすく解説します。 標準偏差は何の指標? 標準偏差(standard deviation, SD)は,データがもっている散布度(ばらつき)の指標です。散布度とは,データのなかで個々の値が散らばっている(ばらついている)度合いを示します。散らばっているというのは,ざっくりいうと,高い値も低い値もあるということだと考えてもOKです。下のグラフを見てください。横軸が人(1番さんから10番さん),縦軸がテストの点数です。 左のグラフでは,みんなが同じくらいの点数です。一方,右のグラ
背景:教育的処遇の効果をみるさまざまな方法 (某先生を真似して会話形式で) 教師:ちょっと工夫した指導をして,事前事後のデータとったった。 平均差を見る専門家:おお!10点平均点が伸びてる!これは効果的な指導法だ! 統計的仮説検定をする専門家:ちょっとまてちょっとまてお兄さん,どれどれ…指導法による平均差を0だと仮定したうえで,君のデータの標本サイズと,標準偏差と平均点からみたら,確率的にはちょっと整合性がなさそうな感じ。そうだなー,効果がなかったとはいえないかも。 効果量を解釈する専門家:エー!「効果がなかったとはいえない」って…それだけ?それに,たとえば,単純に標本サイズ多くなれば,どんどん「効果がなかったとはいえなくなる」じゃん。効果量の値を見ようぜ値を。d = .2くらいだから,小ってとこでしょ。 リスクを考えるひと:え?たとえ効果量が大きくても,伸びないひととか,逆に下がるひとも
実務上,効果量がさっぱりわからない件 効果量は集団に対してあるものなので,効果量でもって個々のケースの振る舞いについて議論するときには無理があるときがある。「ある現象の効果が(ある程度の精度や確証をもって)観測できるか」どうかという理論実証型の考えかた(私がニガテな)とは違い,外国語教育などといった実務的な側面では,理論家やアカデミアの人とは違って,得てして(いつも幽霊みたいな)母数といったよくわからないものよりも,個々のケース(子ども,生徒,学生,顧客)の振る舞いについて知りたい場合が多い。 だから記述統計に努めましょう,可視化に努めましょう,推測統計はしなくてよい,そういう考えかたも立派でいいのだけど。ねえ。ツールとかいろいろ大事という話。 効果量は,はっきりいって外国語教育の実務的な観点では,さっぱりわかりにくい(少なくとも私のような浅学のものには)。そもそも測定のスケールに依存しな
評定者間信頼性かあ。Rでやったことがない。 でも調べたらやっぱあった。知らんかった。 http://cran.r-project.org/web/packages/irr/irr.pdf 水本先生*1のκ係数についてのページにあるデータを例にしよう。 カッパ係数 評定者A 評定者A 1 b b 2 a a 3 c c 4 b b 5 b c 6 c c 7 b c 8 a a 9 c c 10 c c 11 c c 12 c c 13 b b 14 a a 15 b b 16 c c 17 a b 18 c c 19 a a 20 b b こんなデータ。 まずirrパッケージをインストール。 install.packages("irr") 使えるようにする。 library(irr) 準備はOK。 データを読み込む。 「数字のところだけ」エクセルとかでコピーして, dat<-read.ta
自分のためのメモ。 因子分析したら因子分析の結果だけ,構造方程式モデリングしたらパス図だけ,そういうのはちょっと好かない。殆どの場合相関行列があればそういうのは再現できるし,相関行列だって上手に可視化したら,例えば因子分析くらいの見通しはつく。これは,研究報告の透明性というのにもつながる。 ただ論文には紙幅の都合があって,いつでも,というわけにはいかないけど。 とにかく多変数の相関行列に対応するようなデータの可視化について,Rを用いてメモしていく。自分ですぐ忘れてしまうから。 (スクリプトの中に不自然に半角スペースとか入っているのは,hatena記法と変に被るところを避けるため) 散布図行列(SPLOM) 一番てっとり早い方法。 まずRのデフォルト関数で「データフレーム形式」でデータを読み込む。 例えばエクセルからクリップボードにコピーした状態なら, dat<- read="" table
このページを最初にブックマークしてみませんか?
『kusanagi.hatenablog.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く