タグ

stanとjudgeに関するmanabouのブックマーク (2)

  • StanでAizu Online Judgeの難易度・習熟度を推定したい(3:IRTモデルによる習熟度推定) - くじらにっき++

    シリーズ一覧 kujira16.hateblo.jp kujira16.hateblo.jp はじめに 前回までの記事を公開したところ,Twitterで「問題に取り組んだときの正答確率の部分を項目応答理論でモデリングしないのはなぜか」というコメントをいただきました。 …すいません,項目応答理論というものを知りませんでした。 指摘を頂いてから勉強したのですが,この方法でモデリングするほうが自然だと感じたので,これからは正答確率の部分を項目応答理論でモデリングしていきたいと思います。 モデル式 項目応答理論の1パラメータロジスティックモデルでは,習熟度 の人が 難易度 の問題に正答する確率 を以下のようにモデリングします*1。 ここで はロジスティック関数 です。 項目応答理論では被験者の習熟度と問題の難易度を同時に推定しますが,今回の記事で使うデータでは一部の問題については難易度が既に付与さ

  • StanでAizu Online Judgeの難易度・習熟度を推定したい(2:人工データによる実験) - くじらにっき++

    シリーズ一覧 kujira16.hateblo.jp kujira16.hateblo.jp 目的 あるユーザがある問題に正答したというデータは得られますが,正答していない問題は,取り組んだけれども実力不足で解けなかったのか,そもそも取り組んでいないのかを区別することができません。データの生成過程についての仮説が正しかったとしても,パラメータの自由度が高すぎてパラメータ推定が行えないかもしれません。 そのため,データの生成過程についての仮説は正しいと仮定して,パラメータ推定が収束するかどうか確かめるために,人工データに対してパラメータが正しく推定できるか実験してみることにしました。 人工データの生成 問題に取り組む確率が ,平均的なパフォーマンスが ,パフォーマンスのばらつきが のユーザが1人いて,[100, 1200] の一様分布に従う難易度の問題が50問ある状況を考えます。ユーザは,前

  • 1