サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
Wikipedia
r-std.hatenablog.com
本記事ではTwitter上のtweetデータを自動収集する方法をご紹介します。APIを使用しなくても、tweetデータを簡単に自動収集することができます。今回はグーグルスプレッドシート上のTwitter Archiverというアプリを利用します。 Twitter Archiverの使い方 自動取得できるデータ Twitter Archiverの使い方 使い方の手順は次のとおりです。 1. まずグーグルスプレッドシートで空のシートを開きます。 空のグーグルスプレッドシート 2. Ad-onsを開きます Ad-onsを開きます 3. "Twitter Archiver"で検索をかけます。 検索結果 4. ダウンロードして、twitterアカウントと連携させます。 twitterアカウントとの連携 5. 検索条件を設定します。 検索条件の設定 6. 設定した検索条件に従って、1時間おきに100件
本記事では機械学習の手法を用いてサザエさんのじゃんけんの手を予測します。前回の記事もご覧ください。 r-std.hatenablog.com 今回の記事では2017年までのサザエさんのじゃんけんの手のデータに基づき、2018年のじゃんけんの手を予測します。予測手法を前回からさらに高度化し、サザエさんのじゃんけんの手の予測に重要な変数を特定します。 1.予測をさらに精緻化してみる 1-1.変数の追加 1-2.勝ち負けの重みづけ 2.重要度の高い特徴量を明らかにする 2-1.決定木を使ってみる 2-2.ランダムフォレストを使ってみる MeanDecreaseAccuracy MeanDecreaseGini 3.2018年の結論 4.2018年の分析の感想 5.参考文献 1.予測をさらに精緻化してみる 1-1.変数の追加 前回から次の2つのデータの追加を行います。 ・サザエさんが4回前に出した
今回は機械学習と保険数理の違いについて、数式を用いて比較してみます。 1.機械学習の汎化誤差 2.保険数理の推定二乗誤差 3.両者の数式の比較 1.機械学習の汎化誤差 まずは機械学習で扱われる汎化誤差(Test error)について数式を見てみます。汎化誤差とは訓練誤差(Training error)に対する概念で、「観測されていない新たなデータを予測した時に生じる誤差」のことを指します。 以下の数式はScott Fortmann-Roeのessayからの引用です。 scott.fortmann-roe.com 確率変数Yはによってモデル化され、は理論値、はノイズを意味しています。一方では予測値を意味しており、との推定二乗誤差である(=汎化誤差)を分解するのが上式の狙いです。 ポイントとなるのは、予測値が定数ではなく、訓練データに従って変動する確率変数として表現されることです。予測値の不確
今回は初心に帰ってスイス銀行紙幣を取り扱います。使用するデータは以前の記事と同じものです。 r-std.hatenablog.com 真札と偽札が含まれるスイス銀行紙幣のデータについて、線形判別分析、二次判別分析を行って識別したところ、高い精度で識別を行うことができました。以前の記事では誤識別されたデータ(下記散布図のピンク色の点)について、「真札中の異常値である」と評価をしていました。 本記事では当該データが本当に異常値であるかを検証します。真札のデータのみが得られている状況から異常値の特定を行い、当該データが異常値として検出されることを確認します。今回は2つの方法を用いて検証します。 1.MT(マハラノビス・タグチ)法 2.One Class SVM法 3.MT法とOne Class SVM法の違い 4.両者の使い分けの注意点 1.MT(マハラノビス・タグチ)法 名前のとおりマハラノビ
本記事では自分が統計検定準1級を受験した際の勉強方法についてまとめます。 1.試験の特徴 2.使用した参考書 3.終わりに 1.試験の特徴 統計検定は専用の参考書などがまだ少なく、独学を中心に勉強を進める必要があります。その一方で試験範囲は非常に広いものになっており、全範囲を満遍なく学習しておく必要があります。アクチュアリー試験の数学と比較すると、多変量解析や機械学習のトピックが含まれていることが注意点になります。 統計検定準1級の試験問題は、前半の選択問題及び部分記述問題、後半の論述問題に大きく分かれます。それぞれに足切りなどは設定されていないようですが、時間配分が偏らないように配慮するとともに、バランスよく点数をとれるように実力をつける必要があります。自分が受験した際には、前半の計算問題などで確実に得点できるよう問題演習を行うとともに、後半で的外れな記述をしないように過去問の研究を行い
本記事では、オンライン麻雀ゲーム「天鳳」の成績データを分析し、良い戦績をあげているプレーヤーの特徴を明らかにします。 1.天鳳について 2.用いたデータ 2-1.成績データ 2-2.和了データ 2-3.放銃データ 2-4.打ち回しデータ 3.重回帰分析 4.結論 1.天鳳について 天鳳はネット麻雀の中で最も流行っているサービスの一つです。全国の猛者と自動で対戦できる手軽さが人気で、十数万ものプレーヤーがいると言われています。その中で優秀な成績をあげている強者たちの多くは、自分の対局をデジタル形式で記録し、データ分析を行ってさらなる高みを目指しています。 今回は、天鳳強者たちの牌譜解析データを分析し、彼らの成績から1.良い戦績をあげているプレーヤーの特徴を明らかにし、2.強者の打ち筋についてどのようなタイプがあるのかを探ってみます。 2.用いたデータ http://tenhou7.s350.
このページを最初にブックマークしてみませんか?
『r-std.hatenablog.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く