You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
TL;DR 書籍「効果検証入門 正しい比較のための因果推論/計量経済学の基礎」のRソースコードを、Pythonで(ほぼ)再現しました https://github.com/nekoumei/cibook-python 本記事では、主にRではライブラリどーん!で済むけどPythonではそうはいかない部分の解説をします 書籍の紹介 https://www.amazon.co.jp/dp/B0834JN23Y 上記Amazonに目次が載っているのでそれを見るのが早い気がしますが。。 とても良い本です。正確な意思決定を行うためにどうやってバイアスを取り除くか?に焦点を当てて種々の因果推論の手法(傾向スコア/DiD/RDDなど)をRソースコードによる実装とともに紹介されています。 全体を通して、現実問題の効果検証に因果推論を活用するにはどうすればいいか?という観点で書かれており、非常に実用的だなーと
コロナウイルス感染症の拡大により、外出自粛が求められている昨今。多くの人が家で自炊をしながら『おうち時間』を楽しんでいます。 そんな中、家族でわいわい楽しめる、お好み焼きなどの『粉もの料理』を作る人が急増中です。 お好み焼きといえば、キャベツが欠かせませんが、意外と難しいのが千切り。切り方1つで味が左右されるので、お好み焼き作りにおいては重要な工程です。 お好み焼き用ソースのメーカーとしておなじみのオタフクソース株式会社は、家で上手にお好み焼きを作るためのオンライン教室を公開しました。動画の中では、お好み焼きにぴったりなキャベツの切り方を分かりやすく紹介しています。 関西出身ではなく、家で上手にお好み焼きを作れたためしがない筆者。中でもキャベツの千切りが苦手で、太さがバラバラになったり、柔らかい葉と固い芯で形が均一にならなかったりすることが悩みでした。 動画で紹介されているコツをおさえなが
そんなあるときに、めもりーさんという方がPHPでJVMを実装しているツイートを見つけました。「これはおもしろいな」と思うと同時に「PHPでできるならRでもできるだろう」という思いがこみ上げてきて開発することにしました。 ー そんなに簡単にやってみようと思ったんですね(笑) もともとコンパイラやインタプリタは作ったことがあったので、仮想マシンも作れるかなって(笑) 私が作ったjvmrrはFizz BuzzくらいのJavaコードは実行することができるのですが、めもりーさんの資料のおかげで開発するためのハードルが低く済みました。 ー そもそもなぜRで「変なもの」を開発するようになったのでしょうか? Rって言語仕様が変わっていて本当におもしろいんですよ。それをもっとみんなに知ってほしくて言語仕様を活かしたものを作って公開するようになりました。Rってデータサイエンティストや研究者しか使わないイメージ
黒地に白抜きで「R」のロゴを書いたシールが渋谷や新宿といった繁華街の電柱や歩道用防護柵、道路標識などに多数貼られていることが分かった。7日投開票された東京都知事選で小池百合子都知事に敗れた前参院議員、蓮舫氏の支援者らが無許可で公共物に貼り付けた可能性が取り沙汰されている。蓮舫氏は無関係との立場だが、小池氏の陣営幹部らは早急に剥がすように求めている。 【写真】「女性の全裸選挙ポスター」をはがす候補者(一部画像処理をしています) 「蓮舫さん陣営は、街中に貼りまくった『R』のシールを早急に剥がしてください。やり口は暴走族やピンクチラシと同じですが、普通に犯罪だし笑えません。モラルが無さすぎる」 小池氏が特別顧問を務める地域政党「都民ファーストの会」幹事長を務める尾島紘平都議は5日、X(旧ツイッター)にこう投稿した。 尾島氏は新宿駅付近で30枚以上公共物などに貼られた「R」のシールを確認したとも指
連載目次 Python/Rコードの実行や機械学習/データサイエンスの実装を無料でオンライン実行できる環境といえば、Google Colaboratory(略してColab)が特に有名である。2021年12月1日、そのColabに強力なライバルが現れた。「Amazon SageMaker Studio Lab」(アマゾン・セージメーカー・スタジオ・ラボ)だ*1。 *1 日本語では「ラボ」だが、英語では「ラブ(Lab)」と発音するのが普通。「スタジオ」は英語では「ステューディオ(Studio)」。「セージ(Sage)」とは、ハーブや花の名前ではなく「学び経験を積んだ賢者(Wise old man、例えばハリー・ポッターのダンブルドア校長は魔法の賢者)」のことで、賢者は「機械学習モデル」を暗喩すると思われるが、一説にはマーケティング目的で独自用語にするためにランダムな単語生成で命名されたという噂
Pythonで統計処理をしているが、Rでコードを書いたことがない方々のために、30分から1時間で読めるR入門を書きました。この記事の R Markdown 文書と実行環境は、こちらの GitHubレポジトリ にあります。 目次 準備 プログラミング言語Rの基本 基本型 演算 Assertion ベクトルの要素数とrange リスト DataFrame (tibble) Matrix 関数 いろいろな処理と込み入った話題 文字列処理 強制型変換 等差数列 集合演算 日時と時刻 クラス 参照渡しと copy-on-modify デフォルト値 Assertionで実行を止める コマンドライン引数を解析する CSVファイルを読んで集計する ディレクトリを作る CSVファイルを読む グラフを描く CSVファイルを加工する それぞれの行を集計する それぞれの列を集計する 行をグループ化する カテゴリ変
2020年初頭から英語圏での人気も急上昇し、大躍進を遂げた女性アイドルVTuberグループ「ホロライブ」。英語圏向けの新グループ「ホロライブEnglish」も始動し、メンバーのひとり、「サメちゃん」ことGawr Gura(がうる・ぐら)は、約1カ月半でYouTubeチャンネル登録者数が100万人を突破。約5カ月で200万人を突破と、次々にVTuber最速記録を更新した。Febriでは、多才で楽しくキュートな「サメちゃん」に、世界初のメールインタビューを実施。デビュー前の心境から未来の夢、日本のファンへのメッセージなどを語ってもらった。 ――ぐらさんが日本に興味を持った最初のきっかけを教えてください。音楽やゲーム、アニメなどですか? それとも何かほかのきっかけがあったのですか? ぐら 最初に興味を持つようになったのは和食、匠を感じるお弁当! それから日本のゲームね! 『初音ミク -Proje
効果検証入門〜正しい比較のための因果推論/計量経済学の基礎 作者:安井 翔太発売日: 2019/12/27メディア: Kindle版 ゴールデンウィークの握手会が延期になり気力が完全に尽きてしまい(そもそも2020年のほとんどのイベントが延期または中止になっているわけですが),同じく握手会が延期になった友人と「アイドルとシロクマのことを考えないでください状態になっていてつらい」「何か没頭できる事は無いの」という話になった結果,「効果検証入門」を読んだ. 「どうせ読むのならば短期集中で」ということで,一日目午後に1章と2章,二日目午前に3章,午後に4章,三日目午前に5章のペースで Zoom で交互に節単位を音読しながら進めた.2020年,30歳を過ぎて音読. 感想 数学力が低い自分でわかった気分になれる,非常に参考になった.明日からでも試したい.随所に「実際のビジネスの現場ではこんな滅茶苦茶
2005年、ゲームセンター用のアーケードゲームとしてスタートした『アイドルマスター(以下、アイマス)』シリーズは、昨年7月に15周年を迎えた。 現在は、5ブランドで300人以上のアイドルを擁し、ゲームのみならずテレビアニメ、生配信、ライブイベントなど幅広く展開。2019年度のシリーズ関連商品・サービスの売上推定総額は約600億円(パートナー企業含む)という巨大コンテンツに成長している。 1月には、テスラのCEOであるイーロン・マスク氏が、シンデレラガールズのアイドル・輿水幸子の画像をTwitterに投稿し、世間を賑わせたのは記憶に新しい。 なぜ、ここまで長年にわたり世界中で支持され続けてきたのか。「アイマス」シリーズの総合プロデューサー・坂上陽三氏(坂上P)に「愛され続ける」理由を聞いた。 「手軽さ」を追求して変わり続けた ――まず、この15年間で「アイマス」がずっと大事にしてきたことは何
Step 3:データを可視化しよう! データ可視化の重要性 ggplot2でデータを眺めよう geom_histogram ヒストグラム geom_density 密度分布 geom_point 散布図 aes(color) 色を表現する facet_wrap, facet_grid グラフを分ける geom_boxplot 箱ヒゲ theme_*** 全体の雰囲気を変える color(aesの外) 線を特定の色にする fill(aesの外) 特定の色で塗りつぶす color(aesの中) 線を値に応じた色にする coord_cartesian 軸の範囲を変える labs タイトルや軸ラベルを書く/書き換える theme 文字の大きさなどを細かく設定 ggsave() 図をファイルとして保存 その他のグラフの描き方を知りたい方は ggplot2公式サイト Jaehyun Songさんの解説
Microsoftは2021年2月9日(米国時間)、R言語を使ってクラウドサービススイート「Microsoft 365」を操作するためのオープンソースパッケージ「Microsoft365R」を発表した。Rは、統計解析やその可視化などに役立つオープンソースのプログラミング言語とランタイム環境だ。 Microsoft365Rは「AzureGraph」パッケージで提供されるMicrosoft Graph APIを拡張し、「Microsoft SharePoint」と「Microsoft OneDrive」に対する軽量で強力なインタフェースを提供する。今後は「Microsoft Teams」と「Microsoft Outlook」もサポートする見込みだ。Teamsチャネルへのポストや、Outlookによる電子メール送信が可能になるという。 Microsoft365Rは、CRAN(The Compr
2021年、『アイドルマスター シンデレラガールズ』がプロジェクトのスタートから10周年を迎えた。10年の間にTVアニメ化やリズムゲームのヒット、大規模アリーナをめぐるツアーなど躍進してきた『シンデレラガールズ』。多くのアイドル(=キャスト)が加わり、映像・楽曲・ライブのパフォーマンスで、プロデューサー(=ファン)を楽しませてくれている。今回は10周年を記念して、キャスト&クリエイターへのインタビューをたっぷりお届けしたい。第1弾には、『シンデレラガールズ』の中心メンバーとして走り続けてきた島村卯月役・大橋彩香が登場。卯月と駆け抜けてきた10年を振り返ってもらった。 卯月が個性について悩む時期があって、わりと自分も似たようなことで悩んでいたので、より距離が縮まった ――『シンデレラガールズ』の中心的な存在である卯月役として長くプロジェクトに関わってきて、10周年という節目について大橋さんは
おれはあのシールに対し圧倒的に支持しているが、これは蓮舫や貼った人の考えを支持しているのではなく、俺自身がいわゆるところの表現の自由戦士であるから。 自分自身な主義主張の一貫性保つために支持している。 内容が支持できるかどうか、興味があるかどうかで貼っても良い、剥がせを言うのは都合が良すぎると考えるし、これに批判するなら寺社仏閣に貼られてる大昔の◯◯参上!系のシールや地域の壁の落書きや道路に貼り付いたガムを普段から批判していないとおかしい。 そこはなんとなく嫌だな〜としか思ってないのに「Rシール」だけは犯人はわからないけど蓮舫絡みに決まっているのだから蓮舫とその仲間が剥がして謝罪行脚しろ!とか、そうでなくても剥がす指示をしろ!みたいに怒り狂ってる連中にはさすがの俺も同意できない。 道路のガムを自治体に清掃するように言っているのかお前は。壁の落書きを見つけ次第報告しているのか?ヤンチャな少年
前書き このページは徳島大学デザイン型AI教育研究センターが 開催する、小中高生を対象にした「とくぽんAI塾 2023」のコースの一つである「データ分析入門」 の資料置き場です。 コースは基礎編と発展編の2つに分けられます。基礎編では、データ分析に必要な知識・背景の理解のための 素養を身につけることを目指します。発展編ではデータ分析の問題への挑戦として、回帰と分類問題について 取り組みます。 このコースでは、基礎から発展まで通して R言語を使ったデータ分析を行います。 まずデータ分析についての大まかな内容とデータ分析で扱われる課題について第1章で学びます。 次に第2章では、データの種類と扱い方、表現方法を身につけます。 第3章ではデータを要約ようやくし、伝えやすくするための方法を紹介します。 ここでは特に1つの変数へんすうについて扱います。 第4章は2つの変数の関係を調べるための相関につい
時系列予測のベストプラクティスを共有するGitHubリポジトリを開設、Microsoft:PythonやR向け Microsoftは、時系列予測のベストプラクティスを共有するためのGitHubリポジトリを開設した。PythonやRを使っている開発者に向けたものだ。 Microsoftの「R」コミュニティー向けブログサイト「Revolutions」は、2020年4月14日(米国時間)、時系列予測のベストプラクティスを共有するためのGitHubリポジトリ「Time Series Forecasting Best Practices & Examples」を開設したと発表した。 Microsoftはこのリポジトリについて、README.mdで次のように説明している。 「時系列予測は、データサイエンスで最も重要なトピックの一つだ。的確な意思決定と効果的な資源配分を行うために、ほぼ全ての企業には未来
【UPDATE】6月9日に上場2日目を迎えたANYCOLOR株は、この日も買い気配で取引開始。10時8分に公開価格(1530円)の約3.14倍となる4810円の初値をつけ、終値は公開価格の3.6倍となるストップ高の5510円だった。9日終値ベースの時価総額は1652億円、予想PERは66.1倍。なお上場時、大株主に定められているロックアップ期間は180日間。(2022/06/09 15:14) 2Dや3Dのキャラクターをアバターに用い、ネット上で活動するバーチャルYouTuber(VTuber。バーチャルライバーとも呼ぶ)のプロジェクト「にじさんじ」を運営するANYCOLOR(エニーカラー)が6月8日、東証グロース市場に上場した。 公開株式数は180万300株。公募・売出価格(公開価格)は1530円だったが、人気の高さから上場初日は買い気配のまま売買が成立せず、初値はつかなかった。気配値は
最終更新日 RStudio と R Markdown R Markdown の使い方と文法 Sep. 21, 2022 R の「あるある」エラー Sep. 13, 2022 Rを使ったデータ操作 1. データ・ハンドリング(基礎) Sep. 13, 2022 2. データ・ハンドリング(応用) Nov. 17, 2023 3. データ・クリーニング Sep. 13, 2022 データの可視化 4. ggplot2(基礎) Sep. 26, 2022 5. ggplot2(棒グラフ) Oct. 20, 2022 ggplot2(ヒストグラム) Sep. 10, 2022 ggplot2(箱ひげ図) Oct. 20, 2022 ggplot2(散布図) Sep. 20, 2022 ggplot2(折れ線グラフ) Sep. 20, 2022 ggplot2(ロリポップ・チャー
Home » 都市の3Dモデルをオープンデータ化する国交省の「Project PLATEAU」、メタバースでも事例様々 都市の3Dモデルをオープンデータ化する国交省の「Project PLATEAU」、メタバースでも事例様々 (※本記事は書籍『メタバース未来戦略 現実と仮想世界が融け合うビジネスの羅針盤』の内容を一部、許諾のもと編集・転載したものです) 2020年12月に国土交通省が発表した「Project PLATEAU(プロジェクト・プラトー)」。これは現実の都市空間を再現した「3D都市モデル」のオープンデータ化プロジェクトで、いわゆる「都市と連動するメタバース」「リアルタイムのデジタルツイン」と非常に近接した領域だ。官民を問わず様々なユースケースや実証事例が生み出されている「Project PLATEAU」について、国土交通省の都市局都市政策課課長補佐・内山祐弥氏に事例や展望について
JupyterLabにビジュアルデバッガーが初搭載。ブレークポイント、変数の確認、コールスタックの調査などが可能に Jupyter Projectは、オープンソースの統合開発環境「JupyterLab」にビジュアルデバッガーを搭載したことを明らかにしました。 JupyterLabは、おもにデータ解析を実行するためにPythonやScala、Rなどのコードを打ち込んですぐに実行できる、シンプルでインタラクティブなコード実行環境である「Jupyter Notebook」をベースとし、ファイルブラウザやテキストエディタ、コンソールなどを統合した開発環境です。 今回、このJupyterLabに初めてデバッガが搭載されることになります。 デバッガを利用するには、デバッガ用のフロントエンドを拡張機能としてJupyterLabにインストールします。 デバッガの使い方は基本的にVisual Studioや
本日のPyCon JP 2020にてお話しました以下の発表に関する補足・解説ブログとなります. スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測 - PythonとRを行ったり来たり このエントリーではスライドのスクショとともに, 参考資料 細かすぎて本編で話さなかったハナシ もし真似してやるならこれぐらいは読んでおいたほうがいいよ 的な話を中心に, 過去記事のreference等を掲載しています. スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測 これを読むと⚾️で特徴量エンジニアリングと機械学習がいい感じにできるかと思います👍 スタメン スポーツデータを用いた特徴量エンジニアリングと野球選手の成績予測 スタメン CM JX通信社 Pythonもくもく自習室 #jisyupy 特徴量エンジニアリングについて 野球データの特徴量 Python, R, SQ
メリークリスマス!ぼっち・ざ・ろっく!最終話、素晴らしかったですね。 あまりにも良すぎて余韻が収まらず、そのまま深夜の勢いでブログを書き始めました。最高のクリスマスイブです。 年の瀬だしそろそろ今年聴いた曲を総括しないとなぁと思っていましたが、最終話の曲で全部ぶっ飛びました。ライブパートやるのは分かってたけど全部新曲て。 特に「星座になれたら」がバンアパ感溢れるサウンドも相まってお気に入りで、何度も聴き返しているうちに色んな発見があったのでブログにまとめることにした次第です。 あくまでも自分的解釈ですし、もう全国民気付いてるような浅い話だったらすみません。 放送終了後即リリックビデオと劇中ライブ映像上げる公式偉すぎる この曲の歌詞は、みんなから愛される眩しい星座への憧れを歌った曲ということで、結束バンドのボーカルでクラスの人気者でもある喜多郁代に憧れる後藤ひとりの曲、という解釈が一般的にな
データサイエンスにおいて重要な統計学と機械学習に関する52の基本概念と関連用語について、簡潔な説明とその知識の背景となる最低限の数式、グラフ、RとPythonのコードを提示し、多面的なアプローチにより、深い理解を促します。データの分類、分析、モデル化、予測という一連のデータサイエンスのプロセスにおいて統計学の必要な項目と不必要な項目を明確にし、統計学の基本と実践的なデータサイエンス技法を効率よく学ぶことができます。データサイエンス分野における昨今のPython人気を反映し、第1版ではRのみの対応だったコードが、今回の改訂でPythonにも対応。コードはすべてGitHubからダウンロード可能です。 日本語版まえがき 訳者まえがき まえがき 1章 探索的データ分析 1.1 構造化データの諸要素 1.1.1 さらに学ぶために 1.2 テーブルデータ 1.2.1 データフレームとインデックス付け
Kaggleはすっかりただの野次馬の一人になって久しいんですが、しばらく前に行われたPetFinder.my - Pawpularity Contestというコンペで優勝者がSVR(サポートベクター回帰)を使ったことが話題になっていたというのを聞いて、NN全盛のこのご時世に意外だなと思ったのでした。 しかし、よくよく考えてみればかのVapnik御大がかつてSVMを考案する際にベースとしたアイデアはNNとは方向性の違う代物だったわけです。故に、例えばSVMとNNとがどのような点で異なるかが「見える化」出来れば、SVMが復権するための条件のようなものが見えてきそうです。 ということで、久しぶりに「サンプルデータで試す機械学習シリーズ」をやってみようと思います。実はDNNについては6年前にも似たようなことをやっているのですが、SVMとDNNとでサンプルサイズを変えながら比較するというのはやったこ
概要Healy (2018) “Data Visualization: A Practical Introduction” の邦訳『データ分析のためのデータ可視化入門』をもらったので, この本のレビューと本書ではあまり取り上げられていない, R グラフィックスをさらに活用するためのヒントを提示する. 2021/9/24 追記: 『Python ユーザでも『データ可視化入門』で練習できるようにパッケージを作った + Plotnine との互換性ガイド - ill-identified diary』に書いたように, Python でも matplotlib のような煩雑な構文に惑わされずにこの本で紹介されているような方法を実現するためのパッケージ/用例を作ってみた. 概要 初めに 本書の特徴 どういう本なのか どういう人が読むとよいか 邦訳に対する細かいツッコミどころ 本書を読んだ人におすすめ
強化学習の基礎から最近の論文までの道のりを繫ぎたいというモチベーションで,最初は強化学習の基礎の基礎の解説から,Q学習についてR2D3, Agent57あたりまで読んだ論文についてまとめてみました.Actor-Criticについては,Q学習との比較用にA3Cあたりを少しだけ書いています.あと,最後に軽くマルチエージェント強化学習(MARL)とオフライン強化学習(Offline RL)にも触れて紹介しています. 基礎の基礎 強化学習とは? 教師あり学習,教師無し学習に並ぶ,機械学習の一分野. 端的に言うと,エージェントと呼ばれる行動主体が,ある環境のなかで得られる報酬を最大化する最適化問題. ただし,報酬を得るためにどうしたらよいかというのは非自明な場合が多く,また,報酬のみではスパースで扱いにくいので,途中の過程ででてくる状態や,エージェントの行動に価値を付与し,その価値を最大化する問題に
はじめに 今回は文部科学省のページで公開されている情報Ⅰの教員研修用教材の「質的データの分析」についてみていきたいと思います。 ここでは、MeCabによる形態素解析とWordCloudをRで実装する例が書かれています。 今回はその内容をpythonに置き換えていきたいと思います。 高等学校情報科「情報Ⅰ」教員研修用教材(本編):文部科学省 第4章情報通信ネットワークとデータの活用・巻末 (PDF:10284KB) PDF 環境 ipython Colaboratory - Google Colab 概要 今回は、「情報Ⅰ」教員研修用教材の「第4章情報通信ネットワークとデータの活用・巻末」について、 学習23 質的データの分析 のRの箇所をpythonに書き換えたいと思います。 テキストマイニングについて 1 形態素解析について pythonのソースコード MeCabを使えるように前準備しま
In addition to cookies that are essential to operate our website, we use cookies and similar technologies to analyze traffic, personalize content and ads, to provide social media features and to improve our products and services. These technologies are set by third parties, including our social media, advertising and analytics partners. Please read our privacy policy for additional info.
サムネイルがまんま結論の一部です&タイトルでビビッと来たアナタ(+野球好き)が対象読者です. ちょっとやりたいことがあって, やりたいこと⚾のサンプルがたまたまRだった このあと自分で分析したりなにか作るんやったらPythonでやりたい せや!RからPythonに移植しちゃえば良いンゴ ってことで, 粛々とRからPythonに移植した時に気がついた事をサラッと書きたいと思います. 最初に断っておくと, RよりPythonが優秀(またはその逆)だから書き換える!って意味ではありません! どっちが優秀だの, 好みは何だのといった所は(必要と思った箇所を除き)触れないのでご了承ください.*1 というわけで, 変に力んだりマウントを取ること無く, ごゆるりとおくつろぎながら読んでもらえると幸いです. TL;DR 数式を意識しながら読んだり, 統計的にいい感じにしたい時はRの方がしっくりくる. 一方
良い感じに、が通じなくなるとき小さな組織だと肩書きや世間の定義に囚われることなく、周りとコミュニケーションをとりながら働くシーンがよくあります。そんな現場で働くデザイナーはプロダクトのあり方を深堀するフェイズから入ることが多いですし、実装にまで携わる方もいます。分野を絞ってスキルを伸ばしたい方には向いていませんが、課題発見と解決のための活動に第一線で関わりたいのであれば最高の仕事環境だと思います。 人数が少ないうちは良い感じの間合いをとってコラボレーションする働き方がしやすいです。誰が何をしているかも見えやすいですし、少し話すだけ物事が決まって進んでいきます。 こうした小さな規模で出来ていたことが、人数が増えると次第に難しくなっていきます。組織が大きくなると、様々な領域が重なる兼任業から、特定領域のスキルと経験が豊富な専門業が増えていきます。 小規模で出来ていた『空気を読んで良い感じにコラ
父は、(2018年)5月頃から食欲が激減し、7月には、栄養補給飲料を、一日で湯呑み一杯飲むのがやっとという状態になっていました。 その後、父が、ヘルパーさんに、無理矢理に、お粥を食べさせられている姿をみて、私は、ショックを受けました。 姉に、そのことを告げたら『世の中の介護の現場のほとんどは、そんなもんだ』と言われて、さらにショックを受けたのを覚えています。 ----- 父は、7月に食物摂取ができなくなり、病院に入院したのですが、7月下旬、病院から電話があり、『父が、食事、水はもとより、点滴ですら、苦しむようになってきた』と、報告してきました。 私は、父の入院時に、主治医の先生に、しつこいくらい『1ミリメートルでも苦痛がある、または、苦痛が発生する恐れのある医療行為は、全て止めて欲しい』と、念を押し続けていました。 それでも、病院は、電話で、最後の、そして、最期の判断を私に求めてきました。
はじめに 角度の平均を単純に計算してはいけない 突然ですが、以下の角度値の平均を求める方法をご存知でしょうか? $$ \lbrace10^\circ, 30^\circ, 350^\circ\rbrace $$ これが普通の数値データであれば、$(10 + 30 + 350) / 3 = 130$のように平均が求まります。 しかし、角度の場合は平均10°となります。図示してみると、確かに10°を中心に分布しています。 なぜ単純計算では求まらないのでしょうか? これには角度の周期性が関係しています。350°は数値上大きく見えますが、実際には0°に近い角度です。本来連続して続いているものを1周期で切断しているため、角度に対して素朴な統計処理をすることはできないのです。 角度データを扱う統計の分野を「角度統計(Circular Statistics, Directional Statistics
ロジスティック回帰について調べている。 ロジスティック回帰モデルのパラメータの最尤推定量は、不偏推定量ではなく、バイアスがある。 例として、サンプルサイズ 、入力変数の数 のときを考える。 パラメータ 300個の真の値を、最初の 100個は 、次の 100個は 、残りの 100個は に設定して推定してみよう。 n <- 1500 p <- 300 # データの生成 set.seed(314) x <- rnorm(n * p, mean = 0, sd = sqrt(1/n)) X <- matrix(x, nrow = n, ncol = p) beta <- matrix(c(rep(10, p/3), rep(-10, p/3), rep(0, p/3))) logistic <- function(t) 1 / (1 + exp(-t)) prob <- logistic(X %*
女帝・エアグルーヴが先頭でゴールを駆け抜け、母ダイナカールとのオークス母仔制覇を成し遂げたあの日から、約四半世紀が過ぎた2021年5月23日、今年も3歳女王を決めるレース“オークス”が東京競馬場で開催される。 オークスと言えば、『ウマ娘 プリティーダービー』(以下、『ウマ娘』)で“トリプルティアラ(桜花賞、オークス、秋華賞の3レースを勝利すること)”を目指すうえで最大の障壁となる難関レースだ。桜花賞の1600メートルから2400メートルと距離が大幅に延長され、要求スタミナもかなり上がる。さらにコースには坂がやたらと多く、その対策も必要となる。そういったコース設定が、多くのトレーナー(『ウマ娘』のプレイヤーのこと)を苦しめてきた。 本記事では、『ウマ娘』にも登場する歴代優勝馬エアグルーヴ、メジロドーベルらが、競走馬としてオークスでどのような活躍をしたのか、またそのエピソードがどのように『ウマ
以前の記事で、せっかく日本全国の不動産取引価格データが取れたので、もう少し不動産価格モデルについて詳しくやってみる。また、ちょっと進んだ手法についても触れてみたい(これは別記事にしました。詳細はこちら。不動産価格データを使った相場分析ー世田谷区一棟マンション)。 価格データの加工と可視化以前紹介した通り、国土交通省の不動産価格取引情報検索からデータがダウンロードできる。これは全国をカバーしていて、2005年以降の20年近くのデータがある。サイトから一気に全国全期間のデータがダウンロードできる。 全国のデータは取れるが一気に全国データを扱うのは大変なので、簡単なモデルから徐々に複雑にしていく。こないだ世田谷のデータを使ったので、まずは世田谷区のデータを使う。こないだは過去1年に取引されたデータだけだったので、データが存在する10年以上前の取引データも全部使ってみる。前回説明した通り、築年が元
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く