タグ

ブックマーク / id.fnshr.info (21)

  • 統計検定の受験体験記へのリンク集——どんな参考書で統計を勉強しているか|Colorless Green Ideas

    統計検定1級・準1級・2級のウェブ上の受験体験記へのリンク集。合わせて、1級・準1級・2級の対策にどのような参考書等がよく使われているかを紹介。 はじめに 記事は、統計検定のウェブ上に公開されている受験体験記をまとめたものである。統計検定は、統計学に関する知識などを問う試験であり、一般財団法人統計質保証推進協会が実施している。統計検定には1級・準1級・2級・3級・4級があるが、記事ではこのうち1級・準1級・2級の受験体験記のみ紹介する。 以下、1級から順に級ごとに受験体験記へのリンクと、体験記の中で推奨されている参考書・ウェブサイトを挙げる。統計検定をこれから受験しようとしている人にとって、参考になればと思う。 他の人の勉強方法を参考にして、合格を目指そう [1] 。 出題範囲の変更に関する注意 なお、以下に示すように、統計検定の出題範囲は過去に何度か変更されている。 2017年:準1

    統計検定の受験体験記へのリンク集——どんな参考書で統計を勉強しているか|Colorless Green Ideas
    what_alnk
    what_alnk 2020/10/15
  • Rで複数のオブジェクトからリストを作るときに、オブジェクト名をリストの要素の名前にする|Colorless Green Ideas

    Hmisc パッケージの llist() 函数を使うことで、リストを作るときに使ったオブジェクト名からリストの要素の名前をつけることができる。 やりたいこと R言語では、あらかじめ複数個のオブジェクトを用意して、それらを1個のリストにまとめるということがよくある。以下の例では、animal, number, eraという3つのオブジェクトを作り、それらを unified という1個のリストにまとめている。 animal <- c("dog", "cat", "bear", "pig") number <- c(24, 35, 12, 81, 33) era <- c("Edo", "Heian", "Meiji") unified <- list(animal, number, era) こうやってできた unified の中身は以下の通りである。 [[1]] [1] "dog" "cat

    Rで複数のオブジェクトからリストを作るときに、オブジェクト名をリストの要素の名前にする|Colorless Green Ideas
    what_alnk
    what_alnk 2018/05/20
  • 研究社『新和英大辞典』は財務省に厳しい|Colorless Green Ideas

    はじめに 研究社が出している和英辞典で『新和英大辞典』というものがある。このは、見出し語や例文がかなり多く、すこぶる便利 である。 さて、東北大の中村美千彦 (@Nakamura_Mitch) 教授が2017年5月8日にしたツイートで知ったのだが、研究社『新和英大辞典』の「無理難題」の項には「文部科学省がまた無理難題を言ってきた」という例文がある。単に無理難題を言ってきたのではなく、わざわざ「また」と述べているのが面白い。編者は文科省にから無理難題を繰り返し言われた経験があったのだろうかと心配になる [1] 。 そこで、『新和英大辞典』の中央省庁に対する態度が気になり、色々調べてみたところ、どうやらこの和英辞典は財務省に対して厳しいようだということが分かった。 日の財務省庁舎 [2] 財務省に厳しい『新和英大辞典』 『新和英大辞典』で「財務大臣」という項目を引くと、以下の例文が出てくる

    研究社『新和英大辞典』は財務省に厳しい|Colorless Green Ideas
    what_alnk
    what_alnk 2017/07/01
  • 主要な統計解析ソフトの擬似乱数生成アルゴリズム|Colorless Green Ideas

    SAS, SPSS, STATA, R といった現在の主要な統計解析ソフトでは、擬似乱数を生成するときに、メルセンヌ・ツイスターをアルゴリズムとして採用している。 はじめに 統計解析の際には、乱数 (random number) が必要になることが多い。例えば、無作為抽出をしたり、モンテカルロ法を実行したりするときには、乱数が必要になる。しかし、計算機を使って分析する際に真の乱数を作り出すことは容易でないことから、何らかのアルゴリズムによって擬似乱数 (pseudo-random number) を作り出すことが必要になる。 2017年2月現在、主要な統計解析ソフトでは、Matsumoto and Nishimura (1998) が提唱したメルセンヌ・ツイスター (Mersenne twister) というアルゴリズムで擬似乱数を生成できるようになっている。このアルゴリズムは、すこぶる優

    主要な統計解析ソフトの擬似乱数生成アルゴリズム|Colorless Green Ideas
    what_alnk
    what_alnk 2017/03/17
  • DeNA に対する第三者委員会の調査報告書での信頼区間の説明|Colorless Green Ideas

    DeNA に対する第三者委員会の調査報告書でなされていた信頼区間に関する説明がすこしあやういように思われたので、それについて簡単にコメントを記す。 調査報告書の背景 2017年3月13日、DeNA がキュレーションメディア事業で著作権侵害などの問題を起こしたことに対し、第三者委員会による調査報告書が出された [1] 。この報告書は以下の場所からダウンロードすることができる。 株式会社ディー・エヌ・エー 第三者委員会調査報告書の全文開示公表のお知らせ(容量が大きいPDFなので注意) この調査報告書を読んでみたところ、信頼区間についての説明が少しあやういように思われた。以下、この信頼区間の説明について見ていきたい。 まず、なぜ信頼区間というものがこの報告書に出てきたのだろうか。 この調査報告書では、DeNA のキュレーションメディアでどれだけの複製権・翻案権侵害がなされたかという問題を解き明か

    DeNA に対する第三者委員会の調査報告書での信頼区間の説明|Colorless Green Ideas
    what_alnk
    what_alnk 2017/03/17
  • ダメな統計学を防ぐための書籍11冊|Colorless Green Ideas

    科学における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐために読むと良いについて紹介する。 はじめに この記事では、科学研究における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐ方法を学ぶために役立つと思われる書籍を紹介する。主に、統計的仮説検定で間違いを犯さないようにする場合に役立つ書籍を紹介するが、それ以外の分野の書籍についても紹介する。 なお、『ダメな統計学――悲惨なほど完全なる手引書』は、科学の世界での統計の誤用について説明したで、私が日語訳に当たった。2017年1月27日から販売された。このの詳しい紹介は、「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事に書いたので、そちらもご参照願いたい。 アレックス・ラインハート〔著〕・西原史暁〔訳〕.(201

    ダメな統計学を防ぐための書籍11冊|Colorless Green Ideas
    what_alnk
    what_alnk 2017/01/28
  • 米国国務省の外国語学習教材が手に入るウェブサイト|Colorless Green Ideas

    国務省の語学研修機関が作った外国語学習教材 米国の外交をつかさどる国務省には、Foreign Service Institute (FSI) という語学研修機関がある。これは、米国の外交を担う人員に外国語を身につけさせるための機関だ。 FSIは、さまざまな言語の学習教材を作っている。フランス語やアラビア語といったメジャーな言語から、ブルガリア語やトウィ語といった比較的マイナーな言語まで、さまざまな言語の学習教材がある。なお、米国人向けに作られているので、どの言語の学習教材にせよ、説明に使われているのは英語である。 FSIが作成した外国語学習教材は、著作権フリーになっており [1] 、オンライン上で簡単に手に入れることができる。FSIの教材を配布しているウェブサイトとしては、以下のものがある。 FSI Language Courses FSI Languages Courses The Li

    米国国務省の外国語学習教材が手に入るウェブサイト|Colorless Green Ideas
    what_alnk
    what_alnk 2016/08/23
  • オンラインで無料で読める統計書プラス32冊|Colorless Green Ideas

    はじめに 数年前に「オンラインで無料で読める統計書22冊」という記事を書いた。タイトルにあるように、オンラインで無料で読める統計書として、入門者向けから高度なものまで合わせて22冊紹介した。 その後、オンラインで無料で読める統計書をさらに発掘したので、ここに紹介しておきたい。今回新しく紹介するのは、32冊である。「オンラインで無料で読める統計書22冊」と合わせてご覧いただきたい。 統計学の入門 まずは、統計学を始めて学ぶ人に向けて書かれた書籍を紹介しよう。 村上正康・安田正實.(1989). 『統計学演習』東京:培風館. 統計学を始めて学ぶ人のための入門書。 記述統計、確率分布、推定・検定の基礎、簡単な線形回帰といった内容を扱っている。入門書としてはオーソドックスなところを扱っていると言えよう。 中澤港.(2003).『Rによる統計解析の基礎』東京:ピアソン・エデュケーション. 統計学を始

    オンラインで無料で読める統計書プラス32冊|Colorless Green Ideas
    what_alnk
    what_alnk 2016/08/16
  • 何語の文字列かを判定するためのRパッケージ|Colorless Green Ideas

    franc パッケージ 統計処理ソフト R で、ある文字列が何語の文字列かを判定したい場合、franc というパッケージで判定できる。例えば、"To be or not to be, that is the question." という文字列から、これが英語であると判定することができる。 インストール方法 このパッケージはCRAN上に存在しているので、普通に install.packages を使ってインストールすることが可能である。具体的には以下のコードで franc パッケージをインストールすることができる。 install.packages("franc") franc 函数を使った言語判定 franc パッケージでは、franc という函数で言語を判定することができる。具体的には、以下に示すソースコードのように、franc 函数の引数に文字列を入れれば、何語か判定される # パッケ

    何語の文字列かを判定するためのRパッケージ|Colorless Green Ideas
    what_alnk
    what_alnk 2016/07/26
  • 英語で科学を学ぶための9つのYouTubeチャンネル|Colorless Green Ideas

    はじめに YouTube上には、科学について一般向けに分かりやすく説明している動画がたくさんある。そして、もっぱら科学についての動画を投稿しているYouTubeチャンネルもある。今日は、英語で科学について学べるYouTubeチャンネルを紹介したいと思う。 YouTubeでは動画の画面で「その他」から「文字起こし」を選択して、文字起こしを表示することができる。 英語の映像を見るのは大変かもしれない。だが逆に言えば、科学の勉強だけでなく、英語の勉強にもなるのだ。一石二鳥と考えて勉強してみるのも良いだろう。ちなみに、YouTube には自動で字幕を表示する機能や「文字起こし」という機能もある。こうした機能を使えば、文字の形で英語が表示されるので、分からないことを調べることが容易になる。うまく活用していこう。 The Science Channel The Science Channelは科学に関

    英語で科学を学ぶための9つのYouTubeチャンネル|Colorless Green Ideas
  • 最短の学術論文|Colorless Green Ideas

    はじめに 学術論文の価値はその長さで決まるわけではない。短い論文であっても価値があるものは少なくない。例えば、DNAが二重螺旋構造をしているというワトソンとクリックの1953年の論文 [1] は、たったの2ページしかない。この20世紀で最も重要な科学的発見を示した英語で書かれた論文の語数は、1000語に満たないのだ。これだけの短い論文であるが、この発見によってワトソンとクリックはノーベル医学・生理学賞を受賞することになった。 それでは、短い学術論文はどこまで短いのだろうか。 要約文が短い論文 学術論文には、普通、数十語から数百語の要約文(アブストラクト)を付す。だが、この要約文が非常に短い論文が存在する。 ベリーらによる2011年の量子論に関する論文 [2] の要約文は“Probably not”(たぶん、そうではない)という2単語しかない。 ベリーらによる論文の要約文はたったの2語しかな

    最短の学術論文|Colorless Green Ideas
    what_alnk
    what_alnk 2015/05/03
  • オンラインで無料で読める統計書22冊|Colorless Green Ideas

    はじめに 今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれたが多いが、日語で書かれたも若干ある。 入門書 まず、統計の初学者のために書かれた入門書を紹介したいと思う。 福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。 小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論

    オンラインで無料で読める統計書22冊|Colorless Green Ideas
  • 言語研究者のための統計の学び方―より高度な内容|Colorless Green Ideas

    はじめに 先日、「言語研究者のための統計の学び方―基礎を身につける」という記事で、統計の基礎の学び方を紹介した。そこで紹介したことを学ぶだけでも、結構色々な言語研究ができる。だが、もう少し腰を入れて言語研究をする場合は、統計に関して、より高度な内容を学んでおく必要がある。 今回は、統計の基礎を学び終えた言語研究者が次にどう勉強していけば良いかについて紹介する。 この記事で扱う内容 先日書いた「言語研究者のための統計の学び方―基礎を身につける」という記事では、統計の基礎をどう勉強すれば良いかについて触れた。今回は、より高度な内容を学ぶためにはどうすれば良いかについて紹介したい。図示すると、以下のとおりになるだろう。 言語研究者のための統計の学習順序 上に掲げた図からも分かるように、今回扱う内容は、「コーパス処理向け」・「言語実験向け」・「言語教育向け」の3つに分かれている。このように分けた

  • 言語研究者のための統計の学び方―基礎を身につける|Colorless Green Ideas

    総和 総和と言っても、ピンと来ない人もいる。要するに与えられた規則に基づいて、数を足していくだけの話なのだけれども、慣れないとどういったものだか分かりづらいところがある。 総和記号の使用例 \[ \sum_{n=3}^{7} 2i = 2 \cdot 3 + 2 \cdot 4 + 2 \cdot 5 + 2 \cdot 6 + 2 \cdot 7 \] いずれにせよ、統計の教科書では、総和の記号がよく出てくるので、総和記号の取り扱いに把握しておくと統計が理解しやすくなる。高校の教科書だと、普通、数列について扱っている章に載っている。 組み合わせ論と確率 組み合わせ論と確率については、統計の入門書にもしっかり載っているので、特に力を入れる必要はないと思う。「そう言えばこんな感じなのだな」と、軽く確認するだけで十分だ。 対数 言語現象は対数の形で表されることが多いので、しっかり把握しておくこ

  • 何かを伝える前に考えるべき5つのこと――THINK|Colorless Green Ideas

    人に何かを伝える前に考えるべきポイントの頭文字をつなげると、THINK(=「考える」)になる。すなわち、True(当か)、Helpful(役立つか)、Inspiring(奮い立たせるか)、Necessary(必要か)、Kind(思いやりがあるか)という5つのことである。 はじめに 何かを伝える前には、True(当か)、Helpful(役立つか)、Inspiring(奮い立たせるか)、Necessary(必要か)、Kind(思いやりがあるか)という5つのことを考えるようにしよう。この5つのことの頭文字をつなげると、THINK = 「考える」となる。 人に向かって自分の意見を述べる、あるいは自分の思っていることを文章にする――社会生活を送る場合、人に伝えるために何かを言うという機会がどうしても出てくる。正式に出版されるような文章を書く機会がない人でも、隣人と話したり、友達にメールを送ったり

    何かを伝える前に考えるべき5つのこと――THINK|Colorless Green Ideas
    what_alnk
    what_alnk 2015/03/26
  • 科学・医療記事の元となった研究を探す方法|Colorless Green Ideas

    はじめに 一般の人に向けたニュース記事で、科学や医療について扱っているものは少なくない。そうした記事の中には、何らかの学術研究の成果を元にして書かれているものがある。ここでは、そうした記事の元となった研究を探す方法について紹介する。 ニュース記事の中のキーワードをヒントにすれば、元となった研究を探し出すことができる。 [1] 一般向けの科学・医療記事には、研究の詳細が書かれていなかったり、ひどい場合には研究内容を曲解して伝えていたりする場合がある。元となった研究を探すことができれば、記事の不明瞭なところをはっきりさせることができるだろう。ただし、元となった研究を読み解く力がなければどうしようもならない。だから、実はここに記されている方法は専門家向けであって、素人には向かないので注意が必要だ。 なお、以下ではウェブ上のニュース記事を例にしているが、紙の新聞記事、雑誌記事などにも応用することが

    科学・医療記事の元となった研究を探す方法|Colorless Green Ideas
    what_alnk
    what_alnk 2015/01/25
  • 平成27年度センター試験の倫理で問題のある棒グラフが出題|Colorless Green Ideas

    平成27年度のセンター試験の倫理で出題された棒グラフは、棒がゼロから始まっていない。これは棒グラフとして適切でないものである。 はじめに 2015年1月17日(土)に、平成27年度の大学入試センター試験の1日目が行われた。この日に出題された「倫理」の第1問の問4 [1] において、棒グラフが2つ示されている。この棒グラフは、棒がゼロから始まっておらず、40%から始まっている。これでは棒グラフとして不適切である。 問題があるグラフは2つあるのだが、そのうち1つを先に挙げておこう。 平成27年度センター試験の倫理の第1問問4図1の棒グラフ。棒が40から始まっており、棒グラフとして適切でない。 [2] 後に説明するように、棒グラフは棒をゼロから始めないと、分量を適切に表すことができない。よって、上に引用したグラフは、不適切なのである。 棒グラフはゼロから始める 棒グラフは、長さをもって量を示すグ

    平成27年度センター試験の倫理で問題のある棒グラフが出題|Colorless Green Ideas
  • LaTeXでの箇条書き作成は easylist パッケージが便利|Colorless Green Ideas

    LaTeXで箇条書きなどのリストが簡単に作れる easylist というパッケージの使い方について紹介する。特に箇条書きを多用する状況でこのパッケージは威力を発揮する。 easylistパッケージで箇条書きを簡単に LaTeXで箇条書きを作りたい場合、easylist パッケージが非常に便利だ。このパッケージを使うと、非常に簡単に箇条書きを記述することができる。特に、箇条書きの中に箇条書きが埋め込まれているような複雑な場合において、この easylist パッケージは強い味方になる。 LaTeXに最初から組み込まれている itemize や enumerate といった環境でも箇条書きを記述することはできるが、これらの環境の記述は複雑になりがちだ。easylist パッケージは itemize や enumerate といった環境よりずっと単純に記述できるのだ。 easylist パッケー

  • 『ダメな統計学』冊子PDFの公開|Colorless Green Ideas

    『ダメな統計学』表紙 現在の科学研究において統計が誤用されていることが非常に多く、そのために科学研究の信頼性が揺らいでいることを記した『ダメな統計学』の冊子PDFを公開する。これは、アレックス・ラインハート氏が書いたStatistics Done Wrongの全訳である。理解を深めるために、訳注を比較的豊富に加えた。 2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』の冊子PDFに比べると、大幅に加筆されている。ページ数で言うと2倍以上になっている。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 『ダメな統計学

    『ダメな統計学』冊子PDFの公開|Colorless Green Ideas
  • 統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas

    統計についてほとんど何も知らない人が読むべきとしては『マンガでわかる統計学』が一番のおすすめである。 『マンガでわかる統計学』 「統計って、今まで全然勉強したことはないけれども、将来必要になるかもしれないから、勉強してみようかな」とか、「統計を勉強してみたいとは思ってるんだけど、何から始めれば良いか見当がつかないんだよね」と思っている人は少なくないと思う。こうした人、すなわち統計学についてほとんど何も知らない人は何を使って勉強し始めれば良いのだろうか。 こうした初心者は、まず入門として『マンガでわかる統計学』というを読むのが良いと私は考えている。このは、統計に関する知識がほとんどない人にとって、わかりやすく、そして取り組みやすいだ。 高橋信. (2004). 『マンガでわかる統計学』 東京:オーム社. この『マンガでわかる統計学』というは、統計について特に何も知らない女子高生のル

    統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas