タグ

ブックマーク / id.fnshr.info (9)

  • 整然データとは何か|Colorless Green Ideas

    整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。 はじめに データ分析の際には、データが扱いやすい形式になっている必要がある。データの中身がぐちゃぐちゃになっていたり、データの形式が統一されていなかったりすれば、分析は骨の折れる作業となる。 それでは、どのようなものがデータ分析において扱いやすい形式のデータになるのだろうか。この問題に対する唯一の正しい解答というものは存在しない。しかし、表の形式で表すことができるデータを考える場合、ハドリー・ウィッカム (Hadley Wickham) 氏が提唱した整然データ (tidy d

    整然データとは何か|Colorless Green Ideas
  • 「元旦」で1月1日全体を指すことは別に誤りというわけではない|Colorless Green Ideas

    「元旦」は1月1日の朝を指し、1月1日全体を指すわけでないという説がある。しかし、用例を見ると、「元旦」で1月1日全体を指すことが誤りだとは言い切れないように思われる。 「元旦」=「1月1日の朝」説 「元旦」という言葉は1月1日の朝を指し、1月1日全体を指すわけではないと説明する人がいる。この説明に基づけば、「元旦の夜」というのは語義矛盾であり、「誤った」言い方になる。 しかし、私としては、この説に反対したい。「元旦」で1月1日全体を指すことは別に誤りというわけではないと思うのだ。実際、後に示すように、「元旦」で1月1日全体を指し示す事例はとてもたくさんある。一般の人だけでなく、太宰治や坂口安吾といったちゃんとした文章を書く小説家ですら、「元旦」を1月1日の朝に限定しておらず、むしろ全体を指すものとして使っている。 「元旦」=「1月1日の朝」説の事例 私からの反論を書く前に、まずは「元旦」

    「元旦」で1月1日全体を指すことは別に誤りというわけではない|Colorless Green Ideas
  • 東京大学出版会『統計学入門』は入門を一通り終えた人におすすめ|Colorless Green Ideas

    東京大学出版会から出ている『基礎統計学I 統計学入門』というがある。 東京大学教養学部統計学教室〔編〕 (1991). 『基礎統計学I 統計学入門』 東京:東京大学出版会. このは、統計を学ぶ際によくすすめられる一冊である。例えば、ウェブ上にある記事で、『統計学入門』を挙げているものに以下のようなものがある。 2014年春版:ビジネスにおけるデータ分析のプロを目指すなら揃えておくべき12冊(銀座で働くData Scientistのブログ) 一年で身に付ける!Rと統計学・機械学習の4ステップ(iAnalysis ~おとうさんの解析日記~) 統計分析を学ぶための書籍20選(XICA-Labs データ・統計分析研究所) それでは、なぜこのはすすめられるのだろうか? そして、どういう人がこのを読むべきなのだろうか? タイトルに『統計学入門』とあるように、統計の初心者にとって良いなのだろう

    東京大学出版会『統計学入門』は入門を一通り終えた人におすすめ|Colorless Green Ideas
  • 『ダメな統計学』冊子PDFの公開|Colorless Green Ideas

    『ダメな統計学』表紙 現在の科学研究において統計が誤用されていることが非常に多く、そのために科学研究の信頼性が揺らいでいることを記した『ダメな統計学』の冊子PDFを公開する。これは、アレックス・ラインハート氏が書いたStatistics Done Wrongの全訳である。理解を深めるために、訳注を比較的豊富に加えた。 2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』の冊子PDFに比べると、大幅に加筆されている。ページ数で言うと2倍以上になっている。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 『ダメな統計学

    『ダメな統計学』冊子PDFの公開|Colorless Green Ideas
  • 統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas

    統計についてほとんど何も知らない人が読むべきとしては『マンガでわかる統計学』が一番のおすすめである。 『マンガでわかる統計学』 「統計って、今まで全然勉強したことはないけれども、将来必要になるかもしれないから、勉強してみようかな」とか、「統計を勉強してみたいとは思ってるんだけど、何から始めれば良いか見当がつかないんだよね」と思っている人は少なくないと思う。こうした人、すなわち統計学についてほとんど何も知らない人は何を使って勉強し始めれば良いのだろうか。 こうした初心者は、まず入門として『マンガでわかる統計学』というを読むのが良いと私は考えている。このは、統計に関する知識がほとんどない人にとって、わかりやすく、そして取り組みやすいだ。 高橋信. (2004). 『マンガでわかる統計学』 東京:オーム社. この『マンガでわかる統計学』というは、統計について特に何も知らない女子高生のル

    統計学の初心者が入門として最初に読むべき一冊|Colorless Green Ideas
  • 学術論文を書くときは Microsoft Word と LaTeX のどちらが効率的か?|Colorless Green Ideas

    実験内容 この研究で行われた実験では、学術論文の文書になっているものを被験者に提示し、それを Microsoft Word か LaTeX で再現するように求めている。 被験者は以下の4つのグループに分かれている。なお、初心者は使用経験が500時間以下の人を指し、熟練者は使用経験が1,000時間以上の人を指す。 Word の初心者 Word の熟練者 LaTeX の初心者 LaTeX の熟練者 各々の被験者には3種類の文書が与えられ、それぞれを30分で再現することが求められた。 単純な連続したテキスト 表を含むテキスト 数式を含むテキスト そして、被験者による再現は以下の3つの点で評価される。 正書法・文法上の誤りの数 フォーマット上の誤りの数 30分で入力した文章の量 結果 全般的に言えば、Word を使用した人の方が、LaTeX を使用した人に比べて誤りが少なく、入力した文章の量も多か

    学術論文を書くときは Microsoft Word と LaTeX のどちらが効率的か?|Colorless Green Ideas
    seuzo
    seuzo 2014/12/22
    「LaTeX 使用者は Word 使用者に比べてユーザビリティの面で満足している」
  • ダメな統計学:目次|Colorless Green Ideas

    2017年1月20日追記:『ダメな統計学――悲惨なほど完全なる手引書』というが出版されることになった。このは、ここに掲載されているウェブ版の『ダメな統計学』に大幅に加筆したものだ。ウェブ版の『ダメな統計学』を読んで興味を持った方は、書籍となった『ダメな統計学』をぜひ読んでいただければと思う。書籍版の詳細については「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事をご参照願いたい。 ここに公開する『ダメな統計学』は、アレックス・ラインハート (Alex Reinhart) 氏が書いたStatistics Done Wrongの全訳である。この文章は全部で13章から構成されている。詳しくは以下の目次を参照されたい。 はじめに データ分析入門 検定力と検定力の足りない統計 擬似反復:データを賢く選べ p値と基準率の誤り 有意であるかないかの違いが有意差でない場合 停止規則と

    ダメな統計学:目次|Colorless Green Ideas
  • 「無断引用」という表現はやめよう|Colorless Green Ideas

    他人の文章を自分の文章のように扱う研究上の不正は、「剽窃」または「盗用」と呼ぶのが正確であり、不正確で誤解を招く「無断引用」という表現を用いるのはやめるべきである。 「無断引用」という表現はよろしくない 小保方晴子氏が他者の文章を自分の論文に盗用したという事件 [1] があった。この事件の報道において「無断引用」という表現が各所で用いられているが、この表現は正確でなく誤解を招きやすいので、使うのはやめるべきだと思う。「無断引用」の代わりに、「剽窃(ひょうせつ)」か「盗用」と言ってほしいところだ [2] 。 引用という行為は、引用の作法を守っているかぎり、法的にも倫理的にも何ら問題のない行為である。そして、引用は基的に無断で行われる。わざわざ出典の著者の許可をとらないのである。つまり、無断で行われる引用は全く正常な行為であり、研究上の不正ではない。 研究上の不正になるのは、他人の文章を自分

    「無断引用」という表現はやめよう|Colorless Green Ideas
  • 英語で「何番目」を問うには|Colorless Green Ideas

    英語には日語の「何番目」に相当する表現がないため、「何番目」を問いたい場合、回りくどく言う必要がある。ここでは英語で「何番目」を問う方法を4つ紹介する。 はじめに 「何番目」であるかを英語で問うのは難しい。英語には「何番目」に相当する表現がないからである。だから、「ジェーンはあなたの何番目の娘さんですか」といった文は英語に直訳できない。また、リンカーンがアメリカの何代目の大統領か問いたければ、日語なら「リンカーンは何代目の大統領ですか」と問えば良いのだが、英語では「何番目」かを問える直接的な表現がないので、別の方法で問う必要がある。 以下、英語で「何番目」を問うための方法を紹介する。色々な方法があってどれを使えば良いか分からなくなるかもしれないが、その場合は、一番最初に紹介する「適当な順番で言って、相手に訂正させる」方法を使うとよい。この方法がおそらく一番楽である。 適当な順番で言って

  • 1