タグ

ブックマーク / id.fnshr.info (16)

  • Rのグラフィック作成パッケージ“ggplot2”について|Colorless Green Ideas

    はじめに Rには、“ggplot2”というライブラリがある。このライブラリを使うと、デフォルトの作図コマンドよりも効率的に作図ができ、しかも分かりやすくて美しい図を描くことができる。美しい図といってもピンと来ないかもしれないが、百聞は一見にしかず、下の2つの図を比べてもらいたい。1つ目の白い背景の図がRのデフォルトの作図コマンドで作成された散布図である。2つ目の灰色の背景の図が“ggplot2”を使った散布図である。 Rのデフォルトの作図機能を使った場合の散布図の例 “ggplot2”を使った場合の散布図の例 以下では、“ggplot2”のコンセプトと簡単な作例を紹介したいと思う。最初は抽象的な話をする。このため、最初から読んで分かりづらかったら、後の方の作例を先に見た方が理解が早いかもしれない。 “ggplot2”のコンセプト “ggplot2”は、どのように作図を行っているのであろうか

    Rのグラフィック作成パッケージ“ggplot2”について|Colorless Green Ideas
  • 名人伝―院生編|Colorless Green Ideas

    天下第一の研究者になろうと志を立てた院生。教授のもとで「学之学」を身につけ、さらには名誉教授のもとで「不学之学」を身につけた院生の末路は? 文 ある大学の研究室に所属する院生という男が、天下第一の研究者になろうと志を立てた。己の師と頼むべき人物を物色するに、斯学の権威である教授に及ぶ者があろうとは思われぬ。論文を専門誌に投稿するに皆査読を通過するという大家だそうである。院生は遥々教授をたずねてその門に入った。 教授は新入の門人に、まず先行研究をよく学べと命じた。院生は大学図書館に行き、図書館の奥深い書庫の中に潜り込んで、そこにある学術誌を片っ端から読んだ。たとえ自分の研究と関連が薄いものでもしっかりと内容を把握しようという工夫である。この院生を見た図書館員は大いに驚いた。第一、閉館時間になっても帰ろうとせず書庫から離れようとしないのでは困るという。厭がる図書館員を院生は叱りつけて、無理に

  • 「英語で3千語って何ページ分?」といった疑問を解決する方法|Colorless Green Ideas

    題 「英語で3千語って何ページ分?」といった疑問をいだくこと [1] があると思う。こうした疑問を解決するには、Wolfram|Alphaというサイトが役に立つ。 Wolfram|Alpha で 3000 words と検索する Wolfram|Alphaで、“3000 words”と検索しよう。そうすると、それが何ページに相当するかを計算してくれる。計算結果のページにはいろんな情報が書かれているが、ページ数を知るには“Printed length”というところを見ればよい。3千語の場合、シングルスペースの文書なら6ページ、ダブルスペース [2] の文書なら12ページという結果が出てくる。ちなみに、Show assumptions というボタンを押すと計算の根拠が出てくる。英語の場合、シングルスペースなら500語で1ページ、ダブルスペースなら250語で1ページとみなして計算しているようだ

  • 文系博士後期課程院生の就活|Colorless Green Ideas

    はじめに 大学院をやめるにあたって、職探しをした。やめるにしてもい扶持のあてがなければ、どうしようもないからだ。いわゆる文系の博士後期課程の院生が、就活をするのはあまりないケースだと思うので、自分の経験を記すことにした。似たような状況にある人の参考になれば幸いである。 もし、文系の博士の院生で進路や就活について悩んでいる人がいたら、私で良ければお話しを聞きますので、ご遠慮なく連絡してください。悩んでばかりいてはしかたありませんから。 なお、ここで述べる「就活」は、大学などでのアカデミックポストへの就職を目指すことではなく、民間の一般企業などへの就活を目指すことを指している。この他、公務員の採用試験を受けて公務員になる道もあるし、中高などの教員になるという道もあるが、私はそういう道を選ぼうとしなかったので、公務や教員についての話はここでは書かない。 また、ここでの就活は博士後期課程の院生の

  • 大学院をやめました|Colorless Green Ideas

    はじめに 3月末をもって大学院の博士後期課程を退学することとなった。博論は結局未提出。これで俗にいう「博士課程単位取得満期退学」 [1] になる。 大学院はなかなか楽しかった。周りの人も良い人が多かったし、学術面以外にも色々と勉強になった。結構居心地の良い場所だった。そして、色んな人にお世話になった。この場所でもお礼申し上げたい。 学部4年、修士課程2年、博士後期課程4年 [2] と大学には10年も居続けた。理系 [3] の人は「博士後期課程に3年間ちゃんと在学して研究すれば、博士号なんて簡単に取れるでしょ」と思うかもしれない。私も実際にそのようなことを複数の人から言われた。だが、かなしいかな、日の人文系の大学院はそういう場所ではない。実際、大学院に10年居続けてようやく博士号をとるという例も少なくない。私のいた専攻もそんなかんじで、標準年限内に博士号をとる人の方がむしろ珍しいという状況

  • オンラインで無料で読める統計書22冊|Colorless Green Ideas

    はじめに 今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれたが多いが、日語で書かれたも若干ある。 入門書 まず、統計の初学者のために書かれた入門書を紹介したいと思う。 福井正康 (2002). 『基礎からの統計学』基礎から扱っている統計の入門書である。統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。理解を助けるための演習問題とその解答がついている。統計処理用のソフトとしてはExcelを使っている。同じサイトに社会科学系の学生向けの数学の教科書もある。 小波秀雄 (2013). 『統計学入門』基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論

    オンラインで無料で読める統計書22冊|Colorless Green Ideas
  • 参考文献表にそのままコピペ可能な文献情報を出力するウェブサービス|Colorless Green Ideas

    書籍を引用する場合は、OttoBibを使うことをおすすめする。書籍でなく、雑誌論文などの文献情報を整形して出力したければ、BibMeかCitefastを使うことをおすすめする。BibMeとCitefastは機能的にはほぼ同等である。インターフェースが好きな方を選べばよい [3] と思う。 OttoBib OttoBibは、文献情報を出力するウェブサービスの中で最もシンプルなものである。対応しているのは書籍のみである。雑誌に載った論文などには対応していない。 使い方は非常に簡単で、書籍のISBNを入力欄に入れるだけである。それだけで、MLA形式、APA形式、Chicago形式で、参考文献表にそのままコピペできる形にしてくれる。 BibMe BibMeでは、MLA形式、APA形式、Chicago形式、Turabian形式で文献情報を出力することができる。OttoBibに比べると、複雑な設定を行

  • 大学院の研究室を選ぶ際に着目すべき5つのポイント|Colorless Green Ideas

    大学院の研究室を選ぶ際には、研究内容以外にも考慮すべき点がある。例えば、教員の年齢や他の院生の雰囲気などである。 はじめに 大学院の研究室を選ぶ際に、最も重要なポイントはその研究室でどんな研究が行われているかということだと思う。しかし、研究内容だけを見れば良いというものではない。他にも考慮すべき点はたくさんある。 このことは、家を探すときと似ている。家を探すときは、家の間取りが重要なポイントとなる。しかし、考慮すべき点は他にもある。例えば、交通の便は良いか、近所に便利な施設はあるかといったことを考えないわけにはいかない。もし、間取りしか考慮せずに家を探したら、とんでもない家に住むことになってしまうこともあるだろう。 大学院の研究室を選ぶのも家探しと同じである。単に研究内容が気に入ったからといって、それだけで研究室を決めると、とんでもないことになってしまうかもしれない。 というわけで、今回は

  • twitter→ɹəʇʇɪʍʇのように英数字を180度回転して表示する方法|Colorless Green Ideas

    twitter→ɹəʇʇɪʍʇのように英数字を180度回転する際に役立つ情報を掲載。この他、TeXで文字を回転して表示する方法についても。 どうやって180度回転するか “twitter”を“ɹəʇʇɪʍʇ”に、“7-11”を“⇂⇂-L”にするように、英数字を180度回転させて面白おかしく見せるという遊びがある。これは、英数字をひっくり返した形とよく似た文字を使っている。例えば、“M”を実際にひっくり返すかわりに、これをひっくり返した形によく似ている“W”を用いるのである。 自分でひっくり返した形を見つけるのは面倒だろう。だが、簡単に180度回転ができるウェブサービスが提供されており、これを使えばすぐにひっくり返してみせることができる。また、この記事に、英数字をひっくり返した形とよく似た文字の一覧を付けたので参考にしていただければ幸いである。 なお、ひっくり返した形とよく似た文字を使うのは

    twitter→ɹəʇʇɪʍʇのように英数字を180度回転して表示する方法|Colorless Green Ideas
  • 蜘蛛の糸―無職博士編|Colorless Green Ideas

    学歴ワーキングプア地獄で苦しむ無職の博士に対して御釈迦様がさしのべた助けとは? そして、博士はその助けで学術界の底辺から抜け出せるのか? 文 一 ある日の事でございます。御釈迦様は極楽の象牙の塔を、独りでぶらぶら御歩きになっていらっしゃいました。象牙の塔の頂上に収められている学術の成果は、みんな玉のように輝き、そのまん中にある金文字表紙の博士論文からは、上質紙の何とも云えない好い匂が、絶間なくあたりへ溢れて居ります。極楽は丁度朝なのでございましょう。 やがて御釈迦様はその象牙の塔に御佇みになって、ふと下の容子を御覧になりました。この極楽の象牙の塔の下は、丁度学術界の底辺に当って居りますから、淀んだ空気を透き徹して、高学歴ワーキングプア生活やブラック研究室の景色が、丁度擦硝子を通したように、ぼんやりとのみ見えるのでございます。 するとその学術界の底辺に、無職の博士と云う男が一人、ほかのポ

    蜘蛛の糸―無職博士編|Colorless Green Ideas
  • 羅生門―ポスドク編|Colorless Green Ideas

    衰微した平安朝の下人の話ならぬ、衰微した平成朝の下人、もといポスドクの話。校門に捨てられたポスドクが、薄汚れた研究室で見たものとは? 文1 ある日の暮方の事である。一人のポスドクが、大学の校門の下で雨やみを待っていた。 広い門の下には、この男のほかに誰もいない。ただ、所々塗装の剥げた、大きな鉄柱に、蟋蟀が一匹とまっている。校門が、キャンパスの入口にある以上は、この男のほかにも、雨やみをする学部生や大学職員が、もう二三人はありそうなものである。それが、この男のほかには誰もいない。 何故かと云うと、この十数年、学術界には、大学院重点化とか学力低下とか国大法人化とか事業仕分けとか云う災がつづいて起った。そこでキャンパス内のさびれ方は一通りではない。旧記によると、博士論文や貴重書籍を打砕いて、そのハードカバーがついたり、箔押の金文字がついたりしたものを、路ばたにつみ重ねて、キムワイプの代わりに売

  • 『データ解析のための統計モデリング入門』のレビュー|Colorless Green Ideas

    一般化線型モデルと呼ばれる統計手法やその応用を紹介した書評。統計を使った学術研究がいかにいい加減なものであるか鋭く指摘している。 はじめに 『データ解析のための統計モデリング入門』というを読んだので、その内容を簡単に紹介したい。このでは、一般化線型モデルと呼ばれる統計手法やその応用が紹介されており、R と WinBUGS というソフトが実際の解析に用いられている。 久保拓弥 (2012). 『データ解析のための統計モデリング入門―一般化線形モデル・階層ベイズモデル・MCMC』 東京:岩波書店. このは、全般的に説明があっさりとしている。このため、一般化線型モデルをしっかり学びたいのならば、(英語で書かれた)厚めの教科書を読んだ方が良いと私は思う。ただし、このは、統計を使った学術研究がいかにいい加減なものであるか鋭く指摘している。この耳に痛い指摘は、統計を使って仕事をする人にとっ

  • 学問における内輪の「秘儀」|Colorless Green Ideas

    学問分野には「秘儀」と呼ばれるダメな研究手法がはびこる場合がある。このような手法を捨て去るのは非常に困難である。 はじめに 『データ解析のための統計モデリング入門』というを読んだ。色々な面で面白い統計書であった。中でも刺激的だったのは、いい加減なデータ解析の例を指摘しているところであった。そこで、ある種の(ダメな)データ解析を内輪の「秘儀」と呼んでいた。この「秘儀」という言葉に対して少し思うところがあったので、簡単に記してみたい。 なお、この文章の内容を簡単にまとめると、学問分野には「秘儀」と呼ばれるダメな研究手法がはびこる場合があり、これを除去するのは難しく、どうしようもならなくて困る、といったところになる。 内輪の「秘儀」とは? 冒頭で述べたように、この文章を書いているのは『データ解析のための統計モデリング入門』というに刺激されたためである。このの書誌情報を以下に記す。 久保拓弥

  • (言語学の)卒論を書くときに役立つウェブサイト|Colorless Green Ideas

    論文を書く際の心構え、文章の構造の設定、文章表現などの情報を掲載。言語学特有の話もあるが、それ以外の分野の人にも通じるところがある。 はじめに 今回は、言語学に関係する卒業論文を書くに当たって役立つウェブサイトをいくつか紹介しようと思う。まずは、卒論のための研究の行い方について紹介した記事や冊子を紹介したい。その後、実際に卒論を文章にするときの文章表現方法などについて触れた記事などを紹介するつもりである。 タイトルとしては、一応「言語学の卒論」だが、日語学・国語学や英語学その他の外国語学について卒論を書こうとしている人も対象としている。また、文章表現法などは、言語学に限らず、他のどの分野でも役立つので、言語学と全然関係ない人もよろしかったら参考にしてもらいたい。 卒業論文に当たっての心構え 卒業論文のための研究は、高校までの学習、あるいは大学の普通の授業での学習方法とは違った方法で進めて

  • Googleなどでのヒット数は言語研究の証拠となるか?|Colorless Green Ideas

    Google などのサーチエンジンでのヒット数は、言語研究の証拠とするには問題がある。これはヒット数の変動が大きいなど、再現可能姓に乏しいためである。 はじめに 最近の言語学の論文では、Google などのサーチエンジンでのヒット数を議論の証拠としていることが結構ある。例えば、ある表現を Google で検索したところ5万件ヒットし、同様に別の表現を検索したところ500件しかヒットしなかったので、前者の方がよく使われる表現である、と主張するのである。 結論を先に言うと、Google などのサーチエンジンでのヒット数を言語研究の証拠とすることには問題が多い。問題点の1つとして、ヒット数に再現可能性がないことが挙げられる。ヒット数は安定的な数値ではなく、急変しうる。言語研究も科学的研究である以上、このような再現可能でないものを証拠として使うのは問題がある。また、サーチエンジンが検索対象としてい

  • 『統計を始める前に』(主に言語研究者向け)の公開|Colorless Green Ideas

    文書の性質 『統計を始める前に』という教科書的文書を公開したいと思う。これは、以前、勉強会のために私が作成した文書の一部を切り貼りして作ったものである。以下から、PDFファイルとしてダウンロードが可能なので、必要な方はどうぞ。なお、強制ではないが、リンクを貼るときは、PDFに直接リンクするのではなく、このページにリンクしていただければ幸いである。何か追加情報があったときには、このページに書くつもりなので。 http://id.fnshr.info/docs/stat_for_langs00.pdf これは何を目的にした文書かと言うと、タイトルの通り、「統計を始める前に」一通り知っておきたい数学的知識などをまとめたものである。この文書を一通り読んだ上で、統計の勉強を始めるとはかどるはずである。 統計を始める前に、数学の勉強をしないといけないなんて面倒だと思う人もいるかもしれない。だが、私の経

  • 1