この記事について R Advent Calendar 2022 5日目です。 Rのカレンダー | Advent Calendar 2022 - Qiita ldccrとgibasaという自作Rパッケージの紹介をかねて、tidytextっぽいやり方によるテキスト分析をやります。 本家のText Mining with Rでは、英語のtidyなテキストデータ(tidy text)について、感情語を収録している辞書とinner_joinすることによって感情分析(というか単語のネガポジを判定するやつ)をおこなっているセクションがあります。この記事では、それと似たような感じで、日本語のtidyなテキストデータと季語を集めた「季寄せ」辞書とをinner_joinすることによって、テキストの季節感みたいなものを調べるというのを試してみます。 使用するデータ 題材としては、宮沢賢治『春と修羅』を使用するこ
![宮沢賢治『春と修羅』の季節に関連する語彙の分析 - リリカルはなくそオーガスタ](https://cdn-ak-scissors.b.st-hatena.com/image/square/eff68e978192d4fad898ff769592111577722cda/height=288;version=1;width=512/https%3A%2F%2Flyrikuso.netlify.app%2Fmedia%2Fposts%2F70%2Fpicography-snow-ravine-water-mountains.jpg)