2021/11/13:本文抽出+ノイズ除去済の「学問ノススメ」 ← 必要な方はこちらをクリック はじめに 前回の記事では「TF-IDF」によるワードクラウド描画にチャレンジしましたが、思い通りにならなかった点(以下)がありましたので、再度チャレンジしました。 scikit-learnの「TfidfVectorizer」というライブラリがうまく使えなかった… nlplot(自然言語可視化・分析ライブラリ)もフルで試せなかった 実力不足のため、苦労しましたが、なんとか任意のテキストデータで「Word Cloud」、「nlplotによる各種可視化」、「(TfidfVectorizer)によるTF-IDF計算」、「TF-IDFによるWord Cloud」が実行できるようになったたので、備忘も兼ね、記事にしたものです。 実行条件など ・Google colabで実行 ・青空文庫の「学問ノススメ」で実
![自然言語を可視化・分析できるライブラリ「nlplot」はすごいよ - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/8b40e4ed7c9b3e632042a17e49bd42742ed801df/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9JUU4JTg3JUFBJUU3JTg0JUI2JUU4JUE4JTgwJUU4JUFBJTlFJUUzJTgyJTkyJUU1JThGJUFGJUU4JUE2JTk2JUU1JThDJTk2JUVGJUJEJUE1JUU1JTg4JTg2JUU2JTlFJTkwJUUzJTgxJUE3JUUzJTgxJThEJUUzJTgyJThCJUUzJTgzJUE5JUUzJTgyJUE0JUUzJTgzJTk2JUUzJTgzJUE5JUUzJTgzJUFBJUUzJTgwJThDbmxwbG90JUUzJTgwJThEJUUzJTgxJUFGJUUzJTgxJTk5JUUzJTgxJTk0JUUzJTgxJTg0JUUzJTgyJTg4JnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0xYThmMWUwM2MyMjMzYzhhYmVlMzAwNmQ2NTBjMmU3YQ%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBoaW1hMmI0JnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1hMDM3MzhlYjc3NjViYmI4OTJiMDE2Y2E3MWQ5NTI2YQ%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3Df229ed22e919c8eebbd3a93f0ac1f96a)