初めまして、Aidemy研修生のぐっちーです。 今回はPythonの得意分野である ・自然言語処理(コンピュータに人間の言語を処理させる学問) ・スクレイピング(ネット上からデータを収集する行為) を行い、ネット上の国会議事録データから会議内の頻出単語を抽出する プログラミングを実装してみたいと思います。 (結果の一例↓) Pythonを一通りかじったけど、何をすればいいかわからない…! というかたの、足がかりになればなと思います! 研究背景 突然ですが、統計データは母集団により結果が大きく変わります。 以下の安倍内閣の支持率に対する世論調査をご覧ください。↓ 日本テレビの世論調査 2018年4月の安倍内閣の支持率を26.7%としております。 国際ニュース通信社ロイターの調査 こちらは2018年4月の安倍内閣の支持率を73%としております。 データを取った母集団は、以下の通り 日本テレビ→

