エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Qiitaの記事データは、機械学習のためのデータセットに向いている
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Qiitaの記事データは、機械学習のためのデータセットに向いている
有効性を試してみたい手法があるけど、データがない、という場面があります。 特に、テキストマイニング... 有効性を試してみたい手法があるけど、データがない、という場面があります。 特に、テキストマイニングに関する手法を、日本語の文書データに対して試そうとした時に多いです。 手法の検証に向いている日本語の文書データを探した所、Qiitaの記事データがテキストマイニング手法の検証に向いている良質なデータセットであることが分かりました。 また、Qiitaの記事データは、テキストマイニング以外に、時系列予測など、他の機械学習手法を試すことにも向いていると考えます。 今回の記事では、以下について説明したいと思います。 1. Qiita記事データの収集方法 2. Qiita記事データが良質なデータセットである11の理由 Qiitaの記事データの収集方法 Qiita記事データの収集方法は、以下の記事に詳しくまとまっています。 Qiitaの記事データをQiita API, Scrapyで収集 この記事は、個人