エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
自然言語処理のためのデータセットを、一行で読み込む
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
自然言語処理のためのデータセットを、一行で読み込む
自然言語処理に限らず機械学習では、データを用意するところからすべてが始まります。 画像ではMNIST、... 自然言語処理に限らず機械学習では、データを用意するところからすべてが始まります。 画像ではMNIST、回帰ではボストンの家賃、分類ではアヤメといったデータが有名で機械学習フレームワークに付属していたりもしますが、こと自然言語処理となると何から手を付けていいかわからないことも多いのではないでしょうか。 そこで、今回は自然言語処理のためのデータセットを簡単にダウンロードするためのツールを作成しました。その名もchazutsu(茶筒)です! 自然言語処理を行うための代表的なパッケージであるNLTKにはnltk.downloadというデータをダウンロードするための仕組みが付属しているのですが、より簡単に対応するデータセットを追加でき、より「すぐに利用な形」でデータを用意するために、今回開発を行いました。 (Starを頂ければ励みになりますm(_ _)m) chazutsuの使い方chazutsuを