エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
青空文庫のテキストデータの一括ダウンロード方法
青空文庫のテキストデータの一括ダウンロード方法 2018-07-25-1 [NLP][Programming] 青空文庫のテキスト... 青空文庫のテキストデータの一括ダウンロード方法 2018-07-25-1 [NLP][Programming] 青空文庫のテキストデータを一括でダウンロードする方法について。 GitHub にサイトのデータなど一式入っているのでそこからゲットするだけ。 知らなかった……“青空文庫”の全データは“GitHub”から一括ダウンロードできる! (やじうまの杜 - 窓の杜) 大量のテキストを自然言語処理などで分析して有用な情報を抽出する“テキストマイニング”などには役立ちそう。 青空文庫のサイトから wget でまとめてダウンロードしてもいいんだけど、運用サーバに負荷かけるのはさけたいので、github から取れるのはありがたいです。 GitHub - aozorabunko/aozorabunko ディレクトリ "cards/" の下にテキストデータあり。 青空文庫のサイトの構成と同じですね。