エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
言語処理100本ノック 2020 第3章: 正規表現 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
言語処理100本ノック 2020 第3章: 正規表現 - Qiita
先日,言語処理100本ノック2020が公開されました.私自身,自然言語処理を初めてから1年しか経っておら... 先日,言語処理100本ノック2020が公開されました.私自身,自然言語処理を初めてから1年しか経っておらず,細かいことはよくわかっていませんが,技術力向上のために全ての問題を解いて公開していこうと思います. すべてjupyter notebook上で実行するものとし,問題文の制約は都合よく破っていいものとします. ソースコードはgithubにもあります.あります. 2章はこちら. 環境はPython3.8.2とUbuntu18.04です. Wikipediaの記事を以下のフォーマットで書き出したファイルjawiki-country.json.gzがある. ・1行に1記事の情報がJSON形式で格納される ・各行には記事名が”title”キーに,記事本文が”text”キーの辞書オブジェクトに格納され,そのオブジェクトがJSON形式で書き出される ・ファイル全体はgzipで圧縮される 以下の処理