言語処理100本ノック 2015の挑戦記録です。環境はUbuntu 16.04 LTS + Python 3.5.2 :: Anaconda 4.1.1 (64-bit)です。過去のノックの一覧はこちらからどうぞ。 第3章: 正規表現 Wikipediaの記事を以下のフォーマットで書き出したファイルjawiki-country.json.gzがある. ・1行に1記事の情報がJSON形式で格納される ・各行には記事名が"title"キーに,記事本文が"text"キーの辞書オブジェクトに格納され,そのオブジェクトがJSON形式で書き出される ・ファイル全体はgzipで圧縮される 以下の処理を行うプログラムを作成せよ. 24. ファイル参照の抽出 記事から参照されているメディアファイルをすべて抜き出せ. 出来上がったコード: # coding: utf-8 import gzip import