今回はPythonのパッケージである「sumy」を用いて文章要約を行います。文章要約の技術には要約元の文章から新しい文章を自動生成する「抽象型」と文章の内容を表す上で重要な文を何らかのアルゴリズムを用いて抽出する「抽出型」があり、sumyは抽出型の要約を行うことができるパッケージです。また、sumyは様々な抽出型アルゴリズムが備わっているため、複数のアルゴリズムを試したり比較したりすることができます。 実行環境 Python==3.7.3 sumy==0.8.1 tinysegmenter==0.4(sumyの内部で使用されるシンプルな形態素解析器) 文ごとに分割~形態素解析 spacy==2.2.4 ja-ginza==3.1.0 ja-ginza-dict==3.1.0 Janome==0.3.10 en_core_web_sm==2.2.5(spacyの英語辞書) 前処理 mojim