こんにちは。理系大学院で修業中のスーパーケロケロです。趣味で自然言語解析(NLP)の勉強をしています。最近、テキストに含まれた情報を有向グラフに変換するPythonライブラリーnaruhodoを作ったので、ライブラリーの紹介も兼ねて、テキストを有向グラフに変換する話を少ししてみたいと思います。 naruhodoのGithubリポジトリはこちら、最新バージョンはです。 自然言語解析の流れ 自然言語解析を料理に例えれば、入力されたテキストは収穫待ちのコムギのようで、そのままでは使えない。このコムギを形態素解析で脱殻し(形態素単位で分離)、さらに词类(Part-Of-Speech)や依存構造解析で小麦粉にしてから(文法情報の付与)、ようやくパンのような美味しい食べ物が作れる(実際の応用)。 テキストが処理されるごとに、使える情報が増えて、応用の幅が広げるわけです。 文=>木、文章=>有向グラフ
![テキストに含まれた情報を有向グラフに変換する話(一):可視化の章 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/3659d7912b656530d95a181ba4c236d0a530d736/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9JUUzJTgzJTg2JUUzJTgyJUFEJUUzJTgyJUI5JUUzJTgzJTg4JUUzJTgxJUFCJUU1JTkwJUFCJUUzJTgxJUJFJUUzJTgyJThDJUUzJTgxJTlGJUU2JTgzJTg1JUU1JUEwJUIxJUUzJTgyJTkyJUU2JTlDJTg5JUU1JTkwJTkxJUUzJTgyJUIwJUUzJTgzJUE5JUUzJTgzJTk1JUUzJTgxJUFCJUU1JUE0JTg5JUU2JThGJTlCJUUzJTgxJTk5JUUzJTgyJThCJUU4JUE5JUIxJUVGJUJDJTg4JUU0JUI4JTgwJUVGJUJDJTg5JUVGJUJDJTlBJUU1JThGJUFGJUU4JUE2JTk2JUU1JThDJTk2JUUzJTgxJUFFJUU3JUFCJUEwJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmdHh0LWNsaXA9ZWxsaXBzaXMmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz1hMTYyZTEyOTIzODVjNDQwMGFkNWYzZDZhZDEzMmRiZA%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwc3VwZXJrZXJva2VybyZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9YTIwMTQ3YzlhNTc5YTUxZDJhNzFhYmU1MjkwMmZlMjU%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D2b1d54ac48914b440edde0a374e7ecc0)