Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

はじめに Pythonのライブラリ、NetworkXの使い方を、Qiitaの投稿に付けられたタグの関係グラフの作成を例にして説明します。 NetworkXを使うと、下に示すような、ノードとエッジで構成されるグラフを描くことができます。 実行環境 Windows 10 Python 3.5.2 (Anaconda) Jupyter notebook 元データの取得 Qiitaは、投稿を取得するAPIを公開しているので、簡単に投稿を取得することができます。 JSON形式で返ってくるデータを下記コードでPythonの辞書に変換します。 なお、非認証の場合、1リクエストごとに最大100記事、1時間ごとに60回の制限があるので、 今回は、100*60 = 6000 記事を対象とします。 import requests import json items = [] params = {"page":1
問題点 matplotlib の散布図などのプロットの際に、各点にラベルを付けてプロットしたい場合、下の図のようにラベルが重なってしまうため、ラベル付きプロットを諦めることが多々ありました。 図1: 散布図 (Before) 解決方法 ラベルの配置を制御する方法を探していたら、adjustTextというモジュールと出会いました。 github.com なんとラベルの重なりを最小限にし、スマートに配置してくれるモジュールとのこと。早速使ってみました。 図2: adjustTextと適用した散布図(アロー無し) 重なりが最小限になり、かなり見やすくなりました! さらに、アローを付けることもできます。 図3: adjustTextと適用した散布図(アロー付き さすがにプロットする点数が数百点ともなると処理に時間がかかる&最適化しても重なってしまうため、50±30点くらいの時に使うのが良さそうです
データ読み込み データは2つのエクセルファイルから読み込みます。 ファイル calvert.xlsx 1つめのデータは下に示すもので、作例グラフの緑線を描くためのもの。 エクセルで以下のような形で収納されています。これは自分でデータを打ち込んだので、打ち込みやすいよう、日付(dd)、月(mm)、年(yy)、値(Q) という並びにしています。 欠測期間が長く、グラフの線を連続させたくない場合は、欠測期間中のある一日の日付とデータとして nan をいれることにより、グラフの線を結ばないで描画してくれます。 ファイル v-notch.xlsx 2つめのデータは下に示すもので、作例グラフの濃い青線を描くためのもの。 これは既存のエクセルファイルがあったのでそれを用いていますが、ここで使用するのは、カラム A (Date)とカラム N (RWL) だけです。 エクセルファイルからのデータ読み込み エ
Knowledge Graph: Data Science Technique to Mine Information from Text (with Python code) Examine doable tactics for reducing tension, increasing self-assurance, and cultivating wholesome relationships. Discover how to employ continuous learning, mindfulness, goal-setting, and knowledge graph python to help you reach your objectives. Whether your objective is greater purpose, job success, or emotio
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く