Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
Pythonを書くようになり、Jupyterを使って遊んでいます。matplotlibで遊んでいたのですが、日本語が文字化けする現象がおきました。 Jupyterを日本語化する方法はぐぐるとそれなりに数が出てきます。しかし、それらの記事は、JupyterのDockerイメージ環境とはキャッシュの場所が違うなどして、若干手間取りました。Dockerfileを書いて、いつでも日本語化できるようにしました。 参考サイト 最初に参考記事をご紹介します。感謝感謝 作成したdockerfile Dockerfileを見れば、何をしたかすぐに分かるのでひとまず読んで FROM jupyter/datascience-notebook LABEL maintainer "nassy20 <xxxx@gmail.com>" RUN curl -L "https://oscdl.ipa.go.jp/IPAex
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? intro 分類タスクなどで、クラスごとのサンプル数が極端に偏っていることがあります。 そういった場合、一つの方法としてresamplingを行うことがあります。 どちらかといえばoversamplingを使うことのケースが多いかと思うのですが、 以下のようにundersamplingを使いたいケースがありました。 全部を使ってトレーニングするには、データが多すぎる。 偏りが非常に大きいため、Majority classを大幅に減らしたい 線形で分けにくいケースがある Majority classのうち明らかに識別できそうなものを除いて
はじめに... 私がはじめてmatplotlibに出会った時、全く使い方がわかりませんでした。 なんと、$y=ax+b$の直線やsin曲線でさえ書くことができませんでした(笑) そんな私の目の前にあるのは、英語だらけのmatplotのdocumentと、長いコードと専門用語満載のQiitaブログ、、、。 プログラミング初心者だった私は、それらを読んでもどうやってコーディングするのか全く理解できなかったのです。 そんな私のようなmatplotlib難民を減らすべく「初心者でも楽しく、Excelのように簡単にグラフを作れる」ということを目標に書いていきたいと思います。 とにかく簡単に直感的に描画していくことを目標にしているので、コードが泥臭くなるかもしれません。 テンション的には、**「書いた→実行→なんかできた!よっしゃー!」**みたいなイメージです。 ある程度、このブログで描画に慣れてきた
%matplotlib inline import matplotlib.pyplot as plt import pandas as pd import matplotlib.dates as mdates fig = plt.figure() ax = fig.add_subplot(1,1,1) # 横軸:日付 periods分の日付を用意します。 x = pd.date_range('2018-08-07 00:00:00', periods=10, freq='d') # 縦軸:数値 y = [130, 141, 142, 143, 171, 230, 231, 260, 276, 297] ax.plot(x,y) # 日付ラベルフォーマットを修正 days = mdates.DayLocator() daysFmt = mdates.DateFormatter('%m-%d'
本日は animatplot というライブラリの紹介です。 前置き 可視化ツールとしての matplotlib は静的なグラフの描画だけでなく、パラメータによって変化するグラフの様子をgifなどのアニメーションで表現することができます。数学的な対象物をアニメーションで視覚化するというのは我々を楽しくさせます。 楽しい反面、手間がかかります。例えば、アニメーションを実装するには matplotlib.animation.FuncAnimation という matplotlib の機能を用いることで実現できます。例えば下記のような実装になります。 import itertools import logging logging.basicConfig(level=logging.INFO) import random import matplotlib.animation as animatio
公式サイト 一般的な評価 下記の記事にもある通り、機械学習のライブラリの中ではやはり随一の知名度を誇り、アルゴリズムのバラエティにも富んでいます。 また、使い方も非常に簡単で、理論を勉強しながら実際にそれを現実的な問題に適用してみるということを簡単に行えるようにしてくれるライブラリです。 https://www.quora.com/What-are-the-best-open-source-machine-learning-libraries-written-in-Python 機械学習のモデル構築プロセス 画像引用:https://www.cloudpulsestrat.com/posts/googles-new-cloud-automl-broader-role-automated-machine-learning-ai データ・課題の整理をする ちょっと長くなってしまいますが、一番大
1. はじめに これまでもQiitaには株価を機械学習/ディープラーニングで予想する、という記事が投稿されてきました (例えば参考文献の1)。果たしてそれに付け加えることがあるのか、という気もしますが考え方の整理も兼ねて投稿したいと思います。主な方針としては 日経平均(N225)がその日上がるか、下がるかを予測する N225を含む指標の、始値 (Open)、高値 (High)、安値 (Low)、終値 (Close)のみを使う 機械学習のライブラリとしてはscikit-learnを使う です。1については今日の終値が昨日の終値より安いか高いか正確に予測できたとしても、それで利益を出すのは難しそうだからです。ただし予測の難易度は上がります(70%の精度は夢のまた夢です)。2はデータの入手性によります。3はディープラーニング系のライブラリ(tensorflowなど)は使わないということです。これ
概要 最近この夏が暑すぎて気象データについて色々と分析されているので(「今年の夏は暑い 解析」とかでまあまあヒットします)、私も自分なりに分析してみました。統計については今勉強途中です。 参考記事 あまりに暑いので,140年分の気温をProphetで分析した 東京の夏が「昔より断然暑い」決定的な裏づけ ただpandas,matplotlib,sklearnを使ってみたかっただけですが、、、、 データセット データは気象庁のサイトにある年ごとの値を取ってきました。1ページのみだったのでコピペでCSVファイルに書き込みました。 過去の気象データ>年ごとの値 とってきた変数は以下の通りです。 year: 年 pressure : 気圧平均 rain-sum: 年合計降水量 rain-max: 日最大降水量 temp-mean: 日平均気温の平均 maxtemp-mean: 日最高気温の平均 mi
# !/usr/bin/env python2.7 # -*- coding: utf-8 -*- import numpy as np from sklearn.svm import LinearSVC from sklearn.model_selection import GridSearchCV import mydata idx_features = np.r_[1:5] ## read data data_orig = mydata.read() win_total = 0 draw_total = 0 lose_total = 0 for year in xrange(1996, 2019): # 前年までのデータで学習 data_train = data_orig[data_orig[:, 0] < year] X_train = data_train[:, idx_feat
こんにちは、CET というチームに所属している @kojisuganuma です。 普段は機械学習エンジニアリングと Splatoon2 をメインでやってます。 本記事では、個人的に勉強中の OSS ワークフローエンジン digdag を使って、機械学習モデルの継続的学習を実現してみたいと思います。ポイントは以下の通り。 digdag server, PosgreSQL を docker コンテナで動かす digdag のタスクを digdag server とは別コンテナの上で動かす scikit-learn を使って機械学習モデリング scikit-learn の学習済みモデルを cloudpickle でシリアライズ 対象読者 docker を使って digdag server を構築したい方 機械学習モデルの継続的学習を実現したい方 scikit-learn を使って機械学習モデリ
matplotlibで日本語を使おうとすると、デフォルトのままでは文字化けしてしまいます。 そこで文字化けしないようにするための設定を紹介します。 お困りごと Jupyter Notebook上で以下のような処理を実行したときに グラフのラベルが上手く表示されない。 from numpy.random import * from matplotlib import pyplot as plt %matplotlib inline # 乱数生成 rand_nums = randn(100) # ヒストグラム表示 plt.hist(rand_nums) plt.xlabel("X軸と表示したい") plt.ylabel("Y軸と表示したい") 実行結果 環境 MacOS、Python 3.6(Anaconda)、Jupyter Notebookがインストールされている環境。 準備 以下のサイト
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く