サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
体力トレーニング
qiita.com/kakiuchis
実際にscikit-learnで出力されるPrecisionやRecallを事例に、適合率と再現率の意味を説明しようと思う機械学習scikit-learn分類Precisionclassification_report 分類モデルの評価指標として、適合率や再現率などがあります。Web上で多くの解説記事がありますが、scikit-learnのclassification_reportに表示される各指標を読み解くためには、プラスアルファの理解が必要です。この記事では、実際にscikit-learnで出力される内容を例にして、適合率と再現率の意味を解説します。 Webとかでよくある説明 機械学習で分類モデルを評価するとき、正解率(Accuracy)、適合率(Precision)、再現率(Recall)、F1-scoreなどの評価指標をよく利用します。これらの解説として、以下のような2値分類の説明
Pythonデータ可視化に使えるseabornのメソッド25個を一挙紹介します。また最後に、データ分析の流れを経験できるオススメ学習コンテンツを紹介したので、ご参考ください。 必要なライブラリ
この記事は、DataFrameとして取り込んだ「データ確認」と「データ変換」で使えるカンニングシートです。 必要なライブラリ # 頭の3行を表示 df.head(3) # 最後の4行を表示 df.tail(4) # 2,4,6行目を表示 df.loc[[1,3,5]] # 4~9行目を表示 df.loc[3:8, :] # 条件を指定して合致する行のみを表示する df[df['currency'] == 'USD'] # currencyカラムがUSDの行のみ抽出して表示。 df[df['cost'] > 30000] # costカラムが30000より大きい行のみ抽出して表示。 df[df['point'].isnull()] # pointカラムがブランクの行のみ抽出して表示。
おつかれさまです。 必要に迫られており、クソ焦って勉強した。 とりあえずWEB上でカンニングできるように、1番素人がしっくりきそうなデータ分析手順のカンニングシートをQiitaにアップ。 必要なライブラリのインストール # pandasはデータの取扱系ライブラリ import pandas as pd # とくにDataFrameはよく使うので、個別importしておく from pandas import DataFrame # numpyは行列計算系ライブラリ import numpy as np # matplotlibとseabornはグラフ系ライブラリ import matplotlib.pyplot as plt import seaborn as sns # Jupyter Notebookを使う想定なのでブラウザ上にグラフ表示できるように設定 %matplotlib inl
背景 railsのscaffold自動生成ばっか使ってると、フォームのデータの行き先はあまり気にしないことが多い。 そんな感じなので、フォームのデータの行き先はどこ?みたいな質問をよく受けます。 あー、そんなん余裕やろと思ってると、rails5になってform_forがform_withに代わってて焦った。 ソッコーでググってなんとかなったが、そのググった内容をまとめておくこととした。 scaffold生成のform_with scaffoldで生成するとform_withってこんな感じです。
背景 railsでdelay_jobやwheneverを実装し、ローカル開発環境では問題なくジョブが走った。 しかし本番環境にデプロイ後、ジョブが走らなかった。 エラーログを確認したところrailsのbinディレクトリ以下の各ファイルの権限が644となっており、実行権限がないことが判明。 だとしたら、ローカル開発環境でも動かないはずだろ?? そんな思いからいろいろ調べてみた。 windows環境でのgitbushはchmodが効かない!! chmod 777 ファイル名してもchmod 644 ファイル名してもchmod o+w ファイル名しても何しようが権限が変更されない。 大丈夫! これはwindowsの仕様の問題らしい。 なのでスッキリあきらめよう! git addするとパーミッションが自動的に変更され644になってしまう!! これはgitの仕様。 おそらくですが、大規模開発を想定し
機械学習勉強でよーわからん単語、ややこしかった〇〇関数に関して調べました。 前置き 例えば駅からの距離、部屋の広さ、築年数から家賃を予測する機械学習を実装する流れは、 大量の駅からの距離、部屋の広さ、築年数、家賃のデータを集める 大量のデータから、法則(家賃の計算式)を導く です。 しかしながら、導かれる計算式の結果と家賃には差が存在します。 (すべて計算式で1円たりとも違わずに表現できるはずがない) この差が小さくなるように、計算式を考えていくことが機械学習の研究者たちのやるべきことでもあるのです。 この差を関数(なんらかの数式)で表現したものを目的関数といったり、コスト関数といったり、誤差関数といったり、損失関数といったりします。 目的関数、コスト関数、誤差関数、損失関数、なにがどう違うのか? これは様々な議論がなされている。 https://www.quora.com/What-is
自然言語のpythonでの前処理のかんたん早見表(テキストクリーニング、分割、ストップワード、辞書の作成、数値化)Python機械学習自然言語前処理 pythonによる自然言語の前処理方法のかんたん早見表を作成したので、データの前処理に役立ててください。また最後に、データ分析の流れを経験できるオススメ学習コンテンツを紹介したので、ご参考ください。 1.テキストクリーニング 普通の文章の変な文字とかを除くこと。 つまり、<p>Yes!!! Falling LOVE(⋈◍>◡<◍)。✧♡</p>→yes falling loveにすること。 小文字にする
Pythonのグラフ作成ライブラリ「matplotlib」でよく使われる手法をまとめたので、グラフ作成に役立ててください。また最後に、データ分析の流れを経験できるオススメ学習コンテンツを紹介したので、ご参考ください。 ライブラリのインポート
pandasのDataFrameのデータ操作のかんたん早見表を作成したので、データ操作に役立ててください。また最後に、データ分析の流れを経験できるオススメ学習コンテンツを紹介したので、ご参考ください。 事前にimport
背景 ひょんなことから最適化数学を勉強して、それを記事にする必要が発生。 機械学習のために役立つ最適化数学という位置づけでの記事作成が必要なのです。 なので、最適化数学がどのような形で機械学習に役立つのかを調べてみた。 最適化数学とは? 最適化数学とは、最適化問題を解くための数学です。 読んでそのままなので引き続き説明が以下に続きます。 最適化問題とは? 例えば以下のような問題と向き合ってみましょう。 焼肉は2000円/人前、チキン南蛮は600円/人前、フライドポテトは350円/人前 焼肉は1200kcal/人前、チキン南蛮は1000kcal/人前、フライドポテトは850kcal/人前 焼肉を食べるのに7分/人前、チキン南蛮を食べるのに10分/人前、フライドポテトを食べるのに15分/人前 予算は1万円 食事に使える時間は60分 食べていない時間はとんでもない皿洗いさせられるので100kal
このページを最初にブックマークしてみませんか?
『@kakiuchisのマイページ - Qiita』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く