ArcWaterCashのブックマーク - はてなブックマーク

日本統計学会創立75周年記念出版『21世紀の統計科学』(全3巻) 増補HP版 (2012年1月)

2008年に日本統計学会75周年記念出版として刊行されました国友直人・山本拓監修『21世紀の統計科学』(全3巻)の増補版を，日本統計学会のホームページを通じて提供することとなりました．本書の増補版のオンライン公開が統計科学の今後の発展に資することを期待しております．第I巻社会・経済の統計科学 (国友直人・山本拓編) 第II巻自然・生物・健康の統計科学 (小西貞則・国友直人編) 第III巻数理・計算の統計科学 (北川源四郎・竹村彰通編)

ArcWaterCash 2019/12/24

統計

リンク

Web開発でJavaScriptの代わりにC#でロジックを書くBlazorがめちゃ便利！ - Qiita

はじめに UL Systems Advent Calendar 2019 の17日目です。 Blazorとは、.NET の技術を使ってクライアント側のWeb UIを構築するためのフレームワークです。このBlazorを使えば、今まで主に業務アプリケーションの開発で C#を使用してきたような開発者であっても、極力JavaScriptを使わず、追加の学習コスト少なくWebアプリケーション(SPA)を開発することができるようになります。 Blazor には、サーバ側で処理するBlazorサーバーと、クライアント側で処理するBlazor WebAssemblyがあります。Blazorの開発を今まさに進めており、2019年9月にリリースされた.Net Core 3.0にてBlazor サーバーが正式にサポートされるようになりました。Blazor WebAssemblyも2020年5月に正式リリースされ

ArcWaterCash 2019/12/22

blazor

リンク

Dockerでデータ分析環境を手軽に作る方法 - 天色グラフィティ

何かデータ分析を行わなければいけないとき、手軽に分析環境を用意したいというニーズがあります。 Jupyter Notebook上でnumpy、pandas、matplotlib、scikit-learnあたりが使えれば十分でしょうか。XGBoostやLightGBMといったライブラリも使えるようにしておきたいという人もいるかと思います。一方、ローカルにいろいろなライブラリをインストールしていくと、次第に環境が汚れていってライブラリの衝突などが起こりやすくなってしまいます。 KaggleにはKernelという計算環境があり、そこには主要な機械学習ライブラリが予めインストールされています。データ分析をやっていく上で不自由はありません。今回はDockerとdocker-composeを使ってKaggle Kernelを手元に再現し、ポータブルな分析環境として使う方法を紹介します。データ分析界

ArcWaterCash 2019/12/18

docker

リンク

Python: CatBoost を使ってみる - CUBE SUGAR CONTAINER

今回は CatBoost という、機械学習の勾配ブースティング決定木 (Gradient Boosting Decision Tree) というアルゴリズムを扱うためのフレームワークを試してみる。 CatBoost は、同じ勾配ブースティング決定木を扱うフレームワークの LightGBM や XGBoost と並んでよく用いられている。 CatBoost は学習にかかる時間が LightGBM や XGBoost に劣るものの、特にカテゴリカル変数を含むデータセットの扱いに定評がある。ただし、今回使うデータセットはカテゴリカル変数を含まない点について先に断っておく。使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.14.3 BuildVersion: 18D109 $ python -V Python 3.7.

ArcWaterCash 2019/12/13

機械学習

リンク

Python: featuretools ではじめる総当り特徴量エンジニアリング - CUBE SUGAR CONTAINER

今回は featuretools というパッケージを用いた総当り特徴量エンジニアリング (brute force feature engineering) について書いてみる。総当り特徴量エンジニアリングは、実際に効くか効かないかに関係なく、考えられるさまざまな処理を片っ端から説明変数に施して特徴量を作るというもの。一般的にイメージする、探索的データ分析などにもとづいて特徴量を手動で作っていくやり方とはだいぶアプローチが異なる。そして、featuretools は総当り特徴量エンジニアリングをするためのフレームワークとなるパッケージ。使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.14.6 BuildVersion: 18G1012 $ python -V Python 3.7.5 もくじもくじ下準備

ArcWaterCash 2019/12/13

機械学習

リンク

Sign in to your account

ArcWaterCash 2019/12/06

azure

リンク

Microsoft Ignite The Tour Tokyo POWA30 B面 - Qiita

2019-11 に開催された Microsoft Ignite 2019 には参加しなかったけれども、Power BI を中心としたセッションをオンデマンドで視聴などしていました。その中のひとつ、 Enable modern analytics and enterprise business intelligence using Microsoft Power BI - Microsoft Ignite Power BI is Microsoft's enterprise BI Platform that enables you to build comprehensive, enterprise-scale analytic solutions that deliver actionable insights. This session will dive into the latest

ArcWaterCash 2019/12/06

PowerBI

リンク

log4netでApplication Insightsにログを出力する方法 - nori-techの日記

目次目次はじめに Visual StudionのNugetで必要なライブラリをインストール log4netをインストール Application Insightsをインストール log4net用のAppenderをインストールコンソールアプリでログ出力ログ出力結果補足はじめに忘れないようにメモとして残しておきます。 .Net FrameworkのConsoleアプリを対象としています。 Visual StudionのNugetで必要なライブラリをインストール log4netをインストール www.nuget.org Application Insightsをインストール www.nuget.org ローカルにApplicationInsights.configが生成されるので、InstrumentationKeyタグを追加する。またApplicationInsights.c

ArcWaterCash 2019/12/06

azure

リンク

Kaggle Kernels ノートブックで BigQuery データを分析 | Google Cloud 公式ブログ

Google Cloud のエンタープライズ向けクラウドデータウェアハウスである BigQueryに Kaggle が統合されました。BigQuery をご利用のお客様は、超高速の SQL クエリを実行し、SQL で機械学習モデルをトレーニングし、Kernels でそのモデルを分析できるようになります。Kernels とは、無料で使える Kaggle のホステッド Jupyter ノートブック環境です。 BigQuery と Kaggle Kernels を一緒に使うことで、直感的に扱える開発環境を使用して BigQuery データにクエリを実行し、データの移動やダウンロードなしで機械学習を行えます。Kernels ノートブックまたはスクリプトに Google Cloud アカウントをリンクすると、BigQuery API Client ライブラリを使ってノートブックで直接クエリを組み

ArcWaterCash 2019/12/04

kaggle

リンク

機械学習モデルのBlendingに対する重みの最適化手法について - ysaz (ImanazaS) blog

アンサンブル学習 Blendingに対する重みの最適化事例様々な最適化手法まとめ Kaggleなどの機械学習コンペにおいて、複数のモデルを平均等により組み合わせることで、新たな推論結果を作る手法（blendingと呼ばれる）があります。平均を取る際にモデルの重み付けを行いますが、均等に振られることもあれば、軽重をつけることもあります。（例えばモデルが２つであれば、前者は0.5ずつ、後者は0.7と0.3、といった具合です）ここでは、複数のモデルに対する最適な重みを探す手法について、SciPyのminimize関数を使った例を取り上げたいと思います。アンサンブル学習 Blendingはアンサンブル学習の一つであり、モデルがN個あれば、0〜１の値を持つN個の重みを各モデルの予測結果に掛け合わせて、最終的な予測結果を得ます。アンサンブル学習には他にも、平均以外に多数決といった簡単な手

ArcWaterCash 2019/12/03

最適化

リンク

ベイズ最適化シリーズ（2）　－アンサンブル学習（Voting）の最適化－ - Qiita

前回は、ベイズ最適化の可視化を行いました。今回は、アンサンブル学習（Voting）にベイズ最適化を適用します。 Votingとはアンサンブル学習といえばStackingが有名ですが、Votingは各分類器で多数決をとって決める手法です。詳しくは参考資料のリンクを見て下さい。図にすると以下のようになります。ここでは、K近傍法、XGBoost、ランダムフォレスト、ニューラルネットの4つを使っています。予測ラベルの決定は単純な多数決ではなく、それぞれの分類器に重み係数kを掛けて投票させます。この重み係数をベイズ最適化で求めるのが、本稿のテーマです。式にすると、以下のようになります。ここでは、K近傍法の係数を1に固定しています。重み付きの投票で一番多かった投票がラベルとして出力されます。分類精度が最も高くなるように、k1,k2,k3をベイズ最適化で求めます。各分類器の用意

ArcWaterCash 2019/12/03

最適化

リンク

Probability calibration - Qiita

ArcWaterCash 2019/11/23

機械学習

リンク

WindowsでFTPサーバー構築 - Qiita

はじめに今回は、Windows10においてSSLなしのFTPサーバーの構築手順を紹介します。環境 Windows10 Pro 手順 FTPサーバー機能有効化 Windows10は標準でFTPサーバー機能を備えていますが、デフォルトでは無効になっています。したがって、まずは有効化します。コントロールパネル　→　プログラム　→　Windowsの機能の有効化または無効化 FTPユーザー作成コントロールパネル　→　システムとセキュリティ　→　管理ツール　→　コンピューターの管理「ユーザー」→「新しいユーザー（M）」「ユーザー名（U）」、「パスワード（P）」、「パスワードの確認入力（C）」を入力「ユーザーは次回ログオン時にパスワードの変更が必要（M）」のチェックを外し作成 FTPサイトの作成 FTPサイトの追加コントロールパネル　→　システムとセキュリティ　→　管理ツール　→　コンピ

ArcWaterCash 2019/11/05

windows

リンク

螺旋本をPythonで解く Part1 - 学習する天然ニューラルネット

はじめに 2章アルゴリズムと計算量 P46 ALDS1_1_D: Maximum Profit 3章初等的整列 4章データ構造 P82 ALDS1_3_A: Stack P87 ALDS1_3_B: Queue P95 ALDS1_3_C: Doubly Linked List P114 ALDS1_3_D: Areas on the Cross-Section Diagram 5章探索 P119 ALDS1_4_A: Linear Search P122 ALDS1_4_B: Binary Search P127 ALDS1_4_C: Dictionary P136 ALDs1_4_D: Allocation 6章再帰・分割統治法 P142 ALDS1_5_A: Exhaustive Search P146 ALDS1_5_C: Koch Curve 7章高等的整列 P152

ArcWaterCash 2019/11/03

プログラミング

リンク

GitHub - ghmagazine/kagglebook

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

ArcWaterCash 2019/10/30

kaggle

リンク

ネマタの戦術本レビュー第145回「天才雀士3人に麻雀のことを聞いたらバカ勝ちできた。著：ASAPIN その5」

テーマ5「手出しツモ切りをどのくらい見るか」前回、「特定の牌を持っている」という読みは、「特定の牌を持っていない」ことを読むより難しいと申しましたが、待ち読みについても同じことが言えます。確かに当たり牌を読むことができれば、当たらない牌が分かっているだけよりずっと有利に対局を進めることができますが、よほど限定的な情報が無ければ、当たり牌を一点に絞ることはできません。従来の麻雀観で待ち読みが重視されてきた理由と、その読みが多くの場合あてにならないことが判明してきた経緯をうかがい知ることができます。とは言っても、手出しとツモ切りの区別をつけて河を見ることで、一点とはいかなくても待ちをある程度絞ることが可能になり、押し引き判断に利用することができる場合もあります。本書でも言及されている、「逆切り」と、「面子候補落とし」。その中でも鳴き手に対しては手出しツモ切りを確認しておきたいところです。

ArcWaterCash 2019/10/22

麻雀

リンク

xgboostのコードリーディング - threecourse’s blog

xgboostでどのような処理が行われているのかを、メモの意味でまとめてみました。たぶん続きます。なお、あくまで私の理解であり、正確性の保証は無いのでご注意下さい。ソースコードは以下を参照しています。 https://github.com/dmlc/xgboost (release_0.90を参照) 前提以下の前提とする: ブースター(booster)はgbtree 決定木のアルゴリズム（tree_method）はexact カスタム目的関数を使わない GPUの使用、マシン並列を行わない xgboostでは、tree_methodオプションで決定木を作成するアルゴリズムを選択できる。デフォルトではデータ数が一定未満の場合にはexact、それ以上であればapproxが適用される。 (4UL << 20UL = 4194304件が境目、GBTree::PerformTreeMethod

ArcWaterCash 2019/10/21

機械学習

リンク

Torchvision Semantic Segmentation - Pytorch For Beginners

1. What is Semantic Segmentation? Semantic Segmentation is an image analysis procedure in which we classify each pixel in the image into a class. This is similar to what humans do all the time by default. Whenever we look at something, we try to “segment” what portions of the image into a predefined class/label/category, subconsciously. Essentially, Semantic Segmentation is the technique through w

ArcWaterCash 2019/10/14

pytorch

リンク

【Python】画像データ拡張ライブラリAlbumentationsを使ってみる - 旅行好きなソフトエンジニアの備忘録

PyTorch版のYOLO v3を作っている人がいたので試してみようと思っています。 github.com ただ、Trainにデータ拡張が入っていないのでデータ拡張ロジックを追加したいと思ったところ、 Albumentationsというライブラリを見つけました。 github.com 物体検出やセグメンテーションにも利用可能そうなので早速試してみました。使い方は以下を実施すれば良さげです。 Composeを作って、Composeの中に実施したいデータ拡張を記述 Composeに画像、ラベル、クラスIDを含むディクショナリを投入以下はComposeを作るコードになります。 from albumentations import Compose from albumentations.augmentations.transf orms import Resize, HorizontalFlip