hiroomiのブックマーク - はてなブックマーク

リモートサーバの Jupyter Notebook を SSH Port Forwarding 経由で使う - CUBE SUGAR CONTAINER

一般的に Jupyter Notebook はローカルの環境にインストールして使うことが多い。ただ、ローカルの環境は計算資源が乏しい場合もある。そんなときは IaaS などリモートにあるサーバで Jupyter Notebook を使いたい場面が存在する。ただ、セキュリティのことを考えると Jupyter Notebook の Web UI をインターネットに晒したくはない。そこで、今回は SSH Port Forwarding を使って Web UI をインターネットに晒すことなく使う方法について書く。このやり方ならリモートサーバに SSH でログインしたユーザだけが Jupyter Notebook を使えるようになる。また、Web UI との通信も SSH 経由になるので HTTP over SSL/TLS (HTTPS) を使わなくても盗聴のリスクを下げられる。リモー

hiroomi 2021/07/31

リンク

Python: Streamlit を使って手早く WebUI 付きのプロトタイプを作る - CUBE SUGAR CONTAINER

Streamlit は、ざっくり言うと主にデータサイエンス領域において WebUI 付きのアプリケーションを手早く作るためのソフトウェア。使い所としては、ひとまず動くものを見せたかったり、少人数で試しに使うレベルのプロトタイプを作るフェーズに適していると思う。たとえば、Jupyter で提供すると複数人で使うのに難があるし、かといって Flask や Django を使って真面目に作るほどではない、くらいのとき。使った環境は次のとおり。 $ sw_vers ProductName: macOS ProductVersion: 11.3.1 BuildVersion: 20E241 $ python -V Python 3.8.9 もくじもくじ下準備基本的な使い方基本的な書式プレースホルダープログレスバーを使った処理の進捗の可視化基本的な可視化組み込みのグラフ描画機能

hiroomi 2021/07/07

リンク

Python: 時系列データの交差検証と TimeSeriesSplit の改良について - CUBE SUGAR CONTAINER

一般的に、時系列データを扱うタスクでは過去のデータを使って未来のデータを予測することになる。そのため、交差検証するときも過去のデータを使ってモデルを学習させた上で未来のデータを使って検証しなければいけない。もし、未来のデータがモデルの学習データに混入すると、本来は利用できないデータにもとづいた楽観的な予測が得られてしまう。今回は、そんな時系列データの交差検証と scikit-learn の TimeSeriesSplit の改良について書いてみる。使った環境は次のとおり。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.14.6 BuildVersion: 18G3020 $ python -V Python 3.8.1 下準備あらかじめ、必要なパッケージをインストールしておく。 $ pip install scikit-le

hiroomi 2021/05/10

python

リンク

Python: 機械学習における不均衡データの問題点と対処法について - CUBE SUGAR CONTAINER

機械学習における分類問題では、扱うデータセットに含まれるラベルに偏りのあるケースがある。これは、例えば異常検知の分野では特に顕著で、異常なデータというのは正常なデータに比べると極端に数が少ない。正常なデータが 99.99% なのに対し異常なデータは 0.01% なんてこともある。このようなデータセットは不均衡データ (Imbalanced data) といって機械学習で扱う上で注意を要する。今回は、不均衡データを扱う上での問題点と、その対処法について見てみる。なお、登場する分類問題の評価指標については、以前このブログで扱ったことがあるのでそちらを参照のこと。 blog.amedama.jp 使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.14.2 BuildVersion: 18C54 $ python

hiroomi 2018/12/17

リンク

Python: Selenium + Headless Chrome で Web ページ全体のスクリーンショットを撮る - CUBE SUGAR CONTAINER

スクレイピングした Web サイトからページ全体のスクリーンショットを撮影したい機会があった。そこで Selenium の Python バインディングと Headless Chrome を使ったところ実現できたのでメモしておく。ちなみに、ページ全体でなければ Headless Chrome 単体でも撮れる。その方法についても末尾に補足として記載しておいた。使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.13.5 BuildVersion: 17F77 $ python -V Python 3.6.5 $ pip list --format=columns | grep -i selenium selenium 3.13.0 $ chromedriver --version ChromeDriver 2.

hiroomi 2018/07/28

リンク

macOS で Git LFS (Large File Storage) を使ってみる - CUBE SUGAR CONTAINER

元々 Git というバージョン管理システムは、その性質として大きなファイルやバイナリファイルを扱うのが苦手だった。そんな欠点を補うために GitHub が開発したのが今回扱う Git LFS (Large File Storage) という拡張機能 (仕様) になる。 git-lfs.github.com これは、大きなファイルやバイナリファイルの実体を Git リポジトリではなく HTTPS サーバで保持することで実現している。 Git リポジトリでは、ファイルを本体の代わりにメタ情報を含むテキストファイルの形で管理することになる。これらの仕様 (プロトコル) は公開されているため GitHub 以外の Git ホスティング事業者でも Git LFS を実装できる。 github.com 例えば現在では Bitbucket Cloud でも次のように Git LFS に対応している。

hiroomi 2018/05/09

コミットログに"Why"、「なぜその変更をするのか」を残すにはちょうど良いと。/ごめんなさい。記事とは直接関係ないです。

リンク

まっさらな状態から Docker イメージを作る - CUBE SUGAR CONTAINER

Docker イメージというと、一般的には既存の Docker イメージをベースにして作る機会が多い。そうしたとき Dockerfile にはベースとなるイメージを FROM 命令で指定する。とはいえ、既存のイメージをベースにしない、まっさらな状態からイメージを作ることもできる。それが FROM 命令に scratch を指定した場合になる。今回は FROM scratch でまっさらな状態から Docker イメージを作ってみることにする。試した環境は次の通り。 $ docker version Client: Version: 18.01.0-ce API version: 1.35 Go version: go1.9.2 Git commit: 03596f5 Built: unknown-buildtime OS/Arch: darwin/amd64 Experiment

hiroomi 2018/02/09

リンク

Python: memory_profiler でプログラムのメモリ使用量を調べる - CUBE SUGAR CONTAINER

今回は memory_profiler というモジュールを使ってプログラムのメモリ使用量を調べる方法について紹介する。 pypi.python.org このブログでは、以前に Python のプロファイラとして profile/cProfile や line_profiler について書いたことがある。これまでに紹介したこれらのプロファイラは、主に時間計算量の調査が目的となる。それに対して memory_profiler では、調べる対象は空間計算量となる。 blog.amedama.jp blog.amedama.jp 使った環境は以下の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.6 BuildVersion: 16G1212 $ python --version Python 3.6.4 下準備まずは mem

hiroomi 2018/02/05

Python

リンク

Python: Keras/TensorFlow の学習を GPU で高速化する (Ubuntu 16.04 LTS) - CUBE SUGAR CONTAINER

以前、このブログで Keras/TensorFlow の学習スピードを GPU を使って速くする記事を書いた。ただし、このとき使った OS は Mac OS X (macOS Sierra) だった。 blog.amedama.jp とはいえ NVIDIA の dGPU を積んだ Mac がどれだけあるんだというと、正直なかなか無いと思う。実際にやってみるとしたら Linux だよねということで、今回は Ubuntu 16.04 LTS を使う場合について書く。インストールの手順については次の公式ドキュメントをベースに進める。 Installing TensorFlow on Ubuntu | TensorFlow 環境について今回使った OS のバージョンなどは次の通り。 $ cat /etc/lsb-release DISTRIB_ID=Ubuntu DISTRIB_REL

hiroomi 2017/12/19

GPGPU

リンク

Python: ジェネレータをイテレータから理解する - CUBE SUGAR CONTAINER

Python のイテレータとジェネレータという概念は意外と分かりにくい。今回は、実は深い関わり合いを持った両者についてまとめてみることにする。というのも、最終的にジェネレータを理解するにはイテレータへの理解が欠かせないためだ。使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.6 BuildVersion: 16G1036 $ python --version Python 3.6.3 イテレータとはまず、そもそもイテレータとは何者だろうか。それについて、いくつかの側面から考えてみることにしよう。使い方から考える最初は、使い方という側面からイテレータとは何かを考えてみよう。このとき、答えは「要素を一つずつ取り出すことのできるオブジェクト」になる。実際に、使い方からイテレータについて見ていこう。

hiroomi 2017/11/24

リンク

Python: ソケットプログラミングのアーキテクチャパターン - CUBE SUGAR CONTAINER

今回はソケットプログラミングについて。ソケットというのは Unix 系のシステムでネットワークを扱うとしたら、ほぼ必ずといっていいほど使われているもの。ホスト間の通信やホスト内での IPC など、ネットワークを抽象化したインターフェースになっている。そんな幅広く使われているソケットだけど、取り扱うときには色々なアーキテクチャパターンが考えられる。また、比較的低レイヤーな部分なので、効率的に扱うためにはシステムコールなどの、割りと OS レベルに近い知識も必要になってくる。ここらへんの話は、体系的に語られているドキュメントが少ないし、あっても鈍器のような本だったりする。そこで、今回はそれらについてざっくりと見ていくことにした。尚、今回はプログラミング言語として Python を使うけど、何もこれは特定の言語に限った話ではない。どんな言語を使うにしても、あるいは表面上は抽象化さ

hiroomi 2017/09/04

リンク

オープンソースの脆弱性スキャナ OpenVAS を使ってみる - CUBE SUGAR CONTAINER

今回はオープンソースの脆弱性スキャナである OpenVAS を使ってみることにする。脆弱性スキャナというのは、ホストに既知の脆弱性が含まれないかどうかを自動でスキャンしてくれるツール。注意: 脆弱性スキャンはポートスキャンやペネトレーションを含むため外部のサーバには実行しないこと使った環境は次の通り。OS は Ubuntu 16.04 LTS にした。 $ lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 16.04.3 LTS Release: 16.04 Codename: xenial $ uname -r 4.4.0-89-generic セキュリティ用途だと Kali Linux を使うことも多いみたい。インストール Ubuntu で OpenVA

hiroomi 2017/08/09

リンク

sqlmap を使って SQL インジェクションの脆弱性を検証する - CUBE SUGAR CONTAINER

sql map は SQL インジェクションに特化したオープンソースのペネトレーションテストツール。これを使うと Web アプリケーションの特定のパラメータに SQL インジェクションの脆弱性があるか否かを確認しやすい。注意: 外部のサーバに使うことは攻撃となるので絶対にしないように。今回使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.6 BuildVersion: 16G29 $ sql map --version 1.1.8#stable $ python --version Python 2.7.10 インストール sql map は Homebrew でインストールできる。 $ brew install sql map これで sql map コマンドが使えるようになる。 $ sql map --vers

hiroomi 2017/08/08

リンク

ファイルから SQL を読み込む (MySQL, PostgreSQL, SQLite3) - CUBE SUGAR CONTAINER

色々な RDBMS で SQL の書かれたファイルを読み込む方法について調べた。まずはSQL の書かれたテキストファイルを用意しておく。 $ cat << 'EOF' > sample.sql DROP TABLE IF EXISTS users; CREATE TABLE users ( id integer, name varchar(255), age integer ); INSERT INTO users VALUES (1, 'Alice', 20), (2, 'Bob', 30), (3, 'Carol', 40); EOF こんな感じ。 users テーブルを作って、そこにレコードを追加している。 $ cat sample.sql DROP TABLE IF EXISTS users; CREATE TABLE users ( id integer, name varch

hiroomi 2017/06/29

リンク

Ubuntu 16.04 LTS に最新の VirtualBox をインストールする - CUBE SUGAR CONTAINER

apt-get で入る VirtualBox は古いので新しいソフトウェアと組み合わせると支障が出る場合もある。なので Oracle が公開しているリポジトリを使って最新版をインストールする方法について書いておく。インストール方法は以下の公式サイトに載っている。 Debian 系のシステムは全て同じらしい。 Linux_Downloads – Oracle VM VirtualBox 使った環境は次の通り。 $ cat /etc/lsb-release DISTRIB_ID=Ubuntu DISTRIB_RELEASE=16.04 DISTRIB_CODENAME=xenial DISTRIB_DESCRIPTION="Ubuntu 16.04.2 LTS" $ uname -r 4.4.0-79-generic まずは APT パッケージシステムのソースリストに Oracle のリポ

hiroomi 2017/06/14

リンク

フレッツ回線が遅すぎる問題を IPv6/IPoE と DS-Lite で解決した - CUBE SUGAR CONTAINER

最近というほど最近でもないんだけど、近頃はとにかくフレッツ回線のスループットが出ない。下手をすると、モバイルネットワークの方が速いので時間帯によってはテザリングをし始めるような始末だった。今回は、そんなスループットの出ないフレッツ回線を何とか使い物になるようにするまでの流れを書いてみる。先に断っておくと、今回はいつものような特定の技術に関する解説という側面は強くない。思考の過程なども含んでいるので、いつもより読み物的な感じになっていると思う。調べ物をして、それらについて理解した内容のまとめになっている。結論から書いてしまうと、今回のケースでは IPv6/IPoE 接続と DS-Lite を使って何とかなった。 DS-Lite というのはゲーム端末ではなくて IPv4/IPv6 共存技術の一つである RFC6333 (Dual-Stack Lite Broadband Deplo

hiroomi 2017/04/10

"IPoE 関連でサポートセンターの返答は間違っていることが多い"

ipv6
DS-Lite

リンク

Python: Pykka でアクターモデルについて学ぶ - CUBE SUGAR CONTAINER

アクターモデルというのは、並行処理のプログラミングモデルの一つだ。並行処理という言葉からは、まずマルチスレッドとかをイメージすると思うけど、それよりも抽象度の高い概念となっている。つまり、アクターモデルというのはマルチスレッドなどを用いて構築することになる。どちらかといえばプロセス間通信 (IPC) の技法であって、共有メモリやロック、RPC と比較するものかもしれない。そんなアクターモデルは、概念とか使ったときの嬉しさを理解・実感するのがなかなか難しいモデルだとも思う。理由としては、使い始めるまでに必要なコード量が多かったり、それなりの規模のアプリケーションで使わないとメリットが分かりづらい点が挙げられる。ただ、これはあくまで主観的なものだけど、アクターモデルをベースに組まれたアプリケーションは規模が大きくなっても並行処理をしているコードが読みやすい。共有メモリやロックを使

hiroomi 2017/03/14

リンク

Python: python-fire の CLI 自動生成を試す - CUBE SUGAR CONTAINER

今回は Google が公開した python-fire というパッケージを試してみた。 python-fire では、クラスやモジュールを渡すことで、定義されている関数やメソッドを元に CLI を自動で生成してくれる。ただし、一つ注意すべきなのは、できあがる CLI はそこまで親切な作りではない、という点だ。実際にユーザに提供するような CLI を実装するときは、従来通り Click のようなフレームワークを使うことになるだろう。では python-fire はどういったときに活躍するかというと、これは開発時のテストだと思う。実装した内容をトライアンドエラーするための CLI という用途であれば python-fire は非常に強力なパッケージだと感じた。今回使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion:

hiroomi 2017/03/07

リンク

Python: Keras/TensorFlow の学習を GPU で高速化する (Mac OS X) - CUBE SUGAR CONTAINER

Keras というのは Python を使ってニューラルネットワークを組むためのフレームワーク。 Python でニューラルネットワークのフレームワークというと、他にも TensorFlow とか Chainer なんかが有名どころ。 Keras はそれらに比べると、より高い抽象度の API を提供しているところが特徴みたい。実のところ Keras はデフォルトで TensorFlow をバックエンドとして動作する。バックエンドとしては、他にも Theano が選べるらしい。今回は Keras で組んだニューラルネットワークを GPU で学習させてみることにした。そのとき CPU と比べて、どれくらい速くなるかを試してみたい。使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.3 BuildVersi

hiroomi 2017/02/26

リンク

Python: オブジェクトを漬物 (Pickle) にする - CUBE SUGAR CONTAINER

Python の標準ライブラリにある pickle モジュールは Python のオブジェクトを直列化・非直列化するための機能を提供している。直列化 (Serialize) というのはプログラミング言語においてオブジェクトをバイト列などの表現に変換することを指す。非直列化 (Deserialize) はその逆で、バイト列を元にオブジェクトを復元することだ。バイト列などに変換されたデータはファイルなどの形で永続化できる。最近の典型的な用途でいえば、機械学習で学習済みのモデルを保存して取り回すためなんかに使われる。ところで、モジュール名でもある pickle という単語は、複数形にすると pickles つまりハンバーガーなどにはさまっているピクルスになる。きっとメモリ上にある揮発性で賞味期限の短いオブジェクトを、バイト列などの形でファイルなどに長期保存できる状態にすることをピクル

hiroomi 2016/07/25

python

リンク

はてなブックマーク

タグ

ブックマーク / blog.amedama.jp (21)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス