mstk_knifeのブックマーク - はてなブックマーク

Python: データパイプライン構築用フレームワーク Luigi を使ってみる - CUBE SUGAR CONTAINER

最近になって、バッチ処理においてデータパイプラインを組むためのフレームワークとして Luigi というものがあることを知った。これは、Spotify という音楽のストリーミングサービスを提供する会社が作ったものらしい。似たような OSS としては他にも Apache Airflow がある。こちらは民宿サービスを提供する Airbnb が作ったものだけど、最近 Apache に寄贈されてインキュベータープロジェクトとなった。 Luigi の特徴としては、バッチ処理に特化している点が挙げられる。ただし、定期的にバッチ処理を実行するような機能はない。そこは、代わりに cron や systemd timer を使ってやる必要がある。また、本体もそうだけどデータパイプラインについても Python を使って書く必要がある。今回は、そんな Luigi を一通り触ってみることにする。

mstk_knife 2017/05/15

リンク

MariaDB Galera Cluster - Known Limitations について調べた - CUBE SUGAR CONTAINER

MariaDB Galera Cluster は MariaDB を同期レプリケーション型のマルチマスタ構成で冗長化するためのアプリケーションだ。マスタ・スレーブ構成のようにフォールバック用のスクリプトを自分で用意する必要もないし、マルチマスタ構成なのでクラスタを構成するノードは全て書き込みできる (ただし、全てのノードに書き込みをロードバランスさせるとデッドロックの可能性が増える)。 MySQL Cluster のようにトランザクション分離レベルが落ちることもない。障害が発生してもクラスタを構成する半分のノードの故障までなら耐えられるし、障害の復旧後は自動で正常なノードとの同期が走るようになっている。一見すると良いところしかないように思える Galera Cluster だけど、メリットがあればもちろんデメリットもある。 MariaDB Galera Cluster の既知の制限

mstk_knife 2017/04/20

リンク

フレッツ回線が遅すぎる問題を IPv6/IPoE と DS-Lite で解決した - CUBE SUGAR CONTAINER

最近というほど最近でもないんだけど、近頃はとにかくフレッツ回線のスループットが出ない。下手をすると、モバイルネットワークの方が速いので時間帯によってはテザリングをし始めるような始末だった。今回は、そんなスループットの出ないフレッツ回線を何とか使い物になるようにするまでの流れを書いてみる。先に断っておくと、今回はいつものような特定の技術に関する解説という側面は強くない。思考の過程なども含んでいるので、いつもより読み物的な感じになっていると思う。調べ物をして、それらについて理解した内容のまとめになっている。結論から書いてしまうと、今回のケースでは IPv6/IPoE 接続と DS-Lite を使って何とかなった。 DS-Lite というのはゲーム端末ではなくて IPv4/IPv6 共存技術の一つである RFC6333 (Dual-Stack Lite Broadband Deplo

mstk_knife 2017/04/09

リンク

Python: ソケットプログラミングのアーキテクチャパターン - CUBE SUGAR CONTAINER

今回はソケットプログラミングについて。ソケットというのは Unix 系のシステムでネットワークを扱うとしたら、ほぼ必ずといっていいほど使われているもの。ホスト間の通信やホスト内での IPC など、ネットワークを抽象化したインターフェースになっている。そんな幅広く使われているソケットだけど、取り扱うときには色々なアーキテクチャパターンが考えられる。また、比較的低レイヤーな部分なので、効率的に扱うためにはシステムコールなどの、割りと OS レベルに近い知識も必要になってくる。ここらへんの話は、体系的に語られているドキュメントが少ないし、あっても鈍器のような本だったりする。そこで、今回はそれらについてざっくりと見ていくことにした。尚、今回はプログラミング言語として Python を使うけど、何もこれは特定の言語に限った話ではない。どんな言語を使うにしても、あるいは表面上は抽象化さ

mstk_knife 2017/03/29

リンク

Python: Pykka でアクターモデルについて学ぶ - CUBE SUGAR CONTAINER

アクターモデルというのは、並行処理のプログラミングモデルの一つだ。並行処理という言葉からは、まずマルチスレッドとかをイメージすると思うけど、それよりも抽象度の高い概念となっている。つまり、アクターモデルというのはマルチスレッドなどを用いて構築することになる。どちらかといえばプロセス間通信 (IPC) の技法であって、共有メモリやロック、RPC と比較するものかもしれない。そんなアクターモデルは、概念とか使ったときの嬉しさを理解・実感するのがなかなか難しいモデルだとも思う。理由としては、使い始めるまでに必要なコード量が多かったり、それなりの規模のアプリケーションで使わないとメリットが分かりづらい点が挙げられる。ただ、これはあくまで主観的なものだけど、アクターモデルをベースに組まれたアプリケーションは規模が大きくなっても並行処理をしているコードが読みやすい。共有メモリやロックを使

mstk_knife 2017/03/14

リンク

Python: python-fire の CLI 自動生成を試す - CUBE SUGAR CONTAINER

今回は Google が公開した python-fire というパッケージを試してみた。 python-fire では、クラスやモジュールを渡すことで、定義されている関数やメソッドを元に CLI を自動で生成してくれる。ただし、一つ注意すべきなのは、できあがる CLI はそこまで親切な作りではない、という点だ。実際にユーザに提供するような CLI を実装するときは、従来通り Click のようなフレームワークを使うことになるだろう。では python-fire はどういったときに活躍するかというと、これは開発時のテストだと思う。実装した内容をトライアンドエラーするための CLI という用途であれば python-fire は非常に強力なパッケージだと感じた。今回使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion:

mstk_knife 2017/03/08

あとで読む

リンク

Python: Keras/TensorFlow の学習を GPU で高速化する (Mac OS X) - CUBE SUGAR CONTAINER

Keras というのは Python を使ってニューラルネットワークを組むためのフレームワーク。 Python でニューラルネットワークのフレームワークというと、他にも TensorFlow とか Chainer なんかが有名どころ。 Keras はそれらに比べると、より高い抽象度の API を提供しているところが特徴みたい。実のところ Keras はデフォルトで TensorFlow をバックエンドとして動作する。バックエンドとしては、他にも Theano が選べるらしい。今回は Keras で組んだニューラルネットワークを GPU で学習させてみることにした。そのとき CPU と比べて、どれくらい速くなるかを試してみたい。使った環境は次の通り。 $ sw_vers ProductName: Mac OS X ProductVersion: 10.12.3 BuildVersi

mstk_knife 2017/02/26

リンク

Ansible: Dynamic Inventory を使ってみる - CUBE SUGAR CONTAINER

通常の Inventory は ini 形式を拡張したテキストファイルで、中には Ansible で管理したいホストと変数の情報が書き込まれている。しかし、これだとホストの台数や名前などが動的に変化するシチュエーションでメンテナンスが難しい。あとは、ホストの情報が別の場所で管理されているパターンも二重管理になる可能性がある。そうした場合には Dynamic Inventory という機能を使って動的に Inventory を生成するやり方があるようだ。 Ansible をインストールする検証用の環境には CentOS7 を使った。 $ cat /etc/redhat-release CentOS Linux release 7.1.1503 (Core) $ uname -r 3.10.0-229.11.1.el7.x86_64 EPEL 経由で Ansible をインストールする

mstk_knife 2016/09/11

リンク

MariaDB Galera Cluster を CentOS7 で使ってみる - CUBE SUGAR CONTAINER

MySQL (MariaDB) の冗長化には Master-Slave 構成を組んだり MySQL Cluster を使ったりと色々ある。その中で Galera Cluster は同期レプリケーションを用いたマルチマスタ型のクラスタが組むやり方だ。今回はこの MariaDB Galera Cluster を CentOS7 で組んでみることにする。尚、Galera Cluster でクラスタを組むには最小構成でノードが 3 台必要となる。また、各ノード間でレプリケーションのために IP の疎通が必要だ。今回は各ノードに 192.168.33.0/24 のネットワークから .11 .12 .13 を付与する。尚、今回はタイトルにある通り CentOS7 を使用する。 $ cat /etc/redhat-release CentOS Linux release 7.1.1503 (

mstk_knife 2016/05/24

リンク

「スマートPythonプログラミング」という本を書きました - CUBE SUGAR CONTAINER

表題の通り Python の本を書いたので、そのご紹介です！スマートPythonプログラミング: Pythonのより良い書き方を学ぶ作者: もみじあめ発売日: 2016/03/12メディア: Kindle版この商品を含むブログ (1件) を見るどんな本なの？ひと言で表すと、自信を持って Python を書けるようになるための本です。スマートPythonプログラミングなので、略してスマパイって呼んでください。こんな人におすすめなんとなく書いてなんとなく動いているコードに不安を覚えている方入門書は読み終わったけど次に何をして良いか分からない方 Python の初心者から中級者にステップアップしたい方ベストプラクティスとかアンチパターンって言葉が好きな方上記に当てはまる方には、本書が少しでも参考になると思います。どんなことが書いてあるの？自分が Python を学び始めた

mstk_knife 2016/03/14

リンク

Python のバージョン毎の違いとその吸収方法について - CUBE SUGAR CONTAINER

この記事の目指すところ現在 Python はバージョン 2.x 系と 3.x 系という、一部に互換性のないふたつのメジャーバージョンが併用されている。その上で、この記事にはふたつの目的がある。ひとつ目は、2.x 系と 3.x 系の違いについてまとめること。現状、それぞれのバージョン毎の違いはまとまっているところが少ない。自分用に、このページだけ見ればひと通り分かる！っていうものがほしかった。ふたつ目は、2.x 系と 3.x 系の違いを吸収するソースコードの書き方についてまとめること。こちらも Web 上にナレッジがあまりまとまっていない。これについては今 python-future というパッケージがアツい。尚、サポートするバージョンは以下の通り。 2.x 系: 2.6 と 2.7 3.x 系: 3.3 と 3.4 本題に入る前に、最近の Python 事情についてまとめ

mstk_knife 2015/09/07

あとで読む

リンク

はてなブックマーク

タグ

ブックマーク / blog.amedama.jp (31)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第2週）

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス