kimutanskのブックマーク / 2016年2月16日

kimutansk id:kimutansk

2016年2月16日のブックマーク (6件)

MOBIファイルの容量を(半分くらいに)減らす : 電子書籍とアレと俺の日常
いやいや、それにはコンセプトも理由もありますし、Chai nLPは断然素晴らしいソフトである事には違いあません。それならばMOBIファイルをなんとかしよう、というのが今回の目的です。今回使用するツールはmobi unpackというツールなのですが、これはPython(パイソン)というプログラム言語上で動作するスクリプトファイルです。という事で、まずはPythonをスンストールします。 http://www.python.org/download/ 最新版は3.xですが、今回は2.x系をダウンロードします。最新は2.7.3だと思います。自分のOSにあったものをダウンロード＆インストールしてください。次にmobi unpackをダウンロードします。 http://www.mobileread.com/forums/showthread.php?t=61986 .appが付いているのがMa
kimutansk 2016/02/16
Kindle Previewerで作成したmobiファイルも容量は半分位になりましたね・・・ただ、使えるのは出力されたmobiファイルの方でしたが。多少事情が違う？

Kindle

mobi
リンク
分散プログラミングモデルおよびデザインパターンの考察
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog 写真：アフロデータ＆サイエンスソリューション統括本部、データインフラ本部、今野です。早速ですが、今月開催の「Developers Summit 2016 （以下、デブサミ2016）」で当方が登壇する運びとなりました。気がつけば、前回の記事「分散システム処理モデルに関する動向について」から随分と日がたってしまいましたので、今回は、より広範囲な内容を整理してみたいと思います。デブサミ2016の当方の講演テーマは「温故知新」です。今回は、このテーマにもつながる話題として、クラウド環境の代表的な分散プログラミングモデルやデザインパターンについて、一般的な考察をしてみたいと思います。古典的なプログラミングモデルによる分類まず最初に
kimutansk 2016/02/16
懐かしい分類図。ただAkkaは開発者側が「Toolbox」と言い切ってますし、DesignPatternも5パターン実現可能なので含めるのは不適切な気も。

distributed
リンク
Hiveを高速化するLLAP
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ / Hadoop / Spark Conference Japan 2019 講演者：関山宜孝（Amazon Web Services Japan）昨今 Hadoop/Spark エコシステムで広く使われているクラウドストレージ。本講演では Amazon S3 を例に、Hadoop/Spark から見た S3 の動作や HDFS と S3 の使い分けをご説明します。また、AWS サポートに寄せられた多くのお問い合わせから得られた知見をもとに、Hadoop/Spark で S3 を最大限活用するベストプラクティス、パフォーマンスチューニング、よくあるハマりどころ、トラブルシューティング方法などをご紹介します。併せて、Hadoop/Spark に関係する S3 のサービスアップデート、S3 関連の Hadoop
kimutansk 2016/02/16
汎用コンテナをDaemon化してなんにでも使いまわせるのか、それともTask毎にコンテナを用意するのでレスポンス早くてもリソース使い切るは出来なくなるのか。

Hive

Spark

hadoop
リンク
1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ / Hadoop / Spark Conference Japan 2019 講演者：関山宜孝（Amazon Web Services Japan）昨今 Hadoop/Spark エコシステムで広く使われているクラウドストレージ。本講演では Amazon S3 を例に、Hadoop/Spark から見た S3 の動作や HDFS と S3 の使い分けをご説明します。また、AWS サポートに寄せられた多くのお問い合わせから得られた知見をもとに、Hadoop/Spark で S3 を最大限活用するベストプラクティス、パフォーマンスチューニング、よくあるハマりどころ、トラブルシューティング方法などをご紹介します。併せて、Hadoop/Spark に関係する S3 のサービスアップデート、S3 関連の Hadoop
kimutansk 2016/02/16
#rhcj2016 サーバ台数、実行ジョブの数ともにスケールはすごい。1週間で7000＞100000クエリ／時間、こうまで何とかなるものなんですね。
リンク
GradleでMaven Centralにライブラリを公開する - たごもりすメモ
前にこんなエントリを書いたが、このときはmavenから実行してた。今回はgradleから。参考にしたエントリはいくつかあったけど、ずばりというのがなくてつらかった。あれこれ試して組み合わせた。はじめてのmaven central 公開 - たごもりすメモあとMaven Central(というかSonaType OSS)もちょっと変わってるのでそのへんも。なお環境は適当なMacに適当にgradleを入れた。以上。前と変わらないところ GPGのセットアップパッケージ名前空間を決めるアカウント登録パッケージ名前空間は今回は前のと違ったので、申請は今回もやった。前と同じようにやってさくっと完了。 gradle環境の設定 "$HOME/.gradle/gradle.properties" に行う。 org.gradle.daemon=true signing.keyId=DEADBEEF
kimutansk 2016/02/16
Maven、sbtは見たことありますが意外にGradleはそのまま使えるのはなかったかも。

gradle

Maven
リンク
Evolution of the Netflix Data Pipeline
Our new Keystone data pipeline went live in December of 2015. In this article, we talk about the evolution of Netflix’s data pipeline over the years. This is the first of a series of articles about the new Keystone data pipeline. Netflix is a data-driven company. Many business and product decisions are based on insights derived from data analysis. The charter of the data pipeline is to collect, ag
kimutansk 2016/02/16
途中からリアルタイム要素に応じてKafkaが加わり、その後Kafkaがfrontをはるようになったと。Routing部はSamzaなんですね。ピークは秒間800万イベント＆24Gのデータと。

Netflix

kafka
リンク
- 2016年2月17日
- 2016年2月16日
- 2016年2月15日