タグ

2016年2月16日のブックマーク (6件)

  • MOBIファイルの容量を(半分くらいに)減らす : 電子書籍とアレと俺の日常

    いやいや、それにはコンセプトも理由もありますし、ChainLPは断然素晴らしいソフトである事には違いあません。 それならばMOBIファイルをなんとかしよう、というのが今回の目的です。 今回使用するツールはmobi unpackというツールなのですが、これはPython(パイソン)というプログラム言語上で動作するスクリプトファイルです。 という事で、まずはPythonをスンストールします。 http://www.python.org/download/ 最新版は3.xですが、今回は2.x系をダウンロードします。最新は2.7.3だと思います。自分のOSにあったものをダウンロード&インストールしてください。 次にmobi unpackをダウンロードします。 http://www.mobileread.com/forums/showthread.php?t=61986 .appが付いているのがMa

    kimutansk
    kimutansk 2016/02/16
    Kindle Previewerで作成したmobiファイルも容量は半分位になりましたね・・・ただ、使えるのは出力されたmobiファイルの方でしたが。多少事情が違う?
  • 分散プログラミングモデルおよびデザインパターンの考察

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog 写真:アフロ データ&サイエンスソリューション統括部、データインフラ部、今野です。 早速ですが、今月開催の「Developers Summit 2016 (以下、デブサミ2016)」で当方が登壇する運びとなりました。気がつけば、前回の記事「分散システム処理モデルに関する動向について」から随分と日がたってしまいましたので、今回は、より広範囲な内容を整理してみたいと思います。 デブサミ2016の当方の講演テーマは「温故知新」です。今回は、このテーマにもつながる話題として、クラウド環境の代表的な分散プログラミングモデルやデザインパターンについて、一般的な考察をしてみたいと思います。 古典的なプログラミングモデルによる分類 まず最初に

    分散プログラミングモデルおよびデザインパターンの考察
    kimutansk
    kimutansk 2016/02/16
    懐かしい分類図。ただAkkaは開発者側が「Toolbox」と言い切ってますし、DesignPatternも5パターン実現可能なので含めるのは不適切な気も。
  • Hiveを高速化するLLAP

    Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ / Hadoop / Spark Conference Japan 2019 講演者: 関山 宜孝 (Amazon Web Services Japan) 昨今 Hadoop/Spark エコシステムで広く使われているクラウドストレージ。講演では Amazon S3 を例に、Hadoop/Spark から見た S3 の動作や HDFS と S3 の使い分けをご説明します。また、AWS サポートに寄せられた多くのお問い合わせから得られた知見をもとに、Hadoop/Spark で S3 を最大限活用するベストプラクティス、パフォーマンスチューニング、よくあるハマりどころ、トラブルシューティング方法などをご紹介します。併せて、Hadoop/Spark に関係する S3 のサービスアップデート、S3 関連の Hadoop

    Hiveを高速化するLLAP
    kimutansk
    kimutansk 2016/02/16
    汎用コンテナをDaemon化してなんにでも使いまわせるのか、それともTask毎にコンテナを用意するのでレスポンス早くてもリソース使い切るは出来なくなるのか。
  • 1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話

    Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ / Hadoop / Spark Conference Japan 2019 講演者: 関山 宜孝 (Amazon Web Services Japan) 昨今 Hadoop/Spark エコシステムで広く使われているクラウドストレージ。講演では Amazon S3 を例に、Hadoop/Spark から見た S3 の動作や HDFS と S3 の使い分けをご説明します。また、AWS サポートに寄せられた多くのお問い合わせから得られた知見をもとに、Hadoop/Spark で S3 を最大限活用するベストプラクティス、パフォーマンスチューニング、よくあるハマりどころ、トラブルシューティング方法などをご紹介します。併せて、Hadoop/Spark に関係する S3 のサービスアップデート、S3 関連の Hadoop

    1000台規模のHadoopクラスタをHive/Tezアプリケーションにあわせてパフォーマンスチューニングした話
    kimutansk
    kimutansk 2016/02/16
    #rhcj2016 サーバ台数、実行ジョブの数ともにスケールはすごい。1週間で7000>100000クエリ/時間、こうまで何とかなるものなんですね。
  • GradleでMaven Centralにライブラリを公開する - たごもりすメモ

    前にこんなエントリを書いたが、このときはmavenから実行してた。今回はgradleから。参考にしたエントリはいくつかあったけど、ずばりというのがなくてつらかった。あれこれ試して組み合わせた。 はじめてのmaven central 公開 - たごもりすメモ あとMaven Central(というかSonaType OSS)もちょっと変わってるのでそのへんも。なお環境は適当なMacに適当にgradleを入れた。以上。 前と変わらないところ GPGのセットアップ パッケージ名前空間を決める アカウント登録 パッケージ名前空間は今回は前のと違ったので、申請は今回もやった。前と同じようにやってさくっと完了。 gradle環境の設定 "$HOME/.gradle/gradle.properties" に行う。 org.gradle.daemon=true signing.keyId=DEADBEEF

    kimutansk
    kimutansk 2016/02/16
    Maven、sbtは見たことありますが意外にGradleはそのまま使えるのはなかったかも。
  • Evolution of the Netflix Data Pipeline

    Our new Keystone data pipeline went live in December of 2015. In this article, we talk about the evolution of Netflix’s data pipeline over the years. This is the first of a series of articles about the new Keystone data pipeline. Netflix is a data-driven company. Many business and product decisions are based on insights derived from data analysis. The charter of the data pipeline is to collect, ag

    Evolution of the Netflix Data Pipeline
    kimutansk
    kimutansk 2016/02/16
    途中からリアルタイム要素に応じてKafkaが加わり、その後Kafkaがfrontをはるようになったと。Routing部はSamzaなんですね。ピークは秒間800万イベント&24Gのデータと。