ブックマーク / qiita.com/koduki (2)

  • Apache Sparkでバイナリ固定長ファイルを読み込む - Qiita

    SparkはテキストファイルやJSON, CSVなど様々な形式のファイルを読み込むことができます。 HDFSから読み込んで、そのままRDDに変換されるので難しいこと考えずに、取り合え使えてとても便利です。 ただ、業務アプリを書いてると独自フォーマットのバイナリデータとか普通にあります。初めてのSparkを読むとSparkContext#newAPiHadoopFileやSparkContext#hadoopFile使えばできるよ! って書いてあるんですが、使い方がさっぱり記載されてません... Spark使ってる人はHadoopを通過してるからその辺の説明は不要なのか、単にニーズの問題か、私のグーグル力の無さか、いずれか分かりませんが、やり方と振る舞いを把握するのに結構時間がかかってしまいました。なので、備忘として現状の理解を残しておこうと思います。 以前、ミーハーに買ってみたけど、実は特

    Apache Sparkでバイナリ固定長ファイルを読み込む - Qiita
    nishitki
    nishitki 2016/12/13
  • Consulを使ってDockerの名前解決を簡単に実現する - Qiita

    Dockerでサービス群をまとめて立ち上げる時はIPは毎回変わっちゃうので、名前解決が重要になるわけですが、これが結構面倒。 元々、figを使ってたので、linksに書いてればその名前でhost名を書き換えてくれてたので重宝してたんですが、これ起動順も制御してるっぽいので、双方向通信にすると循環参照でエラーに成って起動しません>< なので、手軽にやる方法を色々調べてみたのですが、Consulを使うのが簡単そうなので、そちらを試してみました。 追記: CentOS7で動かす環境も作ってみたので、読むのメンドいから、取りあえず動かしたいって人はこっちをどうぞ。 Consulって何? まず、そもそもConsulって何? ってとこなのですが、 Service Discovery Health Check Key/Value Store を提供してくれるオーケストラレーションの一種です。私もまだしっ

    Consulを使ってDockerの名前解決を簡単に実現する - Qiita
    nishitki
    nishitki 2014/12/06
  • 1