torazukaのブックマーク / 2014年8月5日

torazuka id:torazuka

2014年8月5日のブックマーク (5件)

理研:笹井芳樹副センター長、研究室で死亡　現場に遺書 - 毎日新聞
torazuka 2014/08/05
なぜ自殺報道はいつまでたってもガイドラインを無視するのか。媒体のこういう性質が人を自殺に追いやる一因なのでは。
リンク
fabric8: open source Integrated Development Platform for Kubernetes
fabric8 is discontinued The fabric8 suite has been discontinued, following you can find a list of the sub-projects that rem ain active.
torazuka 2014/08/05
java

configuration

provision
リンク
Amazon Redshiftの分析対象とするデータの設計／加工のポイント
……とは言うものの、今回はまだRedshiftに本格的には踏み込みません。Redshift分析環境にインポートし、実際に分析対象としてアクセスする『データ』（ファイル）に関する部分について、やらなければいけないこと、気を付けるべき点を中心に話を進めていきます。分析環境の構築と同様に大事な点であり、労力を掛けるべき点であると個人的に考えている部分です。分析テーマをピックアップ今回のようなビッグデータ分析環境を構築するとなった場合、まず間違いなく分析環境を構築するための『元ネタ』ありきで話が進んでいるものと思われます。『現在稼働中の△△△システムで日々生成されている◯◯データや※※※のログをこういう風に見てみたい／分析して業務に役立てたい』『今度リリースする◯◯のシステムで、こういう情報が取得、生成されるのでそのデータを分析してみたい』などです。そのような環境の場合、先行してまずは1つ『
torazuka 2014/08/05
Redshift取り込み前のデータの整形やテーブル定義について。項目ごとに公式サイトへのリンクもあって分かりやすい。

redshift

ETL
リンク
nkfを使ってファイルの文字コードを変換する | DevelopersIO
『ファイルの文字コードを変換する』ーこの作業はいつの時代でも我々を悩ませる問題です。日本語を扱う場合であれば尚更。システムでデータをインポートする際に文字コードを指定する(環境側で指定されている)場合はこの問題に対して対処していく必要があります(例えば、Amazon Redshiftに於いては、その構造上utf-8を文字コードとして使用・統一せざるを得ない環境となっています)が、生成され、環境へ投入する事になる各種ファイルのエンコードが投入先の環境と異なる場合、都度変換処理を噛まさなければならなくなります。容量が軽く対処個数が少なければ手動でエディタでファイルを開き、所定のエンコードで保存し直す...という手法も考えられなくは無いですが、ファイル容量が大きい・数が膨大になる...というケースになった場合は早々に破綻する事は明らかです。当エントリでは、その問題をより効果的・効率的な手法で
torazuka 2014/08/05
インストールする

nkf

文字コード
リンク
Amazon Redshiftで構築するビッグデータ分析環境の構成要素と全体像
CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。
torazuka 2014/08/05
"まず1つ、実現したい分析作業をピックアップし、その作業に適した情報・環境を構築していくことから始めて「分析作業のレール」を1本敷いてみるのが良い"

redshift
リンク
- 2014年8月7日
- 2014年8月5日
- 2014年8月1日