エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
WebHDFSとHttpFs(Hoop)に見るHDFSクライアントチューニングの話 - たごもりすメモ
前に書いた通り、HDFSへの書き込みをHoop Server経由からWebHDFS経由に変更している。 これまで(Hoop Se... 前に書いた通り、HDFSへの書き込みをHoop Server経由からWebHDFS経由に変更している。 これまで(Hoop Server) Hoop Server経由で書き込んでいたとき。クラスタで重めのMapReduceジョブを走らせると、その時間帯に書き込んだデータを後で読み出したときに checksum error となって読み出しに失敗することが多く、なんでかなコレと悩んでいた。たぶんDataNode経由でデータ追記するのに長時間を必要としたとき、クライアントがTimeoutしちゃった場合のロールバックが中途半端なんじゃないかなとは思う。 ところで Hoop Server の設定には NameNode および DataNode へのタイムアウトを指定する方法などが無い。 DFSClient一般の設定としては dfs.socket.timeout ならびに dfs.datanode.
2012/08/20 リンク