タグ

2013年7月3日のブックマーク (2件)

  • HDFSが高速に?mmapによるzero-copyでの読み込み - Tech Blog 〜ぞうの日記

    日公開されたHDFSの高速化に関連するJIRAの2つ目です。 通常、アプリケーションはread()などのシステムコール経由でファイルを読み出します。 このHDFS-4953はmmap()システムコールを使用することで、読み取り時にかかるオーバーヘッドを減らそうというものです。 参考までに、通常アプリケーションがファイルを読み出す場合、以下のようなフローでカーネルからの読み込み処理が行われます。 アプリからの読み込み要求 v fread()など (stdlib) v read()システムコール(glibc) v (以下カーネル空間) v sys_read() v vfs_read() v …. 参考資料:ページキャッシュのメモ P.12 アプリケーションからの読み出し要求によりシステムコールが呼ばれるのは上記の通りですが、問題となるのは、 read()が頻繁に呼びだされる場合、コンテキスト

    HDFSが高速に?mmapによるzero-copyでの読み込み - Tech Blog 〜ぞうの日記
    wyukawa
    wyukawa 2013/07/03
    memo
  • Cloudera | ハイブリッドデータカンパニー

    データを信頼し、AI を信頼する 信頼できるデータ、信頼できるモデル、信頼できる AI を実現するために、これほど多くのクラウドのさまざまなデータタイプを管理でき、オープンデータのイノベーションと大規模展開に対応できるプラットフォームは他にありません。

    Cloudera | ハイブリッドデータカンパニー
    wyukawa
    wyukawa 2013/07/03
    これのp25を参考にslot数を調整してみた。