タグ

filesystemに関するyassのブックマーク (125)

  • ブロックアルゴリズムとB-Treeアルゴリズム

    ファイルサーチを高速化するB-Treeアルゴリズム ext2、ext3がベースとするブロックアルゴリズムは、ブロック数が対応するディスクのジオメトリ数に制限されること、ファイルサーチにO(n)かかる(注)こと、ファイルサイズに関係するパフォーマンス低下など、いくつかの問題があった。 注:「O(n)」とは、実行時間が入力の大きさ「n」に比例するアルゴリズムである。O(n)は「nのオーダー」または「オーダーn」と読む。後述する「O(log n)」は、アルゴリズムの計算量に関する議論の場合logの底は常に2で、O(log n)の方がO(n)よりも効率が良い。例えばn=8の場合、O(log n)は入力8に対して3回の実行で済むが、O(n)は8回の実行となる。 ReiserFS、JFS、XFSといったファイルシステムでは、こうしたブロックアルゴリズムの限界に対して、早い段階からデータベースの技術をフ

    ブロックアルゴリズムとB-Treeアルゴリズム
    yass
    yass 2014/06/29
    " B+-Treeはデータとキーを完全に分けて管理 / ノードの下位層をインデックス部とデータ部に分けて構成し、「データ」は常にリーフノードに保存する。インデックス部の各ノードは4つのキー値と5つのポインタのみを保持 "
  • ブロックアルゴリズムとB-Treeアルゴリズム

    後で説明するが、ext2ではブロックグループ0の「スーパーブロック」に、パーティション内のブロックグループ全体の管理情報が格納される。 スーパーブロックには、 iノードの総数 ブロックサイズ ファイルシステムのサイズ 空きブロック数、空きiノード数 使用されているブロックグループ 最終fsck時刻 など、ファイルシステムに関するさまざまな情報が含まれている。「グループディスクリプタ」は、「データブロックビットマップ」や「iノードビットマップ」情報などを参照して空きブロックや空きiノードを探し、データを割り当てる際に最適なブロックを決定するのに使われる。 「データブロックビットマップ」と「iノードビットマップ」は、ビットマップ情報である。ビットマップ情報は、あるデータが使用中か未使用かを0か1のbitで保持している。1byte=8bitsなので、80個のブロックの状態を10bytesで管理で

    ブロックアルゴリズムとB-Treeアルゴリズム
    yass
    yass 2014/06/29
    " iノードが不足するとデータブロックに空きがあってもファイルを作成できなかったり、逆にデータブロックがいっぱいになると未使用のiノードが発生してしまうという問題が生じる。"
  • 分散ファイルシステム比較 | Hadoop Times

    分散ストレージソフトウェアを一覧表としてまとめたものです。 機能や特徴をご比較下さい。 PDF版はこちら 分散ストレージソフトウェアの種類 種別 POSIX互換 メタデータ管理 分散単位 開発元 API

    分散ファイルシステム比較 | Hadoop Times
  • UNIXのinode番号 - 中年SEのありふれた生活

    inode番号を理解する UNIXファイルシステムで使用するシンボリックリンク(または、ソフトリンク、symlinkなど)はとっても便利なファイルです。Windowsのショートカットファイルに似ていますね。 このシンボリックリンクファイルに「出会ってよかった!」って思います。 特に、システム構築時に各ファイル、ディレクトリの配置を設計する人は、よく理解しておくことをお勧めします。 でも、その前に。。。 UNIXのファイルシステムの特徴、inode番号、ディレクトリの仕組みをざっくり理解しないと、なかなか難しいかもしれません。 ls-lの結果はinodeの情報 UNIXのファイルシステムでは、1つのファイルを、データ部分と属性部の2つから構成して管理します。 Linuxでは、この属性部のことを、inodeと呼んでいます。 このinodeもハードディスクに書き込まれています。データ以外にこのi

    UNIXのinode番号 - 中年SEのありふれた生活
    yass
    yass 2014/06/28
    " UNIXは、このファイル名を格納する専用のファイルを開発しました。それがディレクトリです。 ディレクトリは inode番号とそのファイルの名前だけを格納するファイルです。"
  • ディレクトリの中にある大量の小さなファイルを高速に読み込む方法 - 射撃しつつ前転 改

    ディレクトリの中にある大量のファイルを高速に読み込む方法が知りたかったので、実験してみた。想定しているシチュエーションは、一つ一つのファイルは数KB程度だが数が多い、という場合である。適当な順番でアクセスすると、ランダムアクセスになってしまいとても時間がかかる。個々のファイルを読み込む順番はどうでも良く、すべてのファイルを処理することさえできればいいので、原理的にはシーケンシャルアクセスで処理できてしかるべきである。 まず、ファイルシステムについて。HDDやSSDなどのハードウェアにアクセスする際には、ファイル名などという概念はもちろん存在しない。ファイル名と実際のディスク上の対応を管理するのがファイルシステムの主な役割である。ファイルシステムは、ファイル名からそのファイルに対応するブロック番号(メモリアドレスみたいなもんだな)を調べて、そのブロック番号を指定してHDDやSSDにアクセスす

    ディレクトリの中にある大量の小さなファイルを高速に読み込む方法 - 射撃しつつ前転 改
    yass
    yass 2014/06/28
    " ということで、inode番号はext3ではブロック番号の近似として十分に使え、inode番号でソートすることで、ファイル数が多い場合のディレクトリ内のファイル読み込みを高速化することができた。"
  • Introducing LoggerFS

    WARNING: LoggerFS PROJECT HAS BEEN ABANDONED BY ITS MAINTAINER. Applications generate logs for the purposes of debugging, maintenance, analytics and sometimes legal compliance. Logs are important but are too often overlooked until they cause problems (e.g. filling hard disks and crashing production systems). Veteran devops engineers are more proactive about logging and use systems such as Logstash

    yass
    yass 2014/06/28
    " LoggerFS is a Go-based FUSE filesystem designed to be a universal interface to various log management systems. It’s trivial to feed logs into LoggerFS since it’s a file system and everything is a file. LoggerFS eliminates the need for polling, log rotation, and reader seek state files. "
  • TechCrunch | Startup and Technology News

    Welcome back to TechCrunch’s Week in Review — TechCrunch’s newsletter recapping the week’s biggest news. Want it in your inbox every Saturday? Sign up here. Over the past eight years,…

    TechCrunch | Startup and Technology News
  • Design, Scale and Performance of MapR's Distribution for Hadoop

    Details the first ever Exabyte-scale system that can hold a Trillion large files. Describes MapR's Distributed NameNode (tm) architecture, and how it scales very easily and seamlessly. Shows map-reduce performance across a variety of benchmarks like dfsio, pig-mix, nnbench, terasort and YCSB.Read less

    Design, Scale and Performance of MapR's Distribution for Hadoop
  • Alluxio - Data Orchestration for the Cloud

    wHAT’S NEW ALLUXIO WEBINAR | What’s new in Alluxio Enterprise AI 3.2: Leverage GPU Anywhere, Pythonic Filesystem API, Write Checkpointing and more​ In today’s AI-driven world, organizations face unprecedented demands for powerful AI infrastructure to fuel their model training and serving workloads. Performance bottlenecks, cost inefficiencies, and management complexities pose significant challenge

    Alluxio - Data Orchestration for the Cloud
    yass
    yass 2014/05/05
    " Tachyon is a fault tolerant distributed file system enabling reliable file sharing at memory-speed across cluster frameworks, such as Spark and MapReduce. "
  • /usr/local とは何なのか - 破棄されたブログ

    ご用心: この記事を鵜呑みにせず、末尾に記載された一次ソースを確認してください。 ソースからソフトウェアをビルドしてインストールするときに使う /usr/local ディレクトリだけど、/opt ディレクトリとの住み分けとか、 そもそも標準はどうなっているのかとか、まともに知らんかったので Filesystem Hierarchy Standard を確認してみた。 /usr/local は何をすべきところなのか? 他のホストと共有されない 既存のシステムの破壊防止 FHS 準拠のソフトウェアをインストールする /usr/local ディレクトリ下自体が FHS 準拠になる /usr/local ディレクトリは、システム管理者がソフトウェアをローカルにインストールするために用いる。 /usr/local ディレクトリとして隔離されるため、同名のファイル名で既存のファイルを上書きするなどして

    /usr/local とは何なのか - 破棄されたブログ
    yass
    yass 2014/05/04
    " /usr/local ディレクトリ下は FHS 準拠のディレクトリ構造を取り、bin, etc, games, include, lib, man,sbin, share, src 以外のディレクトリを直下においてはならない。"
  • Google Code Archive - Long-term storage for Google Code Project Hosting.

    Code Archive Skip to content Google About Google Privacy Terms

    yass
    yass 2014/04/20
    " two objectives: to store billions of files! / to serve the files fast! / Instead of supporting full POSIX file system semantics, Weed-FS choose to implement only a key~file mapping. Similar to the word "NoSQL", you can call it as "NoFS"
  • Why buffered writes are sometimes stalled

    Many people think buffered write (write()/pwrite()) is fast because it does not do disk access. But this is not always true. Buffered write sometimes does disk access by itself, or waits for some disk accesses by other threads. Here are three common cases where write() takes longer time (== causing stalls). 1. Read Modify Write Suppose the following logic. Opening aaa.dat without O_DIRECT/O_SYNC,

    Why buffered writes are sometimes stalled
    yass
    yass 2014/03/11
    " 1. write() does disk read when needed. To avoid this issue you need to append a file, not overwrite. Or use OS page aligned writes.   2. write() may be blocked for "stable page writes". To avoid this issue you need to use newer Linux kernel supporting disabling stable page writes. "
  • ext3からext4への更新概要

    Kernel Recipes 2017 - Understanding the Linux kernel via ftrace - Steven RostedtAnne Nicolas

    ext3からext4への更新概要
  • GitHub - Feh/nocache: minimize caching effects

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - Feh/nocache: minimize caching effects
    yass
    yass 2014/01/05
    " The `nocache` tool tries to minimize the effect an application has on the Linux file system cache. This is done by intercepting the `open` and `close` system calls and calling `posix_fadvise` with the `POSIX_FADV_DONTNEED` parameter. "
  • F2FS(Flash-Friendly File System) を試してみる。 - ブログ・ア・ラ・クレーム

    このエントリは、 カーネル/VM Advent Calendar 2013 の 19日目の記事として書いています。 こんにちは、 @syu_cream です。 記事では SSD に特化したファイルシステムであるところのF2FS(Flash-Friendly File System) の軽い説明を入れつつ、試しに使ってみて軽くベンチマークを取ってみた結果を掲載します。 大分ざっくりと書いてるので、誤った点など多々あるかと思います。適当にご指摘頂けると幸いです。 F2FS とは F2FS(Flash-Friendly File System) は Linux カーネル 3.8 でマージされた、Samsung が中心となって開発した、主にSSDに特化したファイルシステムです。 生のフラッシュメモリ 特化のファイルシステムは、既存のものが幾つか存在するのですが、F2FS はそれらとはまた違った構

    F2FS(Flash-Friendly File System) を試してみる。 - ブログ・ア・ラ・クレーム
  • Flash Friendly File System (F2FS) Overview

    Flash Friendly File System (F2FS) Overview Leon Romanovsky leon@leon.nu www.leon.nu November 17, 2012 Leon Romanovsky leon@leon.nu F2FS Overview Disclaimer Everything in this lecture shall not, under any circumstances, hold any legal liability whatsoever. Any usage of the data and information in this document shall be solely on the responsibility of the user. This lecture is not given on behalf of

  • JNotify - File system events library for Java

    JNotify java API JNotify is a java library that allow java application to listen to file system events, such as: File created File modified File renamed File deleted Supported platforms Windows (2000 or newer) Windows notes Linux with INofity support (2.6.14 or newer) Linux notes Mac OS X (10.5 or newer) Mac OS notes Usage example JNotify can be tested by simply running the jar file with the follo

    yass
    yass 2013/10/24
    "JNotify is a java library that allow java application to listen to file system events, such as: File created/ File modified/ File renamed/ File deleted / Windows (2000 or newer) / Linux with INofity support (2.6.14 or newer) / Mac OS X (10.5 or newer) "
  • inotify FAQ (Frequently Asked Questions) | inotify - get your file system supervised

    inotify FAQ (Frequently Asked Questions) Q: What is inotify? inotify is an inode-base file system notification mechanism. See About for more details. Q: What can I use inotify for? inotify is intended for use in all cases of monitoring filesystem events. See Why to use for more details. Q: Which kernels do support inotify? inotify has been merged to 2.6.13. Your kernel must be configured to compil

    yass
    yass 2013/10/13
    " Q: What is the difference between IN_MODIFY and IN_CLOSE_WRITE? The IN_MODIFY event is emitted on a file content change (e.g. via the write() syscall) while IN_CLOSE_WRITE occurs on closing the changed file. / IN_CLOSE_WRITE is emitted only once (on closing the file)."
  • そのファイル、安全に更新できていますか?(アトミックなファイル操作:前編)

    ハートビーツ最年長エンジニアの滝澤です。以前、弊社CTOにシニアおっさんエンジニアから若手エンジニアに向けて何か書いてくれと言われた気がしたので、アトミック(atomic)なファイル操作について3編に分けて紹介します。この内容は弊社の社内勉強会で話した内容をまとめ直したものです。 そのファイル、安全に更新できていますか?(アトミックなファイル操作:前編)←今回 そのファイル、安全に作成できていますか?(アトミックなファイル操作:中編) そのファイル、安全にロックできていますか?(アトミックなファイル操作:後編) 今回は「みなさん、安全にファイルの更新ができていますか?」ということについて、考えてみましょう。 あなたはあるサーバ上のファイルの更新を依頼され、もらったファイルをサーバ上でコピーして上書きしました。しばらくして、データに異常が発生したので調べて欲しいと言われました。さて、何が起き

    そのファイル、安全に更新できていますか?(アトミックなファイル操作:前編)
    yass
    yass 2013/10/10
    " アトミックにファイルを更新するには、rename()というファイル名を変更するシステムコールを使います。mvコマンドはこのrename()を使ってファイル名の変更を行っています。"
  • 株式会社HPCソリューションズ ~ レビュー Lustreファイルシステムの概要と導入手順について GlusterFS rdma

    Lustre(ラスター)ファイルシステムは代表的なクラスターファイルシステムの一つです。 そのパフォーマンスの高さと、オープンソースという公共性もあり、クラスタファイルシステムのなかでは最もユーザ数が多いと思われます。 Lustreの生い立ちはあまり幸運なものではなく、色々な企業の手を経てきました。 今回ご紹介するのは2012年にインテルに買収されたWamcloudが公開しているLustre-2.1.4のrpmを元にしています。 Lustreの主な特徴、簡単なケースでの構築手順、利用方法をご紹介します。 目次 Lustreの特徴 Lustreの構築手順 Lustreの利用方法 1. Lustreの特徴 Lustreファイルシステムの主な特徴は以下の通りです。 メタデータとストレージの分離 LustreのサーバはMDS(メタ・データ・サーバ)とOSS(オブジェクト・ストレージ・サーバ)の二種

    yass
    yass 2013/09/23
    " Lustre ファイルシステムは代表的なクラスターファイルシステムの一つです。 そのパフォーマンスの高さと、オープンソースという公共性もあり、クラスタファイルシステムのなかでは最もユーザ数が多いと思われます "