タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

sortに関するshunkeenのブックマーク (1)

  • 巨大テキストファイルをsortコマンドでソートしてみる

    巨大なテキストファイルをソートする問題について、sortコマンドの挙動を中心にAmazon EC2インスタンス上で検証を行いました。その結果を記事にまとめたものです。 お題の説明 先日のTwitterでこんな話題がありました。論旨としては、非常に大きくメインメモリに収まらないサイズのテキストファイルをソートしたい場合にどうすればよいか、というものです。 解法はさまざまなものがありえると思いますが、この記事ではsortコマンドによるソートを試してみました。 一般論としての解法 stackoverflowなどを軽く眺める限りだと「普通のsortコマンドが最良ではないか」「GNUのsortは入力が大きい場合は外部ソートをしてくれる」などの回答が見つかります。 https://unix.stackexchange.com/questions/120096/how-to-sort-big-files

    巨大テキストファイルをsortコマンドでソートしてみる
    shunkeen
    shunkeen 2022/09/03
    きちんと検証しててカッコいい/確かに、何度もやるならDWHに入れて欲しい。部分ソート(Partial sorting)の場合も確かに。前提違うけど、一回だけならキーの先頭N文字で複数ファイルに振り分けて、別々にソートしちゃう
  • 1