世の研究者たちはFASTAファイルのハンドリングにはどのようなツールを使っているのだろうか。 長さでソートしたい 特定の文字列を持つものだけ抽出したい 名前だけ抽出したい 名前を置換したい/通しで付け直したい でかすぎるファイルを分割したい ランダムサンプリングしたい といった欲望は、シーケンスを扱うすべての研究者たちが持っていそうなものだけど、調べてみても、意外と統一的な方法って無くて、各自が自分なりの方法で作業してるのが実情みたいだ。自分自身もbioperl, biopython, bioawkなど、色々なツールをかじってみたけれど、どれもとっつきにくくて、結局、一番使い慣れているRにパッケージ"seqinr"を入れて作業する方法に落ち着いていた。けどこの方法は、もともと文字列処理が得意でないRに無理矢理FASTAを読み込ませているところもあるので、次世代シーケンサーで出てくるバカでか