CSAやFM-Indexの構築時にボトルネックとなる省メモリなBWTの構築方法について調べた。実際、SAから構築する方法だとInduced Sortingを使うわけだが、最終的なCSAやFM-Indexの結果に比べてメモリを使いすぎる。これはちょっと嫌がられる。今はメモリが安いとはいえ、個人で買えるサイズは数十GBだろうし、かなり投資できる会社であっても数百GBだろう。価格とのトレードオフを考えるとこのあたりが妥当だと思う。 ってことで、ここ最近の悩みは、BWTを構築する時の中間メモリのサイズだった。というのも、仮に中間メモリが元のテキストの5倍必要であれば、メモリ的には、10GB使えても、テキストとしては、2GBしか扱えないことになる。これはかなり無駄だと思う。2GBずつ作って、5個のCSAやFM-Indexにして、メモリに上げておくという方法も考えられるが、この場合、検索性能は、1/5
This copy is for your personal, non-commercial use only. Distribution and use of this material are governed by our Subscriber Agreement and by copyright law. For non-personal use or to order multiple copies, please contact Dow Jones Reprints at 1-800-843-0008 or visit www.djreprints.com. http://jp.wsj.com/article/SB10001424127887323504304578544231626748640.html
バイオインフォマティクス市場は今後5年間2桁成長の見通し プレスリリース発表元企業:株式会社グローバルインフォメーション 株式会社グローバル インフォメーションは、米国の市場調査会社BCC Researchが発行した報告書「Bioinformatics: Technologies and Global Markets (バイオインフォマティクス:技術と世界市場)」の販売を開始しました。 ヒトゲノムプロジェクトが2003年に終了して以来、ゲノムワイド関連解析 (GWAS) によって複雑な疾患の遺伝子レベルでの理解が進み、またハイスループットテクノロジーが進展しました。これにより研究者は脊椎動物、無脊椎動物、病原体のゲノムを迅速かつ低価格でマッピングする事が可能となっています。 更に近年クラウドコンピューティングの進展とデータ解析ソフトの改良によりデータ分析が容易になり、研究者は様々な疾患のシ
Preferred Infrastructure(PFI)と京都大学iPS細胞研究所(CiRA)は11月5日、2013年10月29日に機能性配列の探索や細胞選別のための機械学習などの初期化メカニズムの解明に関する研究や次世代シーケンサから得られたビックデータの解析における大規模機械学習技術・情報検索技術・文字列解析技術の応用に関して、共同研究契約を締結したことを発表した。 近年のライフサイエンス分野では、例えばヒト一人分のゲノムの読み取りコストが2001年で約9500万ドルであったものが、2013年では約5600ドルと大きくその収集コストが低下しており、それに伴ってデータの爆発的増加が生じ、ハードウェアの側面だけでなく、ソフトウェアの面でもそうした大量のデータを活用するための技術が求められるようになっている。 また、iPS細胞の利用分野の1つである再生医療が、近年、産業として期待されるよう
頻繁にAWS Management Consoleでログイン・ログアウトを繰り返したりしていませんか? 日頃AWSを利用して業務を行う際、複数のAWSアカウントを切り替えて作業を行う場合があります。もちろん、AWSで作業を行う場合、必ずといっていいほどAWS Management Consoleにログインを行うと思います。 下記の見慣れた画面にメールアドレスとパスワードを入力しログインしては、作業が終わればログアウトし、また別のアカウントのメールアドレスとパスワードを入力し。。。(以下略) 現在、AWS Management Consoleはマルチアカウントに対応していません。そのため、AWSアカウントを切り替えて作業を行う場合は、その都度ログイン・ログアウトを行う必要があります。 そこで、Google ChromeでAWS Management Consoleを利用する場合、Google
軽量コマンドラインツールが出た! 全国うん万人?のAWSデベロッパーの皆さん、ニュースです。AWSから提供されていたコマンドラインツールがPython版になって登場です。すでに12のサービスに対応しています。ただ単にJavaからPythonになったというレベルではありません。超軽量になったのです。今までのコマンドラインツールは、バックグラウンドでJVM(Java VM)が立ち上がっていました。コマンドが呼ばれる度にVMが初期起動するのでCPU使用率が非常に高く、サーバー運用時の定期呼び出しには大きな問題となっていました。仕方なく、RubyやPythonのSDKを使ってスクリプトを書くという毎日でした。Java好きな私ですので多少擁護しますと、Java版はRI(Reference Implementation)として、AWSの全てのAPIにアクセスするためのお手本として、今後も最初にSDKが
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く