タグ

ブックマーク / homepage3.nifty.com (8)

  • Adachi Page

    アホでも数学者になれる方法──アホぢからはこわい トップページ アホのための研究法 前書き アホな私が一応数学者になれた。そのノウハウを公開する。サラリーマンを七年半やって脱サラして数学者になろうとするようなことは決して人に勧めるものではない。しかし困難な状況でつかんだノウハウは若い数学者を志す人には、大いに役立つであろう。私の経験で言うと、研究ノートをしっかりつけられるようになれば、大体研究は出来るようになるのであるが、研究ノートをつけること、どうつけたらよいか、など客観的で現実的な方法は、学生時代指導は受けなかった。そのかわりめったやたらと受け売りの精神論をたまわった。私の言う方法は初級から上級まで、自分で効果を検証済みのものばかりである。折りに触れて気づいたことをカードに書き込んでカードボックスにほりこんでいたら800枚以上になった。それをもとにまとめたものを少しずつ書き込んでいっ

  • Compressed Suffix Arrays

    Copyright © 2004-2008, Yuta Mori, All Rights Reserved. yiv01157 at nifty dot com http://homepage3.nifty.com/wpage/

  • white page

    blog めったに更新しないブログ。Suffix Arrayの構築法やデータ圧縮についてちょこっと書いてます。 memo 旧メモ。blogに全て移したので、そのうち消す予定です。 junk 過去に書いたソースコートやテスト中のものが放り込んであります。 software 自作のプログラム・ライブラリ置き場です。 links of data compression データ圧縮や接尾辞配列などに関するリンク集です。 my bookmarks お気に入りのサイト集です。

  • Emacs 簡易マニュアル

    起動方法 起動画面 コマンド表記について 基機能一覧 その他の機能 Emacs は慣れている人にとっては大変使いやすいテキストエディタですが、 キーバインドを覚えていないと事実上使えないことから、 一部の人にとっては敷居が高いようです。 ここでは、これだけ知っていれば十分、 という機能とコマンドリストを示します(十分すぎるものも記載しています)。 Emacs はキーバインドを自由に変更できるので、 設定ファイルが独自にある場合は、 必ずしも以下に示すような操作にはなっていない場合があります。 以下で示すのは、独自のカスタマイズをしていない、 デフォルトの状態での操作方法です。 起動方法 起動方法は次の3通りがあります。 emacs [ファイル名] 通常の起動方法です。別ウィンドウに Emacs が立ち上がります。 引数としてファイル名を指定することもできます。 emacs -fn 7x1

  • BlockSorting

    BlockSortingは、今までのデータ圧縮で有名な方法であるLZ法とは全く違う、ユニークな操作を用 いてデータを圧縮する方法であり、M.BurrowsさんとD.J.Wheelerさんが作者なので「BWTransform」 ともいいます。 このアルゴリズムは簡単に言ってしまえば、「データをぐるぐる回してソートして出力」というも のです。簡単すぎるかもしまいませんが、当にそうなんです。 ちなみに、このBlockSorting、単体では全く圧縮しません。ただ可逆な形にデータを変換すると いうものです。しかし、BlockSorting後のデータは非常に圧縮されやすい状態になります。例える と、色々な形をしたスポンジ(データ)が箱にごちゃごちゃに入って山積みになっているとします 。 これをそのまま上からギューっと押しつぶすのがLZ法やHuffman法なのに対し、一度、形が似た も

  • 無題ドキュメント

    次に、各Suffixにおける大小関係を定義します。この大小関係は辞書式順序です。辞書式順序とは、辞書に並んでいる通りの順番であり、簡単に言えば、 (1)両Suffixを頭(左)から順番に一文字ずつ比較していき、初めて違うところで、文字の大小関係で比較を行う (2)もし、二つを比較していき、片方のSuffixが終わりに達してしまったら、そちらの方が小さいと定義する。 例えば、(1)は上の例でいえば、 S5 と S7を比較するとすると S5 adabra S7 abra 一文字目は両方ともaで、同じなので二文字目(赤い部分)を比較すると、dとbであり、文字の大小関係で d > b なので S7 < S5 という大小関係がつきます。 (2)については、S0 と S7を比較すると S0 abracadabra S7 abra で、頭から4文字は同じであり、S7はデータの最後に達しました。この

  • DO++

    このサイトは2004年頃の更新を最後にDiaryを除いてメンテナンスをしていません。何かの役に立つかもしれないので残しておきますが、古い情報も含まれていますのでご了承ください (研究室のページ)

  • suffix array

    更新履歴 2004/01/07  O(N) 構築アルゴリズム三種追加(Ko &Alulu, Kim & al., Karkkainen & Sanders) Suffix Arrayは、最近注目を集めているデータ構造です。その理由として、 (1)大規模なデータに対して、高速に検索、情報抽出を行うことができる (2)BWTとしてデータ圧縮に用いることができる。 ことが挙げられます。(1)に関しては自然言語処理において、膨大な量のコーパスから情報(例えば、単語の出現回数など)を調べるときににSuffix Arrayを用いると非常に高速に求めることができます。 膨大な量のコーパスに基づいた自然言語処理が盛んになってきている今、Suffix Arrayが注目を集めています。 また、ゲノム情報を調べるバイオインフォマティクスにおいても、ここの配列と似ている部分(例えばCCAG)を調べるといった場合

  • 1