タグ

2008年10月20日のブックマーク (7件)

  • Integer::Elias - Elias gamma/delta coder - naoyaのはてなダイアリー

    Perl でγ符号、δ符号で整数を符号化するためのモジュールを作りました。(ω符号はまだサポートしていませんが) Elias 整数符号のモジュールなので Integer::Elias という名前にしています。 http://github.com/naoya/perl-integer-elias/tree/master γ符号、δ符号は整数の可変長符号です。バイト単位での可変長符号は ASN.1 BER (id:naoya:20080906:1220685978 参照) がありますが、γ符号、δ符号はビット単位での可変長符号で、より短いビット数で小さな整数を符号化することができます。 例えば 6 という数字があったとします。 6 の二進数での表現は 110 で 3 ビットです。110 の先頭ビットを除いたビット 10 で 2ビットあります。このビット数 2 を α符号 (Unary code

    Integer::Elias - Elias gamma/delta coder - naoyaのはてなダイアリー
    hiromark
    hiromark 2008/10/20
    Perl でγ符号、δ符号で整数を符号化するためのモジュール
  • yebo blog: Linuxカーネルのバージョン呼称を変更?

    2008/10/19 Linuxカーネルのバージョン呼称を変更? Linuxカーネルは2003年末にリリースされた安定化バージョン2.6にマイナーバージョンの番号を追加して、2.6.x.y のように呼ばれている。Linuxカーネルのメーリングリストでは、バージョンの呼称を変更する提案がなされたそうだ。既に2.8の開発が行われているそうだが、Novell社のGreg Kroah-Hartman氏の提案は、「YEAR.NUMBER.MINOR_RELEASE」という呼称に変更する。例えば、2009年の最初のリリースであれば、2009.0.0、次は2009.1.0となる。マイナーなバージョンアップがあれば、2009.1.1、2009.1.2とマイナー番号を増やしていく。果たして・・・ 投稿者 zubora 投稿時間 08:05 ラベル: Linux 0 コメント: コメントを投稿

    hiromark
    hiromark 2008/10/20
    ほほー。
  • Move To Front - Wikipedia

    Move to Front(先頭移動法、MTF)とは、再帰時間符号化法の一種で、再帰順位符号化(receny rank)法や book stack とも呼ばれる符号。実装に配列やリストを使用して、要素を先頭に移動する操作をメインとすることからこの呼称で呼ばれることが多い。 ブロックソートを行ったデータをMTF処理すると圧縮しやすいデータになることから、主にブロックソートを用いる圧縮プロセスの一部として利用されている。 動作原理は単純ながら、非定常であるため、その理論的性能の解析は困難であった。2005年に、1次マルコフ情報源の特定の状況においてのみ、エントロピーレートを達成することが明らかになっている。 まず初期化として、符号化の対象とするデータ列をリスト状に並べる。 対象:a b a b a c a c a 次に、符号化対象とするデータ列から記号を1つ読み込む。この読み込んだ記号が以前に

    hiromark
    hiromark 2008/10/20
    MTF の説明。
  • Algorithm::MTF / BWT → MTF → Range Coder によるデータ圧縮 - naoyaのはてなダイアリー

    先日言及した Burrows Wheeler Transform (id:naoya:20081016:1224173077) による変換後のテキストは圧縮に使えたり、全文索引に利用できたりと応用範囲は広いです。 BWT により変換したテキストを圧縮するには、そのまま圧縮するのではなく先頭移動法 (Move-To-Front http://ja.wikipedia.org/wiki/Move_To_Front) を適用することでより情報に偏りを持たせてから圧縮するのがセオリーです。 今日は先頭移動法の Perl 実装を作ってみました。Algoritm::MTF です。 http://github.com/naoya/perl-algorithm-mtf/tree/master に置いています。 use Algorithm::MTF; my $encoder = Algorithm::MTF

    Algorithm::MTF / BWT → MTF → Range Coder によるデータ圧縮 - naoyaのはてなダイアリー
    hiromark
    hiromark 2008/10/20
    MTF の Perl 実装
  • Burrows Wheeler Transform と Suffix Array - naoyaのはてなダイアリー

    ,. -‐'''''""¨¨¨ヽ (.___,,,... -ァァフ|          あ…ありのまま 今日 起こった事を話すぜ! |i i|    }! }} //| |l、{   j} /,,ィ//|       『BWT について調べていたら Suffix Array のライブラリができていた』 i|:!ヾ、_ノ/ u {:}//ヘ |リ u' }  ,ノ _,!V,ハ | /´fト、_{ル{,ィ'eラ , タ人        な… 何を言ってるのか わからねーと思うが /'   ヾ|宀| {´,)⌒`/ |<ヽトiゝ        おれも何をされたのかわからなかった… ,゙  / )ヽ iLレ  u' | | ヾlトハ〉 |/_/  ハ !ニ⊇ '/:}  V:::::ヽ        頭がどうにかなりそうだった… // 二二二7'T'' /u' __ /:::::::/`ヽ /'

    Burrows Wheeler Transform と Suffix Array - naoyaのはてなダイアリー
    hiromark
    hiromark 2008/10/20
    コメント欄もまた面白い。
  • ACM Computing Surveysで論文を探す - 発声練習

    ある分野について先行研究を調べたいときは、Surveyを調べるのがもっとも効率良い。ACM Computing Surveysで探す場合は、Webページ経由でACM Portalを使うのが便利。 ACM Computing Surveys Computing Surveys, a journal published by ACM, the Association for Computing Machinery, publishes surveys, tutorials, and special reports on all areas of computing research. Volumes are published yearly in four issues appearing in March, June, September, and December. ACM Computi

    ACM Computing Surveysで論文を探す - 発声練習
    hiromark
    hiromark 2008/10/20
    なるほど。
  • 圧倒的に生産性の高い人(サイエンティスト)の研究スタイル - ニューロサイエンスとマーケティングの間 - Being between Neuroscience and Marketing

    Leica M7, 90mm Tele-Elmarit F2.8, PN400N @Santa Monica, CA アメリカで研究するようになって最も驚いたことの一つは、日では考えられないほど生産性の高い研究者が存在することだ。 たとえば僕がローテーションして、最後までそこでdissertation work(博士論文のための研究、活動)をすることにするか迷っていたあるラボ。そこはポスドク、テクニシャンを含めて(註:undergraduate=学部生は殆どアメリカの研究室には居ない)たった5人でやっているにもかかわらず、毎年5-6ぐらいはペーパーを出し、ほぼ全て一流紙。多いときは年に2ネイチャーに出し,一は表紙になったりしていた(#)。 しかも良く日では見かける深夜も土日も働いて、朝はどちらかというと崩れ気味、みたいな重労働系の生活ではなく、普通に朝来て、「うーん今日は狂ったよ

    圧倒的に生産性の高い人(サイエンティスト)の研究スタイル - ニューロサイエンスとマーケティングの間 - Being between Neuroscience and Marketing
    hiromark
    hiromark 2008/10/20
    「特徴的なところを挙げてみる」のところがすばらしすぎる。