タグ

2009年4月5日のブックマーク (12件)

  • Huffman Encoding/Decoding Program

  • 2-8(岡野原)

    6.テーマ概要 ITの急速な進化の中,ますますデータの効率的な保存方法,転送方法が必要とされている.そうした中,実際のデータの内容により自然に即した「単語」という塊を抽出して圧縮するという方法を開発するがこのプロジェクトの目的である.ここでいう単語というのは自然言語における単語ではなく,データの中で塊として見られるあらゆる形での単語を意味する.最終的には,これを用いた圧縮ソフトを開発するのが目的だが,ここでは,そのメインとなる単語抽出アルゴリズム (Word eXtraction,WX法) についての研究開発を行なう. 例えば,abracadabraというデータに対して,ここで開発するプログラムはabraという単語を抽出する.abraという単語を抽出する際に,文の実際的な意味はまったく利用せず,確率情報や,エントロピーなどを計算し,どれだけその単語が周りから「浮き出ているか」,「抽出す

    sleepy_yoshi
    sleepy_yoshi 2009/04/05
    未踏ソフトウェアの採択案件評価シート
  • 素ハフマン圧縮プログラム。 - hogelogの日記

    なんか、ハフマン符号化が少しわかった気がするぞ。あと二分木とか。プログラムを書いてようやく。実践を伴わない知識っていうのは宙に浮いてるようで、なんか居心地が悪い。実際に使ってみると、なんだか錨で固定したような気分になれるなあ。二分木に関しては「たぶんこんな感じのデータ構造だったっけ?」と適当に使ったから、スゲー間抜けなことしてるかも。というかそんなこと言い出したら全部そうか。 まず元データを読み込み、バイトごとの出現回数を数える。この出現回数表を書庫の先頭に記述。その回数からハフマン木を作成。ハフマン木により、1バイト->ビット列の変換表を作成。元データを頭から読み込み、先の変換表により書庫に追記。 というプログラムを作成。 以下ソース。 #include <stdio.h> #include <string.h> #define HCODEMAX 256 typedef struct{

    素ハフマン圧縮プログラム。 - hogelogの日記
  • 長文日記

  • Yusuke Shinyama

    Table of Contents Python Toys (Small programs/libraries for Python programming language) XCruiser (3D filesystem viewer) Queequeg (English grammar checker) CG Homeworks (Graphical Java applets) Documents (in Japanese) Silly Programs (in Japanese) Files (misc.) Acknowledgement This site is kindly hosted by unixuser.org.

    sleepy_yoshi
    sleepy_yoshi 2009/04/05
    Documents要チェック
  • Webstemmer(クローラーツール)

    語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ

    sleepy_yoshi
    sleepy_yoshi 2009/04/05
    ニュース記事の本文抽出
  • 「ブクマ」するのが楽しくなるくらい便利な「はてブ」専用アドオン*二十歳街道まっしぐら(FC2ブログ時代)

    Hatena bookmark アドオン」は、はてなブックマークを使いやすくするものです。 はてブのブックマークレットは使いづらいですよね、正直。 そんな方はこのアドオンを入れてみてください! 以下に、使い方、特徴をまとめておきます。

  • 呉、海軍さんの肉じゃがは34分で出来る :: デイリーポータルZ

    だって、「肉じゃが」だ。あまりにも普通のメニューだ。その地方で名物だからといって、感動するほどおいしいとは、思っていなかった。 砂糖のシンプルな甘さ、醤油の力強さ。煮過ぎていないタマネギ。 澄んだ味だなあ、と思った。 「こっちのカレーも、おいしいよ。さっぱりしながらも、スープがうまい」 「当だ。このオムライスもおいしい。妙においしい。なんじゃこりゃ」 同行してくれたTと、あれこれべてみていた。 「どれもおいしい。なんでだろ、何が違うんだろ」 「私らが旅テンション…だからかなあ?」 「いや、そんなことないよ、昨日べた居酒屋とか、アレだったじゃない」 「ああ、まあ、そうね…」 私たちは前日、おいしくない観光居酒屋でボラれ、ちょっと落ち込んでいた。ちなみに2品頼んで、20分滞在して、5000円弱だった。いい勉強だった。 「しかし、このおいしい肉じゃがが、100円て、何だあ…?」 ■肉じゃが

    sleepy_yoshi
    sleepy_yoshi 2009/04/05
    呉!!
  • まとめ:フレッシュマンは読んでおきたい身だしなみ系Tips19選 | ライフハッカー・ジャパン

    このように「ちょっとネクタイが長すぎだな〜」というフレッシュマンを見かけたら、それとなくこの写真を送ってあげてください。日のまとめは、まだスーツ姿が板に付いていないフレッシュマンに読んでもらいたい、身だしなみやマナーなどのTips19選。「外見よりも内面で勝負!」とは言いますが、外面でも勝負できたら、きっと勝率が上がりますよ。 ■まずは、基的なファッションと顔周りの手入れから ・「FrameFinder」であなたにお似合いの眼鏡を探してみよう! ・あえて無電源という選択:カミソリホルダー+シェービングブラシ ・庶民の収入でも「ワールドリーダー」に見せるファッション術 ・あえて無電源という選択:鼻毛バリカン ■見た目をブラッシュアップしたうえで、好印象を見せるTipsを ・パーフェクトな第一印象を残すコツ ・自分をシャープに見せる10の簡単な方法 ・自分の瞳孔を自由自在にあやつろう ・ち

    まとめ:フレッシュマンは読んでおきたい身だしなみ系Tips19選 | ライフハッカー・ジャパン
  • 「道具はいいのを買いなさい」という助言が意味すること

    刀を作っている方のところへ行って 包丁を見せていただいたことがある。 その場で試し斬り切りをさせていただいたけど それはもう切れること切れること。 お値段を見ると 一番お手頃なのでも4万円ぐらいだったと思う。 桁が一つ上のものもざらだった。 そこの大将が言うには 「道具はいいのを買いなさい。 4万の包丁、10年使えば1日10円ぐらいでしょ。」 とのこと。確かに。 まあ切れ味を維持しようと思ったら ちゃんとメンテナンスする必要があるけど、 ともかく長く付き合えば付き合うほど 値段の差は小さくなっていく。 その間ずっと気持ちよく料理ができるのだから 決して高い買い物ではない、と。 ただこれは 何でもかんでも高級品を買えばいいという話ではなくて お金をかける価値があるものとそうでないものを見極めなさい、 ということだろう。 包丁はよく切れるものを使うかどうかで できあがる料理にも差が出る。

    「道具はいいのを買いなさい」という助言が意味すること
  • フリーの写真素材が見つかるサイト30選 – creamu

    About.comで、フリーの写真素材が見つかるサイトがまとまっています。 ざっといくつかご紹介。 » Mayang’s Free Textures 3400以上の高解像度のテクスチャ画像。1日に20ダウンロード制限あり » Mayang’s Free Textures 世界中で撮影された7000以上の美しい写真集。個人利用、非商用利用のみ無料 » Stockcache 数百のクオリティの高い写真集。ライセンスはCreative Commons Attribution License。著作権を明記すれば利用可 » Big Foto たくさんの自然の写真。個人利用で無料 » Free Images 2500以上のクオリティの高い写真集。たくさんのカテゴリーから選べる Looking for free images? Here are thirty sites where you can fi

  • 自分の論文がWeb上で公開できるかチェックできるサイト - Tomo’s HotLine

    IT技術を中心に、暮らしに役立つ情報からクラシック音楽の解説まで気軽に情報発信しています。 WEBサイトはhttp://toremoro21.world.coocan.jp/ Twitterは@toremoro21です。 お久しぶりです、仕事があまりにも忙しくて全然Blogを書く余裕がありませんでした。4月からは少しずつ投稿しようと思います。 さて、以前「学術論文とプレゼン資料はWEBで即時公開すべきだ!」というエントリーを書いた後、大きな反響を頂きました。その際にコメント等で色々アドバイスを頂き、必要な手続きをすれば実はWeb上で自分の論文を公開できることがわかりました。 Web上で自分の論文を公開するには、その論文を投稿した学会の著作権規程をチェックする必要があります。その情報をアグリゲートした便利なWebサイトがこれ。 学協会著作権ポリシーデーターベース http://www.tul

    自分の論文がWeb上で公開できるかチェックできるサイト - Tomo’s HotLine
    sleepy_yoshi
    sleepy_yoshi 2009/04/05
    論文の公開条件