6.テーマ概要 ITの急速な進化の中,ますますデータの効率的な保存方法,転送方法が必要とされている.そうした中,実際のデータの内容により自然に即した「単語」という塊を抽出して圧縮するという方法を開発するがこのプロジェクトの目的である.ここでいう単語というのは自然言語における単語ではなく,データの中で塊として見られるあらゆる形での単語を意味する.最終的には,これを用いた圧縮ソフトを開発するのが目的だが,ここでは,そのメインとなる単語抽出アルゴリズム (Word eXtraction,WX法) についての研究開発を行なう. 例えば,abracadabraというデータに対して,ここで開発するプログラムはabraという単語を抽出する.abraという単語を抽出する際に,文の実際的な意味はまったく利用せず,確率情報や,エントロピーなどを計算し,どれだけその単語が周りから「浮き出ているか」,「抽出す
なんか、ハフマン符号化が少しわかった気がするぞ。あと二分木とか。プログラムを書いてようやく。実践を伴わない知識っていうのは宙に浮いてるようで、なんか居心地が悪い。実際に使ってみると、なんだか錨で固定したような気分になれるなあ。二分木に関しては「たぶんこんな感じのデータ構造だったっけ?」と適当に使ったから、スゲー間抜けなことしてるかも。というかそんなこと言い出したら全部そうか。 まず元データを読み込み、バイトごとの出現回数を数える。この出現回数表を書庫の先頭に記述。その回数からハフマン木を作成。ハフマン木により、1バイト->ビット列の変換表を作成。元データを頭から読み込み、先の変換表により書庫に追記。 というプログラムを作成。 以下ソース。 #include <stdio.h> #include <string.h> #define HCODEMAX 256 typedef struct{
Table of Contents Python Toys (Small programs/libraries for Python programming language) XCruiser (3D filesystem viewer) Queequeg (English grammar checker) CG Homeworks (Graphical Java applets) Documents (in Japanese) Silly Programs (in Japanese) Files (misc.) Acknowledgement This site is kindly hosted by unixuser.org.
日本語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから本文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ
だって、「肉じゃが」だ。あまりにも普通のメニューだ。その地方で名物だからといって、感動するほどおいしいとは、思っていなかった。 砂糖のシンプルな甘さ、醤油の力強さ。煮過ぎていないタマネギ。 澄んだ味だなあ、と思った。 「こっちのカレーも、おいしいよ。さっぱりしながらも、スープがうまい」 「本当だ。このオムライスもおいしい。妙においしい。なんじゃこりゃ」 同行してくれたTと、あれこれ食べてみていた。 「どれもおいしい。なんでだろ、何が違うんだろ」 「私らが旅テンション…だからかなあ?」 「いや、そんなことないよ、昨日食べた居酒屋とか、アレだったじゃない」 「ああ、まあ、そうね…」 私たちは前日、おいしくない観光居酒屋でボラれ、ちょっと落ち込んでいた。ちなみに2品頼んで、20分滞在して、5000円弱だった。いい勉強だった。 「しかし、このおいしい肉じゃがが、100円て、何だあ…?」 ■肉じゃが
このように「ちょっとネクタイが長すぎだな〜」というフレッシュマンを見かけたら、それとなくこの写真を送ってあげてください。本日のまとめは、まだスーツ姿が板に付いていないフレッシュマンに読んでもらいたい、身だしなみやマナーなどのTips19選。「外見よりも内面で勝負!」とは言いますが、外面でも勝負できたら、きっと勝率が上がりますよ。 ■まずは、基本的なファッションと顔周りの手入れから ・「FrameFinder」であなたにお似合いの眼鏡を探してみよう! ・あえて無電源という選択:カミソリホルダー+シェービングブラシ ・庶民の収入でも「ワールドリーダー」に見せるファッション術 ・あえて無電源という選択:鼻毛バリカン ■見た目をブラッシュアップしたうえで、好印象を見せるTipsを ・パーフェクトな第一印象を残すコツ ・自分をシャープに見せる10の簡単な方法 ・自分の瞳孔を自由自在にあやつろう ・ち
日本刀を作っている方のところへ行って 包丁を見せていただいたことがある。 その場で試し斬り切りをさせていただいたけど それはもう切れること切れること。 お値段を見ると 一番お手頃なのでも4万円ぐらいだったと思う。 桁が一つ上のものもざらだった。 そこの大将が言うには 「道具はいいのを買いなさい。 4万の包丁、10年使えば1日10円ぐらいでしょ。」 とのこと。確かに。 まあ切れ味を維持しようと思ったら ちゃんとメンテナンスする必要があるけど、 ともかく長く付き合えば付き合うほど 値段の差は小さくなっていく。 その間ずっと気持ちよく料理ができるのだから 決して高い買い物ではない、と。 ただこれは 何でもかんでも高級品を買えばいいという話ではなくて お金をかける価値があるものとそうでないものを見極めなさい、 ということだろう。 包丁はよく切れるものを使うかどうかで できあがる料理にも差が出る。
About.comで、フリーの写真素材が見つかるサイトがまとまっています。 ざっといくつかご紹介。 » Mayang’s Free Textures 3400以上の高解像度のテクスチャ画像。1日に20ダウンロード制限あり » Mayang’s Free Textures 世界中で撮影された7000以上の美しい写真集。個人利用、非商用利用のみ無料 » Stockcache 数百のクオリティの高い写真集。ライセンスはCreative Commons Attribution License。著作権を明記すれば利用可 » Big Foto たくさんの自然の写真。個人利用で無料 » Free Images 2500以上のクオリティの高い写真集。たくさんのカテゴリーから選べる Looking for free images? Here are thirty sites where you can fi
IT技術を中心に、暮らしに役立つ情報からクラシック音楽の解説まで気軽に情報発信しています。 WEBサイトはhttp://toremoro21.world.coocan.jp/ Twitterは@toremoro21です。 お久しぶりです、仕事があまりにも忙しくて全然Blogを書く余裕がありませんでした。4月からは少しずつ投稿しようと思います。 さて、以前「学術論文とプレゼン資料はWEBで即時公開すべきだ!」というエントリーを書いた後、大きな反響を頂きました。その際にコメント等で色々アドバイスを頂き、必要な手続きをすれば実はWeb上で自分の論文を公開できることがわかりました。 Web上で自分の論文を公開するには、その論文を投稿した学会の著作権規程をチェックする必要があります。その情報をアグリゲートした便利なWebサイトがこれ。 学協会著作権ポリシーデーターベース http://www.tul
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く