kitanowのブックマーク / 2007年3月17日

iv.xight.org - 情報視覚化

■ Information Visualization の用途情報検索データ解析プログラムデバッグ ■ Information Visualization に必要な技法必要なものだけ表示する技法画面の表示可能領域に制限情報を選択的に表示ズーミング手法・フィルタリング手法・重要度計算手法・画面を歪ませて表示する手法 e.t.c. 全体と詳細を同時に見る技法全体を概観しながら詳細も見ることが可能ズーミングの応用抽象データの画面へのマッピング技法表示すべきデータがユーザ操作により変化表示すべき情報をどのような位置，形，色で表示するかグラフの自動配置手法・階層構造の表示手法 e.t.c. 自動レイアウト技法重なりがちゃんと見えるようにグラフの自動配置手法の一つ？インタラクション技法直接操作によって画面を移動・拡大させたり，条件を変更して動的検索を行ったりする手法

kitanow 2007/03/17

リンク

Web crawler - Wikipedia

A web crawler is also known as a spider,[2] an ant, an automatic indexer,[3] or (in the FOAF software context) a Web scutter.[4] A Web crawler starts with a list of URLs to visit. Those first URLs are called the seeds. As the crawler visits these URLs, by communicating with web servers that respond to those URLs, it identifies all the hyperlinks in the retrieved web pages and adds them to the list

kitanow 2007/03/17

リンク

今日の井原 - 都内某社で開催されたクローラ勉強会のスライドを公開します。

技術書あげますえろい画像だけモザイク [読書]けなす技術 CatchPhraser(きゃっちふれいざー): スニペットとしてキャッチコピーを表示するblog検索エンジン AdWords appears everywhere! Cマガジン休刊「オープンソースの全文検索エンジンの速度性能比較」のご紹介日経コンピュータ誌の特集「IT関連学会の憂鬱」を読んだ googleの新卒採用説明会に申し込んでみたよ [memo]OpenCVの顔認識機能を使う自分自身をブックマーク Newzingo: tagをベースにGoogle Newsを閲覧するインタフェース Google Tip: "(ダブルクォーテーション)は閉じなくてもOK リンク見出し是非裁判の件脅かされる本人認証

kitanow 2007/03/17

リンク

技術書の売上げから見る技術トレンドいろいろ | POP*POP

Web2.0の提唱者でもあるTim O’Reillyさんがおもしろい分析をしていました。技術書の売上げを図で可視化しています。前年度と比較して各テクノロジーが上り調子かどうかがわかります。業界内シェアの大きさもつかめますよ。「これから何の言語を学ぼう？」など考えている人には参考になりそうです。 » O’Reilly Radar > State of the Computer Book Market, Q406, Part 2: Category Winners and Losers 面積と色でデータを表現するTreemapを使っていますね。面積がシェア、色が伸びをあらわしています。緑色のブロックが前年度と比べて伸びているところ、赤色のブロックが減ったところになります。では、各業界を簡単に見てみましょう。イメージはクリックで拡大します。ではどうぞ！ ■ プログラミング&システム管理一

kitanow 2007/03/17

リンク

.NET TIPS クッキーを使ってWebページを取得するには？ - C# VB.NET - ＠IT

最近ではユーザーの認証にクッキーを用いているWebサイトは多い（ASP.NETの「フォーム認証」もクッキーを利用している）。本稿では、このようなクッキー認証を行っているWebページにプログラムからアクセスする方法について解説する。クッキー認証を行うWebサイトの仕組み最初にクッキー認証の仕組みについて簡単にまとめておこう。たいていの場合、クッキー認証を行っているWebサイトでは、ユーザーは最初にログイン・ページにアクセスし、ユーザーIDやパスワードを入力する。ログインが成功すれば、ブラウザはWebサイトからクッキーを受け取る（クッキーはファイルあるいはメモリ上に保存される）。以降のページ（認証が必要なページ）へのアクセスには、このクッキーが必要となる。クッキーを持っているユーザーがそれらのページにアクセスすると、ページ取得のリクエストとともにクッキーがWebサイトに送信される。これ

kitanow 2007/03/17

C#
mixi

リンク

AjaxZip 2.0

Kawa.netxp AjaxZip 2.0 - Ajax郵便番号→住所自動入力フォーム（CGI不要版） AjaxZip2は、昨年公開した『ajaxな住所入力フォーム』の新バージョンです。郵便番号を入力すると、該当する都道府県名・住所が自動的に入力されます。 Ajaxと JSON フォーマットを利用するJavaScriptライブラリとして公開しました。 JavaScript のみで稼動するため、サーバサイドで稼動するCGIプログラムは不要です。郵便番号→住所変換処理は全てクライアントサイドのJavaScriptで行います。既存 HTML の住所入力フォームをたった3行書き換えるだけで利用できます。簡単に設置できるため、プログラムに詳しくない方でも導入していただけると思います。以下の住所入力フォームに、7桁の郵便番号を入力してみてください。【2007/12/09 追記】 jQ

kitanow 2007/03/17

リンク

List of Wikipedias - Meta

English · Ænglisc · Bahasa Indonesia · Bahasa Melayu · Basa Bali · Bân-lâm-gú · Banjar · català · español · Esperanto · euskara · français · galego · italiano · Jawa · lietuvių · Mirandés · occitan · português · română · Soomaaliga · suomi · Türkçe · vèneto · Zazaki · Ελληνικά · беларуская (тарашкевіца) · български · македонски · հայերեն · अंगिका · नेपाल भाषा · नेपाली · मराठी · हिन्दी · বাংলা · ਪੰ

kitanow 2007/03/17

wikipedia

リンク

きまぐれ日記: page popularity と page quality と randomness (PageRank 編)

昨日の話の続きです。よくよく考えてみると、PageRank も無作為性を取り入れたアルゴリズムでした。 PageRank は、Web Page の quality を求める方法の一つです。基本的な考え方は、ネットサーファーが ε の確率で無作為に選んだページにジャンプし、1-ε の確率で現在のページ内のリンクを辿ります。サーファがこの手続きを延々と続けていき、定常状態でのページの滞在時間が PageRank です。このときの ε で無作為のページにジャンプする行為が、無作為性そのものです。 PageRank に似たアルゴリズムとして、Kleinberg の HITS があります。これは、たくさんのリンクを放出する HUB度と、たくさんのリンクをもらう Authority度という二つの quality を page に与え、HUB度の高いページからリンクされると Authority

kitanow 2007/03/17

リンク

http://chasen.org/~taku/blog/archives/2005/10/popularity_qual.html

kitanow 2007/03/17

search

リンク

Tgif WWW Hypertext Home Page

Tgif (pronounced t-g-i-f) is an Xlib based interactive 2-D drawing tool (using vector graphics) under X11 on Linux and most UNIX platforms (including Mac OS X and cygwin on Windows). Current Release & Download -- Information about current version, anonymous FTP sites, etc. FAQ -- Frequently asked questions about tgif. Copyright -- Information about the open-source releases of tgif under the QPL li

kitanow 2007/03/17

リンク

『バッテリ残量モニタ』

Vine Linux 6.5(あめぶろ) VAIO EシリーズにVine Linux 6.5 をベースシステムのみインストールしてVineSeed化しました。動いたソフトの記録。ソフト以外もいろいろ。間違いもあるかもしれません。いいソフトがあったら教えてください。

kitanow 2007/03/17

linux

リンク

83's : MeCab用、2ちゃんねる辞書

かな漢字変換用の2ちゃんねる辞書を元に、MeCab用の辞書を作った。（　・∀・）つ[2ch.dic.2005-09-11-22-47] 辞書の追加の仕方はMeCabのサイトの辞書の追加方法のページを見て下さい。なんかあんまり正確でないんで、動詞・形容詞・接続詞の中で変だったやつは消しました。それでもまだまだ変な定義されてる語が多い……。あとコストが今んとこ3206で一律なんだけど、どうなんだろう。 $ mecab こんなスレageるなよ厨房こんな連体詞,*,*,*,*,*,こんな,コンナ,コンナスレ名詞,一般,*,*,*,*,スレ,スレ,スレ ageる動詞,自立,*,*,一段,基本形,ageる,アゲル,アゲルな助詞,終助詞,*,*,*,*,な,ナ,ナよ助詞,終助詞,*,*,*,*,よ,ヨ,ヨ厨房名詞,一般,*,*,*,*,厨房,チュウボう,チュウボう EO

kitanow 2007/03/17

2ch
MeCab

リンク

きまぐれ日記: キーワード抽出: tf-idf の意味づけ

単語の重み付けの古典的な方法に tf-idf があります。文書中の各単語の tf-idf 値計算し、値でソートすると、その文書に特徴的な単語リストを得ることができます。 http://nais.to/~yto/clog/2005-10-12-1.html tf-idf は、単なるヒューリスティックスだと考えられていましたが、最近言語モデルに基づく情報検索手法がさかんに研究されるようになり、tf*idf の解釈が明らかになってきました。言語モデルに基づく手法は、ヒューリスティックスばりばりの手法と同性能にもかかわらず、文書のランキングに理論的で合理的な説明を与えることができます。情報検索は、クエリ q に対し、もっとも適合する文書 d_opt を求めるタスクです。つまり、q が与えられたとき、文書 d が出現する確率 p(d|q) の最大化問題と解釈できます。 d_opt = argmax

kitanow 2007/03/17

リンク

Combating Web Spam with TrustRank

kitanow 2007/03/17

paper

リンク

nlp2005.dvi

ドメイン特徴語の自動取得による Web 掲示板からの意見文抽出峠泰成大橋一輝山本和英長岡技術科学大学電気系 E-mail:{touge, ohashi, ykaz}@nlp.nagaokaut.ac.jp 1 はじめに近年、Web には大量の情報が存在しており、多くの情報の中から有益な情報を発見するテキストマイニング技術が一つの重要な方法となっている。例えば、企業が自社の製品について、消費者がどのような関心をもっているかという情報に対して注目したり、個人が購入しようとしている製品がどのような物であるかを検討するために Web を用いることは一般的である。このことから、多くの人の興味や関心の集まっている情報源に対する研究が多くなってきている。その中でも、Web 掲示板は、個人の興味・関心が一般の Web 文書に比べて、大量に現れる情報源と考えることができる

kitanow 2007/03/17

paper

リンク

東大で学んだ卒論の書き方★論文の書き方

卒業論文の書き方を詳説

kitanow 2007/03/17

リンク

インタラクション予稿集

インタラクション論文アーカイブこのページではインタラクション予稿集に掲載された論文を掲載しております．本サイトにて公開しているインタラクション予稿集に掲載された論文の著作権は，一般社団法人情報処理学会が所有しています．本サイトにて公開している論文以外のビデオ，補足資料，システム等の著作権は，各論文の著者が保有しています．

kitanow 2007/03/17

論文

リンク

はてなブックマーク

タグ

2007年3月17日のブックマーク (17件)

iv.xight.org - 情報視覚化

Web crawler - Wikipedia

今日の井原 - 都内某社で開催されたクローラ勉強会のスライドを公開します。

技術書の売上げから見る技術トレンドいろいろ | POP*POP

.NET TIPS クッキーを使ってWebページを取得するには？ - C# VB.NET - ＠IT

AjaxZip 2.0

List of Wikipedias - Meta

きまぐれ日記: page popularity と page quality と randomness (PageRank 編)

http://chasen.org/~taku/blog/archives/2005/10/popularity_qual.html

Tgif WWW Hypertext Home Page

『バッテリ残量モニタ』

83's : MeCab用、2ちゃんねる辞書

きまぐれ日記: キーワード抽出: tf-idf の意味づけ

Combating Web Spam with TrustRank

nlp2005.dvi

東大で学んだ卒論の書き方★論文の書き方

インタラクション予稿集

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス