タグ

2007年3月17日のブックマーク (17件)

  • iv.xight.org - 情報視覚化

    ■ Information Visualization の用途 情報検索 データ解析 プログラムデバッグ ■ Information Visualization に必要な技法 必要なものだけ表示する技法 画面の表示可能領域に制限 情報を選択的に表示 ズーミング手法・フィルタリング手法・重要度計算手法・画面を歪ませて表示する手法 e.t.c. 全体と詳細を同時に見る技法 全体を概観しながら詳細も見ることが可能 ズーミングの応用 抽象データの画面へのマッピング技法 表示すべきデータがユーザ操作により変化 表示すべき情報をどのような位置,形,色で表示するか グラフの自動配置手法・階層構造の表示手法 e.t.c. 自動レイアウト技法 重なりがちゃんと見えるように グラフの自動配置手法の一つ? インタラクション技法 直接操作によって画面を移動・拡大させたり,条件を変更して動的検索を行ったりする手法

  • Web crawler - Wikipedia

    A web crawler is also known as a spider,[2] an ant, an automatic indexer,[3] or (in the FOAF software context) a Web scutter.[4] A Web crawler starts with a list of URLs to visit. Those first URLs are called the seeds. As the crawler visits these URLs, by communicating with web servers that respond to those URLs, it identifies all the hyperlinks in the retrieved web pages and adds them to the list

    Web crawler - Wikipedia
  • 今日の井原 - 都内某社で開催されたクローラ勉強会のスライドを公開します。

    技術書あげます えろい画像だけモザイク [読書]けなす技術 CatchPhraser(きゃっちふれいざー): スニペットとしてキャッチコピーを表示するblog検索エンジン AdWords appears everywhere! Cマガジン休刊 「オープンソースの全文検索エンジンの速度性能比較」のご紹介 日経コンピュータ誌の特集「IT関連学会の憂」を読んだ googleの新卒採用説明会に申し込んでみたよ [memo]OpenCVの顔認識機能を使う 自分自身をブックマーク Newzingo: tagをベースにGoogle Newsを閲覧するインタフェース Google Tip: "(ダブルクォーテーション)は閉じなくてもOK リンク見出し是非裁判の件 脅かされる人認証

  • 技術書の売上げから見る技術トレンドいろいろ | POP*POP

    Web2.0の提唱者でもあるTim O’Reillyさんがおもしろい分析をしていました。 技術書の売上げを図で可視化しています。前年度と比較して各テクノロジーが上り調子かどうかがわかります。業界内シェアの大きさもつかめますよ。 「これから何の言語を学ぼう?」など考えている人には参考になりそうです。 » O’Reilly Radar > State of the Computer Book Market, Q406, Part 2: Category Winners and Losers 面積と色でデータを表現するTreemapを使っていますね。面積がシェア、色が伸びをあらわしています。緑色のブロックが前年度と比べて伸びているところ、赤色のブロックが減ったところになります。 では、各業界を簡単に見てみましょう。イメージはクリックで拡大します。ではどうぞ! ■ プログラミング&システム管理 一

    技術書の売上げから見る技術トレンドいろいろ | POP*POP
  • .NET TIPS クッキーを使ってWebページを取得するには? - C# VB.NET - @IT

    最近ではユーザーの認証にクッキーを用いているWebサイトは多い(ASP.NETの「フォーム認証」もクッキーを利用している)。稿では、このようなクッキー認証を行っているWebページにプログラムからアクセスする方法について解説する。 クッキー認証を行うWebサイトの仕組み 最初にクッキー認証の仕組みについて簡単にまとめておこう。 たいていの場合、クッキー認証を行っているWebサイトでは、ユーザーは最初にログイン・ページにアクセスし、ユーザーIDやパスワードを入力する。ログインが成功すれば、ブラウザはWebサイトからクッキーを受け取る(クッキーはファイルあるいはメモリ上に保存される)。 以降のページ(認証が必要なページ)へのアクセスには、このクッキーが必要となる。クッキーを持っているユーザーがそれらのページにアクセスすると、ページ取得のリクエストとともにクッキーがWebサイトに送信される。これ

  • AjaxZip 2.0

    Kawa.netxp AjaxZip 2.0 - Ajax郵便番号→住所自動入力フォーム(CGI不要版) AjaxZip2は、昨年公開した 『ajaxな住所入力フォーム』 の新バージョンです。 郵便番号を入力すると、該当する都道府県名・住所が自動的に入力されます。 Ajaxと JSON フォーマットを利用するJavaScriptライブラリとして公開しました。 JavaScript のみで稼動するため、サーバサイドで稼動するCGIプログラムは不要です。 郵便番号→住所変換処理は全てクライアントサイドのJavaScriptで行います。 既存 HTML の住所入力フォームをたった3行書き換えるだけで利用できます。 簡単に設置できるため、プログラムに詳しくない方でも導入していただけると思います。 以下の住所入力フォームに、7桁の郵便番号を入力してみてください。 【2007/12/09 追記】 jQ

  • List of Wikipedias - Meta

    English · Ænglisc · Bahasa Indonesia · Bahasa Melayu · Basa Bali · Bân-lâm-gú · Banjar · català · español · Esperanto · euskara · français · galego · italiano · Jawa · lietuvių · Mirandés · occitan · português · română · Soomaaliga · suomi · Türkçe · vèneto · Zazaki · Ελληνικά · беларуская (тарашкевіца) · български · македонски · հայերեն · अंगिका · नेपाल भाषा · नेपाली · मराठी · हिन्दी · বাংলা · ਪੰ

  • きまぐれ日記: page popularity と page quality と randomness (PageRank 編)

    昨日の話の続きです。よくよく考えてみると、PageRank も無作為性を取り入れたアルゴリズムでした。 PageRank は、Web Page の quality を求める方法の一つです。基的な考え方は、ネットサーファーが ε の確率で無作為に選んだページにジャンプし、1-ε の確率で現在のページ内のリンクを辿ります。サーファがこの手続きを延々と続けていき、定常状態でのページの滞在時間が PageRank です。 このときの ε で無作為のページにジャンプする行為が、無作為性そのものです。 PageRank に似たアルゴリズムとして、Kleinberg の HITS があります。これは、たくさんのリンクを放出する HUB度 と、たくさんのリンクをもらう Authority度 という二つの quality を page に与え、HUB度 の高いページからリンクされると Authority

  • http://chasen.org/~taku/blog/archives/2005/10/popularity_qual.html

  • Tgif WWW Hypertext Home Page

    Tgif (pronounced t-g-i-f) is an Xlib based interactive 2-D drawing tool (using vector graphics) under X11 on Linux and most UNIX platforms (including Mac OS X and cygwin on Windows). Current Release & Download -- Information about current version, anonymous FTP sites, etc. FAQ -- Frequently asked questions about tgif. Copyright -- Information about the open-source releases of tgif under the QPL li

  • 『バッテリ残量モニタ』

    Vine Linux 6.5(あめぶろ) VAIO EシリーズにVine Linux 6.5 をベースシステムのみインストールしてVineSeed化しました。 動いたソフトの記録。ソフト以外もいろいろ。 間違いもあるかもしれません。 いいソフトがあったら教えてください。

    『バッテリ残量モニタ』
  • 83's : MeCab用、2ちゃんねる辞書

    かな漢字変換用の2ちゃんねる辞書を 元に、MeCab用の辞書を作った。 ( ・∀・)つ[2ch.dic.2005-09-11-22-47] 辞書の追加の仕方はMeCabのサイトの辞書の追加方法のページを 見て下さい。 なんかあんまり正確でないんで、動詞・形容詞・接続詞の中で変だったやつは消しました。 それでもまだまだ変な定義されてる語が多い……。 あとコストが今んとこ3206で一律なんだけど、どうなんだろう。 $ mecab こんなスレageるなよ厨房 こんな 連体詞,*,*,*,*,*,こんな,コンナ,コンナ スレ 名詞,一般,*,*,*,*,スレ,スレ,スレ ageる 動詞,自立,*,*,一段,基形,ageる,アゲル,アゲル な 助詞,終助詞,*,*,*,*,な,ナ,ナ よ 助詞,終助詞,*,*,*,*,よ,ヨ,ヨ 厨房 名詞,一般,*,*,*,*,厨房,チュウボう,チュウボう EO

  • きまぐれ日記: キーワード抽出: tf-idf の意味づけ

    単語の重み付けの古典的な方法に tf-idf があります。文書中の各単語の tf-idf 値計算し、値でソートすると、その文書に特徴的な単語リストを得ることができます。 http://nais.to/~yto/clog/2005-10-12-1.html tf-idf は、単なるヒューリスティックスだと考えられていましたが、最近言語モデルに基づく情報検索手法がさかんに研究されるようになり、tf*idf の解釈が明らかになってきました。言語モデルに基づく手法は、ヒューリスティックスばりばりの手法と同性能にもかかわらず、文書のランキングに理論的で合理的な説明を与えることができます。 情報検索は、クエリ q に対し、もっとも適合する文書 d_opt を求めるタスクです。つまり、q が与えられたとき、文書 d が出現する確率 p(d|q) の最大化問題と解釈できます。 d_opt = argmax

  • Combating Web Spam with TrustRank

  • nlp2005.dvi

    ドメイン特徴語の自動取得による Web 掲示板からの意見文抽出 峠 泰成 大橋 一輝 山 和英 長岡技術科学大学 電気系 E-mail:{touge, ohashi, ykaz}@nlp.nagaokaut.ac.jp 1 はじめに 近年、Web には大量の情報が存在しており、多くの情報の 中から有益な情報を発見するテキストマイニング技術が一つ の重要な方法となっている。例えば、企業が自社の製品につい て、消費者がどのような関心をもっているかという情報に対し て注目したり、個人が購入しようとしている製品がどのような 物であるかを検討するために Web を用いることは一般的であ る。このことから、多くの人の興味や関心の集まっている情報 源に対する研究が多くなってきている。 その中でも、Web 掲示板は、個人の興味・関心が一般の Web 文書に比べて、大量に現れる情報源と考えることができる

  • 東大で学んだ卒論の書き方★論文の書き方

    卒業論文の書き方を詳説

  • インタラクション予稿集

    インタラクション論文アーカイブ このページではインタラクション予稿集に掲載された論文を掲載しております. サイトにて公開しているインタラクション予稿集に掲載された論文の著作権は,一般社団法人情報処理学会が所有しています. サイトにて公開している論文以外のビデオ,補足資料,システム等の著作権は,各論文の著者が保有しています.