タグ

Webに関するtak-arumakanのブックマーク (11)

  • 語の共起情報を用いたWeb検索

    概要 現在、Web上の莫大な情報の中から、ユーザが必要な情報を 得る手段として検索エンジンが広く用いられている。 各検索エンジンでは、検索結果を順位付けし、 一般的に評価の高いWebページを検索結果の上位と することで効率化を図っている。 しかし、有用であるということは主観的であるため、 一般的に評価の高いページが誰にでも有用であるとは限らない。 研究では、ユーザが入力した検索キーワードと Webページ内に含まれる語との共起性を用いて、 Webページを評価し、さらにユーザからのフィードバックを 得ることで、各ユーザの要求により適合した結果を提示する 検索方法を提案する。 従来手法 重要語抽出の従来手法 多くの自然言語文書処理において用いられている 代表的な手法に tfidf(Term Frequency-Inverse Document Frequency)法 [1][2]がある。 対象

  • ジャストシステム、自然言語処理技術を応用したWebフィルタリングソフト最新版

    ジャストシステムは、自然言語処理技術を活用したWebフィルタリングソフトの最新版「Tri-De WebFilter 2.0」(トリデ ウェブフィルター 2.0)を2010年12月10日発売する。フィルタリング精度を高めたほか、企業・官公庁の要望に応えて不用意な情報発信を防止する機能を強化した。 URLデータベースによるアクセス制限に加え、NLP(自然言語処理)技術を応用して独自開発した「コンテンツフィルター」を使って未知のWebページでも記載内容から的確にフィルタリングを行うソフト。ライセンス専用製品でサーバー上で動作する。 新たに掲示版サイトやSNSなどのソーシャルサイトへの書き込みを制限する「書き込み制御」機能を追加した。情報の閲覧だけを許可したいという企業などのニーズに応えたもので、従来の学校から、企業・官公庁に顧客を拡大することを狙う。 ほかにも、アクセスログやブロックログをもとに

    ジャストシステム、自然言語処理技術を応用したWebフィルタリングソフト最新版
  • 入力フォームでの「郵便番号」の意外な盲点 (ユーザビリティ実践メモ)

    登録や申し込みページの入力フォームにおいて、郵便番号を入力すると住所欄が自動入力される機能は、ユーザの入力負荷を軽減する便利な機能です。実はこの機能、正しく郵便番号を入力してもある条件下ではエラーとなってしまうことがあることをご存知でしょうか。今回は入力フォームでの「郵便番号」の意外な盲点についてご紹介します。 ただ、「会社」で用いられている郵便番号は一般的な郵便番号と異なる場合があります。 郵便番号は、特定の企業(1日の配達量が一定量を超えるような事業所)に対して「大口事業所個別番号」という事業者向けの郵便番号を割り当てており、該当する企業はこの割り当てられた郵便番号を使用しています。 しかし、郵便番号から「住所を自動入力する機能」が参照している郵便番号は必ずしもこの「大口事業所個別番号」に対応しているわけではありません。入力された郵便番号が対応していない「大口事業所個別番号」であった場

  • 深層ウェブ

    tak-arumakan
    tak-arumakan 2009/12/07
    深層ウェブ
  • RSS フィード 自動作成 - goo RSS作成

    サイトを自動的にRSS化するサービスです。IE7やRSSリーダーで読めるRSSフィードを簡単に作成できます。自分のホームページへの誘導ツールとしても使えます。フィードメーカーとは? ■フィードメーカー(β版)とは? サイト内のトピックスや更新情報などからRSSフィード(新着記事リスト)を作成することのできる無料サービスです。サイト内でよく読む記事枠だけを指定してRSSフィードにすることもできます。(作成方法を動画で説明) 作ったフィードをIE7やFireFox、RSSリーダーなどに登録すればそのサイトが更新されたかどうかをすぐにチェックできます。作ったRSSフィードを自分のサイトにリンクさせればサイトへの誘導ツールとしても使えます。 なお、ご利用には無料のgooIDが必要です。  →詳細 ■作ったRSSフィードでクチコミページも作れる! 作成したRSSフィードに関連したブログ記事やQ&A

  • My RSS - あらゆるサイトのRSSを配信 -

    Email パスワード [新規登録] [パスワード?]

  • プログラマが楽しく読めるLink集 Vol.1 - 乱筆乱文お許し下さいorz

    ネットサーフィン(死語)をしていて、プログラマなら誰でも楽しく読めるハズ! と思ったサイトや記事を紹介して行きます。 とりあえず、Vol.1ッ! ハッカーになろう (How To Become A Hacker) 実は、この5つすべて(Python, Java, C/C++, Perl, LISP)を勉強しておくのがいちばんいいのです。 これらはもっとも重要なハッキング用言語だというだけでなく、 それぞれプログラミングに対してまったく違ったアプローチをしているので、どれも非常に有益な勉強となるでしょう。 Rubyは?(´・ω・`)ショボン Fine Software Writings 特に僕が好きな記事を! ホワイの(感動的)Rubyガイド (why the lucky stiff) どうしてプログラマに・・・プログラムが書けないのか? (Jeff Atwood) ソフトウェア開発者のた

  • 2009年9月に最も利用されたWebサイトはMicrosoft,Facebookも4位に

    米調査会社comScoreが実施している世界のWebサイト利用ランキング調査で,米Microsoftのサイトが2009年9月のトップになった。2位は米Google,3位は米Yahoo!。4位は米国のSNS大手Facebook,5位は中国のポータル大手Tencentだった。米国の調査会社comScoreが米国時間11月6日に発表した。 2009年9月の延べ利用時間(表1)は,主要Webサイトの合計で約270億時間となり,前年同月より24%増加した。そのうちMicrosoftサイトの延べ利用時間は39億2000万時間で,利用時間シェアは14.5%となった。Microsoftサイトの述べ利用時間は前年に比べ43%増加している。Microsoftサイトで最も多く利用されたのは「Windows Live Messenger」で,同社サイトの全利用時間の約70%を占めた。 2位のGoogleサイトの延

    2009年9月に最も利用されたWebサイトはMicrosoft,Facebookも4位に
    tak-arumakan
    tak-arumakan 2009/11/09
    なんだかんだいって、ニコニコ動画とか2chとかは英語圏とか中国語圏でのシェアが低いためにここでは上位に来ないのね。
  • Web ブラウザに表示されている画面を直接編集する方法

    これはすごい。Web ブラウザのアドレスバーに以下を入力し Enter すると、 今表示されている内容を直接編集できる。Firefox 3.0.14 と IE8 で出来 ることを確認した。 javascript:document.body.contentEditable='true'; document.designMode='on'; void 0 WEBブラウザーに表示されている画面を直接編集する方法 - sanonosa システム管理コラム集 追記(2009-10-04): 戻す方法はないものかなあ。‘false’ と ‘off’ では出来なかった。 追記(2009-10-17): 「戻す方法」というのは、「編集モードから閲覧モードに戻す方法」のこ とです。端折った書き方ですみませんでした。もう少し楽な方法が見つかっ たので、以下に追記します。 IE では、以下を入力し Enter

    Web ブラウザに表示されている画面を直接編集する方法
  • 「Flash vs. HTML5」という構図がはっきりと見え始めたぞ、と

    業界関係者(特にスマートフォン関係の仕事をしている人たち)少し前からすでに気がついていた話だが、今回のAdobeからの一連のアナウンスメントで明らかになってきた「HTML5対Flash」という構図。とてもワクワクする戦いだ。 ウェブ上のリッチコンテンツという分野でリーダーシップ・ポジションを取りながらも、「無料Flashゲーム」と「ウェブサイトの見栄えをちょっと良くするアイ・キャンディ」というニッチなポジションに一度は追いやられるように見えたFlash(数年前の話)。しかし、動画フォーマットがReal Networks、MicrosoftAppleの三強いの間で中に浮く隙間を付いた戦略で、見事に「ウェブ上のマルチメディアのデファクト・スタンダード」のポジションをがっちりつかんだかに見えるFlash(現在)。しかし、その地位も安泰ではない。 Adobeにとって一番頭の痛い問題はiPhone

  • クローラが招く問題 - 情報集約

    頻繁な訪問をはじめとする「行儀の悪い」クローリングは、Webサイトの管理者らに嫌われます。 2003年ごろ、韓国のNaverRobotがDoSまがいの訪問を繰り返すとして話題になり、 日国内の一部Webサイト管理者らは、韓国割り当てのIPアドレスをまるごとアクセス拒否するという強硬手段に出ました (参考:ipfwとBINDによるNaverRobot対策フィルタ)。 <meta>タグやrobots.txtによる制御を受け入れることはもちろんのこと、 抽出したリンクの解釈などにおいても注意が必要です。当社のクローラ開発過程においても、 まずは人手でチェックしながら実装を検証していますが、 何万件ものURLをクロールしてから初めて見つかる不具合もあり、頭の痛い問題です もうひとつの問題は、キャッシュしたデータを2次利用する際の法的リスクです。 例えばGoogleでは、図書館

    tak-arumakan
    tak-arumakan 2008/07/22
    クローラ
  • 1