タグ

webとあとで読むに関するttakezawaのブックマーク (19)

  • ブラウザフィンガープリント、その凄さ〜Torブラウザアクセスの識別可能性まで〜

    フィンガープリントとはブラウザフィンガープリント技術(以下、FP技術)とは、文字通り、ブラウザの指紋を使ってブラウザをサーバ側で識別する技術です。 ここでの「識別」とは、同一ブラウザからのアクセスを同一ブラウザからのアクセスと判定し、違うブラウザからのアクセスは違うと判断することを言っています(図1)。 図1 フィンガープリントの識別の概念よく誤解される方がおりますが、これはあくまでサーバ側での識別です。(追記:「Torブラウザがどのサイトへ接続しているのか?」を識別するWebサイトフィンガープリントとも違います)また、どこの誰がアクセスしているのかというように、利用者を特定しているわけでもありませんのでご注意ください。 クッキーによる識別をご存知の方には、「クッキーによるセッション管理やトラッキングでの識別と同じです」と説明した方が分かりやすいでしょうか。FP技術自体は、クッキーの代替技

    ブラウザフィンガープリント、その凄さ〜Torブラウザアクセスの識別可能性まで〜
  • Natural Language Processing with Python – Analyzing Text with the Natural Language Toolkit

    Natural Language Processing with Python – Analyzing Text with the Natural Language Toolkit Steven Bird, Ewan Klein, and Edward Loper This version of the NLTK book is updated for Python 3 and NLTK 3. The first edition of the book, published by O'Reilly, is available at http://nltk.org/book_1ed/. (There are currently no plans for a second edition of the book.) 0. Preface 1. Language Processing and P

  • 私のブックマーク「Web構造マイニングとWeb視覚化」

    1.はじめに Webデータにおけるパターン発見をデータマイニング技術を用いて行なうこと をWebマイニングと呼ぶ。Webマイニングは、自然言語処理や機械学習、データ マイニングなどの人工知能の分野にとどまらず、情報検索やデータベースなど 幅広い分野と関連する複合的な研究分野である。 注目するWebデータの種類によって、Webマイニングは以下の3つに分類される。 1) Webページのコンテンツに注目し、自然言語処理やデータベースのアプローチを用いて、 テキストマイニングによる情報抽出や半構造データにおける検索のモデル化などを 目指すWeb内容マイニング 2) Webページ間を結ぶハイパーリンクによって構成されるグラフ構造に注目し、 関連ページの発見や重要ページのランキング、グラフ構造のモデル化などを 目指すWeb構造マイニング 3) Webページの閲覧によって生じる(サーバー側やクライアント

  • 新米Web担当者もこれで安心!8つのステップで始める実践アクセス解析(前半) | Web担当者Forum

    この記事で解説しているステップ 健康診断:サイト全体の状況をおおざっぱにつかむ来訪理由チェック:来訪元をつかんで集客のヒントを得る入り口チェック:最初に見られるページから改善のヒントを得る離脱率の改善:訪問者を逃がしているページを動線から見つける次回の記事で解説するステップ コンバージョンの測定:サイトの役割を金額に換算して考えるダッシュボード機能の活用:毎日見るレポートを楽に管理するエクセルでレポート:上司への報告書をテンプレートでつくるさらに詳しい解析:アクセス解析コンサルティングを受ける ステップ1 健康診断: サイト全体の状況をおおざっぱにつかむアクセス解析で毎日見るのはサイトの状況を知るため。健康診断でいうと毎朝の血圧チェックのようなもの。毎日のチェックは簡単にすませよう。サイトの全体的な状況をおおざっぱにつかめばそれでいい。このための指標は次のたった2つだ。 総ページビュー数

    新米Web担当者もこれで安心!8つのステップで始める実践アクセス解析(前半) | Web担当者Forum
  • 基盤が整い普及期に入るセマンティックWeb ― @IT

    2007/11/09 「一時期話題になったセマンティックWebは一度沈静化した。しかし、研究開発は脈々と続けられていた。そして多くの人が知らないうちに、2008年には普及期の入り口に入ろうとしている」。野村総合研究所が11月9日に開催した「ITロードマップセミナー――企業情報システムは5年後こう変わる!」で講演した同社技術調査部 上級研究員の田中達雄氏は、そう語る。 「セマンティックWeb」は「Web 2.0」が騒がれるようになる以前の1990年代後半、XMLとほぼ同時期に登場した次世代インターネットのあり方を指す概念だ。Webの生みの親で、現在もW3Cの理事を務めるティム・バーナーズ=リー氏は2000年代初頭に盛んにビジョンを語った。 セマンティックWebを実現するために必要な技術の標準化や辞書の整備に長い時間がかかったため、「セマンティックWebというのは、求心力を失いつつあったW3C

  • 高木浩光@自宅の日記 - 無線LANのMACアドレス制限の無意味さがあまり理解されていない

    ■ 無線LANのMACアドレス制限の無意味さがあまり理解されていない 職業マスメディアに代わって、ブログスタイルのニュースサイトが人気を博す時代になってきた。海外の話題を写真の転載で紹介する安直なニュースも人気だ。 このことろなぜか、無線LANのセキュリティ設定について書かれた記事を何度か見た。おそらく、ニンテンドーDSがWEPしかサポートしていないことが不安をもたらしている(そして実際に危険をもたらしている)ためだろうと思われる。 セキュリティの解説が増えてきたのはよいことなのだが、内容に誤りのあるものが少なくない。 実は危険な無線LAN, らばQ, 2007年10月21日 この記事には次の記述があるが、「接続されなければMACアドレスは盗まれない」という誤解があるようだ。 MACアドレスというのは、機器固有のIDのようなものです。たいていの無線LANアクセスポイントにはMACアドレスフ

  • Webサイトは近いうちになくなる--インターネットへのアクセス方法の変化

    ウェブサイトはHTMLをブラウザが描画して見るもの、と思っていた時代がそろそろ終わりに近づいている。 ウェブ標準が提唱され、HTMLはXHTML+CSSとなり、今までソースを汚していたTABLEタグ、イメージ情報等は排除され、HTML自体が純粋にデータと意味のみ記載されたマーキングアップテキストになってきている。 利点でもあり欠点でもあるのだが、wwwに公開されているもの、というのは基的には全て「もっていく事が可能なデータ」である。いままでも、正規表現等を駆使して、目的のサイトをスクリーニングする事ができたのだが、各サイトによりバラツキがあり、統一のフォーマットというものがなかった。 しかしホームページの多くがブログ化されたことにより、今多くのウェブサイトは一定のフォーマットにより決められた書き方をされている。 上記したようにHTMLがデザインを切り離し、フォーマット化されたことにより、

    Webサイトは近いうちになくなる--インターネットへのアクセス方法の変化
  • クールなURIは変わらない -- Style Guide for Online Hypertext

    クールなURIとは? クールなURIとは変わらないもののこと。 どんなURIが変わってしまう? URIは変わらない:人がそれを変更するのだ。 理屈の上では、人々がURIを変更するべき(もしくはドキュメントのメンテナンスをやめてしまう)理由は全くありません。しかし、現実には山ほど理由があります。 理論上では、ドメイン名空間の所有者はその空間を所有しており、したがってその中に含まれるURIも所有権を持ちます。ドメイン維持料が支払えない場合を除いて、その名前を保有し続けることを妨げるものはありません。そして理論上は、あなたのドメイン名のもとにあるURIは、完全にあなたの管理下にあり、望む限りそれを安定的に保つことができるのです。 ウェブからあるドキュメントが消えてしまう唯一の納得できる理由は、そのドメイン名を保持していた会社が廃業してしまうか、サーバーを維持できなくなったという場合ぐらいでしょう

  • 進化する“Webスクレイピング”技術の世界 ― @IT

    2007/02/20 WebサービスAPIRSSフィードを使って複数サイトのサービスや情報をマッシュアップ――。これはWeb2.0が包含するいくつかの概念のうち、最も重要なものの1つだ。Amazon.comやGoogleYahoo!楽天といった大手Webサイトは、RESTやSOAPを用いたAPIを公開しており、さまざまなサービス提供者や個人がAPIを通して各種サービスを利用している。その一方、世の中のWebサイトの大多数はWeb1.0的なHTMLCGIフォームしか提供していないのが現実だ。こうした背景からWeb1.0サイトから構造化されたデータを引っ張り出す“Webスクレイピング技術が急速に発展してきているようだ。 HTMLをXML化し、XPathで関連データだけを抽出 例えば価格情報サイトでは製品名から価格が簡単に調べられるが、Webサーバから提供されるのは、製品名や価格にレ

  • CSS セレクタに関するおさらい | WWW WATCH

    CSS を扱う上でセレクタの存在はとっても重要です。特に CSS3 Selectors ではかなり複雑な条件分岐ができるようになっていますので、スマートな (X... CSS を扱う上でセレクタの存在はとっても重要です。特に CSS3 Selectors ではかなり複雑な条件分岐ができるようになっていますので、スマートな (X)HTMLCSS コーディングを行う上で、セレクタを理解しているとそうでないのでは生産性に差が出ます。 CSS3 は現在 Working Draft の段階ですので、まだ正式な勧告はなされていませんが、多くのモダンブラウザにおいてそのほとんどが先行実装されていることから、現状でも利用価値が高いといえます。 ということで、ここでは自分へのメモの意味も込めて、CSS3 で定義されているものも含めた各 CSS セレクタについてリファレンスしてみようと思います。 今回の解説

    CSS セレクタに関するおさらい | WWW WATCH
  • プログラマでも出来るWebデザイン - Blog.37to.net

    home blog labs about contact プログラミング・開発 > プログラマでも出来るWebデザイン (X)HTML CSS テンプレート デザイン 画像 作成: 2007-01-08T01:58:41+09:00 更新: 2009-04-29T09:48:31+09:00 年始早々に大幅リニューアルした当ブログですが、リニューアルのお知らせでも書いた通り、 今回のデザインリニューアルに当たっての作成過程や、使ったツールを書いていきます。 デザインセンスの無い私にとって、今回のリニューアルは良く出来たと自負しているので、 お題はプログラマでも出来るWebデザイン。 前提として、CSSでコーディングが出来て、ある程度HTMLは設計出来る、でもデザインは・・・orz な人を対象にしています。 使用したツール・サイト一覧 作成過程は後半に書くとして、今回使用したサイト・ツールで

  • 5xx Error | Cloudflare

    Something went wrong (but it’s not your fault) Log into the Cloudflare dashboard. Ensure the website you want to update is selected. Click the DNS app. Scroll down to Custom Nameservers. Click Add Custom Nameservers and enter nameserver hostnames. (e.g. ns1, ns2, ns3). Cloudflare will assign IPv4 and IPv6 to your nameservers. Add the Custom Nameservers and IP addresses to your domain registrar’s D

    5xx Error | Cloudflare
    ttakezawa
    ttakezawa 2007/01/04
    カテゴリー別 2006年のWeb2.0 ベストサイト やっぱり際立ってるのはYouTubeかなあ というか知らないのいっぱいある、やばい
  • Google流プログラミングの真髄を筑波大学で見てきた:CodeZine

    開催概要 12月14日、「つくばコンピュータサイエンス産学オープンカレッジ 第4回」が筑波大学で開催された。同大学のシステム情報工学研究科コンピュータサイエンス専攻が主催するイベントで、各産業界の協力を得てIT技術の最新動向を解説というもの。 今回は「Google流プログラミング」と題し、Googleを代表するAPIのキーパーソンをエンジニアリングチームから招聘し、主要APIMaps、Desktop、Gadget)の紹介と、Google社の紹介が行われた。世話人の加藤和彦教授によると、今回の講演は聴衆の関心が特に高く、用意した110席は30~40倍の倍率で、直ちに満席となったという。 講演は次の流れで行われた。Google Maps APIGoogle Gadgets APIGoogle Desktop SDKGoogleの会社紹介 Google Map API まず、Chris A

  • 第1回 WebサービスAPI+マッシュアップことはじめ

    Web 2.0の要素として,「マッシュアップ(mash up)」という言葉がよく聞かれるようになりました。マッシュアップとは,複数のWebサービスを融合して,新しいサービスとして提供する形態を指します。コンテンツ・ホルダーがWebサービスとして自社データの提供を拡大してくる中で,マッシュアップによって新たな価値を生み出す場が広がってきました。 この「マッシュアップ・ラボ」では,WebサービスAPIやマッシュアップ技術の最新動向と,マッシュアップ・サイト構築の要素となる各社のAPIの具体的な使い方についてサンプル・コードを交えて紹介していきます。 1回目となる今回は,まずWebサービスAPIとマッシュアップについて簡単におさらいすることにします。 1000以上のマッシュアップ・サイトが登場 この1年で,スクロール地図を利用したサイトがとても増えてきました。不動産業者の物件地図,飲店の情報マ

    第1回 WebサービスAPI+マッシュアップことはじめ
  • 【ハウツー】サイトマップで検索エンジンフレンドリーなサイト - Sitemaps 0.90 XMLファイルの書き方 (1) Sitemaps XMLファイル規約 | エンタープライズ | マイコミジャーナル

    GoogleYahoo!Microsoftの3社によるSitemaps 0.90のサポートが表明された。同プロトコルを使うと効率よく自サイトを検索サイトに登録することができる。3大検索エンジンによってサポートされたことを機に、簡単に説明しておこう。 1 Sitemaps XMLファイル規約 Sitemaps XMLファイルは単純なXMLファイルだが、いくつか気をつける点がある。特につぎの点に注意されたい。 Sitemaps XMLファイルはUTF-8で保存する必要がある。XMLファイルの定義にもUTF-8であることを明記する XMLファイルに含まれるデータとしての文字列は、エンティティエスケープコードを使って表記する必要がある URLはURLエスケープを使って表記される必要がある(たとえば非アスキー文字を使っての表記がある場合、そのサーバが採用しているエンコーディングをURLエスケープ

  • WEB2.0がRubyを選んだ理由:ITpro

    WEB2.0がRubyを採用した。ただし今回紹介するWEB2.0は,デジタルガレージ,ぴあ,カカクコムの合弁会社である株式会社WEB2.0(ウェブツーポイントオー)である。昨年末に設立された同社は,初のサービスである「PingKing」のほとんどを,オープンソースのオブジェクト指向プログラミング言語RubyとそのWebフレームワークRuby on Railsを用いて開発した。1割程度のPHP部分を除けば残りはすべてRuby on Railsである。現在ベータ公開中だ。 そして今,RubyRuby on Railsが,海外のWeb 2.0的とされるサービスの開発に多数利用されていることも事実である(Ruby on Rails公式サイトの利用サイトリスト)。 なぜインターネット上の新サービス開発競争に,JavaPHPではなくRubyが選ばれたのか。その理由が,PingKingの開発事例に典

    WEB2.0がRubyを選んだ理由:ITpro
    ttakezawa
    ttakezawa 2006/09/17
    RailsでWeb開発
  • Googleサービスの使い方!

    ※以下、全ての新着を紹介すると膨大なので、追加した主要リンクのみの紹介。 5/30: Googleツールバー用 カスタムボタン工房 5/28: Googleイメージ検索で「顔写真」や「ニュース画像」を限定検索! 5/28: YouTubeプレイヤーに3つの新機能! 5/25: Google Calendarがついに携帯に対応! 日語対応も。 5/25: Google 翻訳に言語横断検索登場! 5/24: Googleが「Adsense For Video」テスト開始 5/24: GoogleがFeedburner買収へ 5/23: 今ホットな話題が分かる「Google Hot Trends」公開 5/23: Googleカレンダーをオフラインで使う方法

  • あなたの中で 「うわっ!こんなサービスウェブで無料公開してる.. - 人力検索はてな

    あなたの中で 「うわっ!こんなサービスウェブで無料公開してるの?」 「今まで、お金払ってたけど、実は無料で提供しているサイトあったんだ・・」 というように下記のように無料で役に立つ『ウェブサービス』を 提供しているとっておきのサイトを教えてください。 回答はできるだけたくさんあると嬉しいです。びっくりさせてください!! 例) http://www.seoseo.net/ (検索キーワードチェックツール) http://symy.jp/ (長いURLを短く圧縮してくれるサービス) http://www.remindermailer.com/ (未来の自分にメールを送れる) http://htmllint.itc.keio.ac.jp/htmllint/htmllint.html (HTML文書の文法をチェックし、採点します) など、自分の中で役に立ってたらOKです!! みんなで紹介しあう形で

    ttakezawa
    ttakezawa 2006/09/16
    すごいもんだ
  • 中小企業のインハウスSEO担当者に適任なのは誰か

    ウェブサイトからの新規の問い合わせを増やしたい中小企業経営者が自分でSEO(検索エンジン最適化)を実施する方法と手順の総合的なガイドです。SEO初心者でも、予算がなくても、時間と労力さえかければ確実にSEOで上位表示できる方法を、できるだけ簡単に、わかりやすくお伝えします。 SEOは自分でできるSEO(検索エンジン最適化)は自分でできます。問い合わせの獲得を目標とする中小企業のサイトであれば、経営者または後継者が自分で取り組むことで十分な結果を出すことが可能です。確立された必勝パターンが存在しますので、このページで紹介する手順に沿って実施していくだけです。特別な知識や技能は必要ありません。 SEOは見込み客のほうから自発的にあなたの情報を求めて訪問してくれる集客手法です。あなたが持っている職務上の専門知識をコンテンツとしてウェブサイトに掲載すれば、それを必要とし探し求めている見込み客が、あ

    中小企業のインハウスSEO担当者に適任なのは誰か
  • 1