タグ

2008年5月10日のブックマーク (12件)

  • ニュースの価値を自分で決める【Choix】

    choix.jp 2021 著作権. 不許複製 The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). プライバシーポリシー

    toton
    toton 2008/05/10
    Digg っぽい ソーシャルニュース
  • Googleの検索ボットに偽装すると有料サイトが無料で閲覧できるらしい - GIGAZINE

    Googleの検索データベースを作成するためにネット中のあらゆるページを収集して巡回している「GoogleBot」というものがあります。このGoogleBotが来ると検索結果に反映されるというわけ。 で、ネット上にいろいろと存在している有料サイトは客を確実に呼び込むため、検索結果に自分のサイトの中身をちょっとだけ表示させるために、なんとGoogleBotは無料で有料サイト内を巡回できるようにしているらしい。 ということは、GoogleBotにブラウザを偽装すればいけるのではないか?というのがこのアイディアなのですが、真相のほどはいかに?詳細は以下の通り。 ※以下からは自己責任でお願いします Disguise Yourself As Google Bot - Quicksilverscreen Forum! 実際に試したわけではないので真偽は不明ですが、要するにブラウザの吐き出す変数の一つで

    Googleの検索ボットに偽装すると有料サイトが無料で閲覧できるらしい - GIGAZINE
    toton
    toton 2008/05/10
  • extbody -- Blog&News本文領域抽出ツール

    ダウンロード等 extbody-0.1.1.tar.gz(右クリックで保存) ライセンスは、Apacheライセンスv2.0なので自己責任でご利用ください。 (上記ファイルはMercurialリポジトリのcloneにもなっています。) 動作に必要な環境 Python2.5 feedparser chardet また、内部でppkfを使用しております。(extbodyに内蔵しております。) インストール feedparserと、chardetをインストールしておきます。 以上が準備できれば、extbodyも以下のコマンドでインストールできます。 % python setup.py install 使用法 ayu@~% python Python 2.5.1 (r251:54863, Jun 17 2007, 08:50:55) [GCC 4.0.1 (Apple Computer,

    toton
    toton 2008/05/10
    "いくつもの経験則を組み合わせた抽出方法によって、80%程度の正解率で抽出できます。"
  • 日本語テキストのトピック分割

    先日からcodereposに置いている自動要約モジュールに、日語テキストのトピック分割のソースをコミットしました。 (->そのソース) このスクリプトでは、与えられた日語のテキストを、トピックごとに分割する機能を提供しています。 基的には論文"Advances in domain independent linear text segmentation"を参考にしています。 この論文では 1. 文ごとにTFベクトルを計算し、 2. そのベクトル間でcos正規化された内積を計算して文間の類似度を算出、 3. 近接する文同士の類似度の変化具合を見て、トピックの変わり目を決定。 という方式をとっています。 ですが、今回の実装では、上記を日語にも適用するためにさらに以下の改良を加えています。 動詞も使うことにした。 日語のテキスト、特にブログの記事などは、名詞だけでなく、「節約する」とか

    toton
    toton 2008/05/10
    [python] "先日からcodereposに置いている自動要約モジュールに、日本語テキストのトピック分割のソースをコミットしました。"
  • Firefox - スマートキーワードをSmarterに : 404 Blog Not Found

    2006年10月09日15:40 カテゴリTips Firefox - スマートキーワードをSmarterに これに触発されて、自分のスマートキーワードに手を入れ直しました。 Elementary, ... 開発マシン(Win/Mac) スマートキーワードを知ってからは、Google検索窓も外して、アドレスバーを広く取っています。まず、スマートキーワードの概要に関してはこちら。 Mozilla Firefox - スマートキーワード スマートキーワード - Mozilla Firefox まとめサイト ただし、上記のサイトでは、仕組みまでは書いていないので解説。 スマートキーワードというのは、むしろ「スマートブックマーク」とでも言うべきもので、設定もブックマークから行います。このうちKeyword:で設定したキーワードをアドレスフィールドに入力、スペースを追加してそのスペース以降の文字列が

  • 自動ログイン用HTML文書 - パソコン遊戯

    はじめに ここで紹介しているHTML文書は、ログインが必要なサイトへアクセスする際にIDやパスワードを入力する手間を省いてしまおうという横着者のために存在しています。横着したい人には多少役に立つはずです。 しかしながら、HTML文書のソースを覗かれるとIDやパスワードが一発でバレてしまうという危険性を孕んでいます。ID/パスワードの管理まで横着することのないようにお願いいたします。 複数の方が利用するパソコンへの導入はオススメできません。というか、導入しないのが身のためです。 利用方法 テキストエディタ(メモ帳等)を起動し、各HTML文書をコピーアンドペーストします。 強調部分(IDとパスワード)をご自分のものに書き換えて名前を付けて保存します。 あとはそのファイルを実行(ダブルクリック)すれば、標準ブラウザが開いて該当サイトにログインした状態でアクセスできます。 「お気に入り」やリンクバ

    toton
    toton 2008/05/10
  • Ready2Search:日本語

    検索名称: ShortName 検索ワードの前: Url-template(prefix) 検索ワードの後: Url-template(suffix) 検索エンジンの説明: Description 追加XMLオプション 入力変換: InputEncoding 無指定 UTF-8 EUC-JP S-JIS 出力変換: OutputEncoding 無指定 UTF-8 EUC-JP S-JIS

  • JavaServer Templates

    最新更新日:2017/03/27 Mayaaとは MayaaはHTMLをベースとしたテンプレートによるプログラマとデザイナの作業分担を強く意識したWEBフロントサービスエンジンです。 (詳しい情報)

  • http://blog.fulltext-search.biz/articles/2008/03/01/jquery-loader-for-greasemonkey

  • スタイリストがトータルコーディネートして2万くらいで送ってくれるサービスが凄い件 - I am Cruby!

    ファッション着るもの困る!服の買物が苦手!ファッションコーディネート買物代行サービスこのサービス凄いっす。 会員登録して自分のサイズを送ると最低2万円くらいで服一式をおくってくれるというサービス。 個人的に服は「ダサくなければどうでもいい」程度なんだが、買いに行くのがすっげーめんどくさい。大体、そんなにファッション好きじゃないのに、絶対に服は着なくちゃいけない訳で、風呂嫌いなのに風呂に入らなきゃって感覚。 2万くらいでファッションに疎い自分が買うより、服が大好きな人に2万渡してそれなりのものを買ってもらった方がいい。 服にこだわりが無い人は、もういっその事服について悩むのは辞めて、このサービスに思いっきり依存すればいいと思う。 私はそうするつもり。

  • Google SpreadsheetsにGreasemonkeyスクリプトとかの出力を保存する � ZeroMemory API

    もともとは普段みてるページにどれくらいメタデータ入ってるのか知りたいからログとりたくて、ログとるのはいいけどバックエンド用意するのめんどい、というのから。Google Spreadsheetsがわりと楽そうでした。 デスクトップアプリケーションですら、クラッシュレポータなんてものがついていて、ネットワーク経由でアプリケーションの異常を送信できるのだから、Greasemonkeyスクリプトでもおんなじことする、とかにも使えます。 記録用のシートを作る シートにカラムは作っておく必要があります。シートに書かれてないパラメータは送ってもシートに記録されません。 キーとワークシートID Google Spreadsheetsのドキュメントは、Excelでいうファイルがキーというもので管理されてて、ExcelでいうシートがworksheetIdというので管理されてます。これを知るのにAPI経由だとめ

  • LDR Full Feedで画像が表示されないときはrefControlを使おう。 - muibrog

    LDR Full Feedが浸透して、はてなRSS版、Google Reader版といずれもLDR版のSITE_INFOに対応したスクリプトが公開されています。 LDR Full Feedもバージョンアップを重ねて、LDR Full Feed 0.0.7では相対リンクを絶対パス化できるようになって、より多くのサイトで画像も見られるようになりました。 なんですが、絶対パスになっているのにも関わらず見られないサイトが結構あります。例えばITmediaなんかがそうなんですが、この「史上最薄のThinkPadは光学ドライブを搭載:大和の技術を結集した“究極のThinkPad”――「ThinkPad X300」発表会」という記事のフィードから全文取得するとこんな風になって画像を見ることができません。 下の方に「og_x300_001.jpg」という文字が見えます。これが画像の代わりに表示されているわ

    LDR Full Feedで画像が表示されないときはrefControlを使おう。 - muibrog