タグ

ブックマーク / futureinsight.hatenadiary.jp (3)

  • Tomblooこそ自分をGoogle化する最強のツール - Future Insight

    ぶっちゃけこの題名は書きたかっただけなのですが、ついこの前行われたFirefoxのアドオンであるTomblooにブラウジングを進化させる革命的な機能が追加され、ブラウンジングを行いながら快適にノーストレスでGoogle Bookmarksに自分の気に入ったページを登録することがだれにでも可能になったのでその方法を紹介したいと思います。まず、ほとんどの人はTomblooというFirefoxのアドオンがなんなのかわからないと思うので、そこから説明します。 Tomblooとは何か Tomblooとはid:brazilさんが作っている自分が現在ブラウジングしているサイトの情報を自分が利用しているWebサービスに投稿、登録、ポストするためのFirefoxのアドオンです。 Google Code Archive - Long-term storage for Google Code Project H

    Tomblooこそ自分をGoogle化する最強のツール - Future Insight
    homajyu
    homajyu 2010/02/03
    ブクマサービスにポスト vimpのプラグインもあったような
  • Webstemmerによるブログの本文抽出 - FutureInsight.info

    Pythonで記載されたレイアウト+diffベースで文抽出を行うWebstemmerを用いてブログの文抽出にチャレンジしました。いつも通り技術エントリーは非常に長いので、興味のある人だけ続きをごらん下さい。 検索エンジンのフロントエンド部分の実装の目処がたったので、次はクローラ、インデクサの実装です。PythonにはTwistedという極めて優秀な非同期Webアプリケーションフレームワークがあるので、クローラを記載することは全く難しくありません。この辺りはPythonクックブックの14章ウェブプログラミングを参照して下さい。Python クックブック 第2版鴨澤 眞夫 當山 仁健 吉田 聡 おすすめ平均 リファレンスとセットで 2.5以降対応版の第3版を Amazonで詳しく見る by G-Toolsさて、クローラ部分の目処は立ったとして、問題はインデクサです。Luxを検索エンジンに使

    Webstemmerによるブログの本文抽出 - FutureInsight.info
  • 全文検索エンジンLuxとPythonの軽量Webアプリケーションフレームワークfapws3で構築する高速検索サービス - FutureInsight.info

    今、手元で検索サービスを作成するためにいろいろ実験をしているのですが、ある程度ノウハウが貯まったので公開しておこうかと思います。長いエントリーになりますので、検索サービスの構築に興味がある人だけ閲覧下さい。 一般的な検索エンジンは主に2つのパートに別れます。一つは、クローラとインデクサからなるデータを収集するバックエンド、もう一つは検索を行うフロントエンドです。クローラとインデックス部分に関してはまだ手元で試しているところなのです紹介できる状態にないのですが、Pythonを用いたフロントエンドに関しましては、だいたいやり方がわかってきたので、ここで公開しておこうと思います。個人レベルが作れそうな検索サービスの構築に興味がある方はよんでいただければ幸いです。 [追記]クローラ部分は時間がかかりそうなので、インデクサ部分を公開しました。 全文検索エンジンLuxのboost-pythonを用いた

    全文検索エンジンLuxとPythonの軽量Webアプリケーションフレームワークfapws3で構築する高速検索サービス - FutureInsight.info
    homajyu
    homajyu 2009/04/20
    Luxとfapws3de
  • 1