ドットインストール代表のライフハックブログ
以前のエントリーで本文抽出ライブラリWebstemmerを使ってみました。 Webstemmerによるブログの本文抽出 - FutureInsight.info Webstemmerは非常に興味深い本文抽出ライブラリなのですが、ニュースサイトなどの複雑な階層構造を持っているサイトの本文抽出に特化しているため、逆にblogのようなシンプルなケースでの本文抽出に用いるには、ちょっとオーバースペックです。 Webstemmer Webstemmer はニュースサイトから記事本文と記事のタイトルをプレインテキスト形式で自動的に抽出するソフトウェアです。サイトのトップページの URL さえ与えれば全自動で解析するため、人手の介入はほとんど必要ありません。 そのあたりのことを考慮して、本文抽出ライブラリWebstemmerのblog本文抽出用特化スクリプト「blogstemmer」を作成してみました。
Google Code Googleは11月10日(米国時間)、Browser Security Handbookを一般公開した。Browser Security HandbookはWebアプリケーションデベロッパやブラウザエンジニア、情報セキュリティ研究者向けの60ページほどの文書で、広範囲におよぶブラウザのセキュリティ機能や特性をまとめたもの。注釈と実装ティップもまとめられており開発にそのまま使える内容になっている。 執筆現在で公開されている文書では次のブラウザが比較としてまとめられている。 Net Applicationsの報告によるブラウザシェアの高い方から順に取り上げているようだ。 Microsoft Internet Explorer 6 (6.0.2900.5512) Microsoft Internet Explorer 7 (7.0.5730.11) Mozilla Fi
こんにちは! やまもと@テスト番長です。 先日マサトさんに教えてもらったのですが、 こんなウェブアプリケーション用のチェックシートがあるそうです。 SECGURU: Web Application Testing cheatsheet なかなか面白いので、軽く日本語にしてみました。(Special thanks to: ジュンヤさん) ※間違ってたらごめんなさい。 1. アプリケーション名とバージョン 2. コンポーネント名 3. 通信プロトコル SSLならばバージョンと暗号方式 4. パラメーターのチェックリスト URLリクエスト URLエンコーディング クエリストリング ヘッダー クッキー フォーム フォーム(Hidden) クライアントサイドのヴァリデーションチェック 使用していない余計なパラメータの存在 文字列長の最大/最小値 連結したコマンド(Concatenate
News [2008/08/18] 重要なお知らせ WebUDA Tuigwaa プロジェクトは、新機能開発を停止することとなりました。 JPCERT 等クリティカルなセキュリティの問題への対応 現リリースに対するメーリングリストのサポート については継続的に行う方針としております。 プロジェクト状況が変わり次第、本ウェブサイト及びメーリングリストにて告知いたします。 開発チームの都合にてご利用の皆様にご迷惑をおかけし、大変申し訳ございません。 [2007/08/27] Tuigwaa ver. 1.0.5 リリース 1.0.5 をリリースしました。 本リリースではバグ修正を行ったリリースとなっています。詳細は リリースノートを ご参照下さい。 なお、本リリースは脆弱性対応を行ったリリースとなっています。 詳細は セキュリティ情報 をご参照ください。 [2007/02/09] Tuigwa
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く