タグ

2008年5月23日のブックマーク (5件)

  • XML、学びの第一歩 ― @IT自分戦略研究所

    第1回 XML、学びの第一歩 穴沢悦子、木村達哉 2006/7/1 ■開発者の目線でスタートする 「XMLデータ形式を使うメリットを一言で教えてください」とよくいわれるが、XMLという技術は、それを利用する立場によって享受する恩恵が異なるので、この質問の返答はなかなか難しい。 例えばエンドユーザーの場合、「データ形式をXML形式にするかどうか」ということにはあまり関心がないことが多い。たとえXMLが採用されたことによって、よりリアルタイムにかつその場に最も適したフォーマットで情報閲覧ができるようになっていたとしても、一般の利用者はそれでXMLに感謝したりはしない。別にXML以外の技術で実現してくれてもよかったと思っている。 では、なぜXMLがここまで活用されているのか。それは、XMLがシステム開発者に多大な恩恵をもたらしたからだろう。では開発者にどのような恩恵をもたらしたのか。これを説明す

  • zuzara.com » ブログの記事本文を抽出するスクリプトをつくってみた

    ブログ検索において、RSSは必ずしも記事全文を配信していないので、クローラーが記事のURLにアクセスし記事の文を取得するケースが多いようです。 「gooブログ検索」「ブログレンジャー」開発者が語るブログ検索技術Yahoo!検索 スタッフブログ Yahoo!ブログ検索より細部改善のお知らせ上記の記事ではどちらも文を抽出してくる、とあっさり書かれていますが100%に近い精度を実現するとなるとそう簡単ではないはず。 ちょっと調べてみたら以下のような取り組みが論文として読めました。英語圏の文献は、検索語が悪かったのかいまいち。「blog entry extract body text etc…」 NRI 技術創発 ブログ記事の自動分類により消費者意識の側面を捉える試み(PDF)なんでもRSS! HTML文書からのRSS Feed 自動生成 南野朋之 奥村学:人工知能学会研究会資料 SIG-SW

  • [Perl] XML::FeedPP - RSS・RDF・Atomフィードの解析・生成・変換・結合

    Kawa.netxp [Perl] XML::FeedPP - RSS・RDF・Atomフィードの解析・生成・変換・結合 XML::FeedPP モジュールは、 RSS 2.0、RSS 1.0 (RDF)、Atom 0.3(および1.0)フィードの XML ファイルを解析・生成・変換・結合するための Perl モジュールです。 RSS ベースの1種類の共通 APIRSS・RDF・Atom の各フォーマットの処理に対応しているため、 手軽に扱えます。 フィードの読み出し・書き込みはもちろん、 RSSからRDFへ、RDFからAtomへといった各フォーマット間の相互変換も可能です。 他サイトからダウンロードした複数のファイルを結合して、 まとめて1つのファイルとして出力することもできます。 公開版アーカイブ: XML-FeedPP-0.43.tar.gz TARGZ CPAN ←通常パッケ

  • 2016年6月2日をもって「はてなクラブ」のサービス提供を終了いたします - はてなの日記 - 機能変更、お知らせなど

    はてなスタッフのはてなのサービス全般に関する日記です。 人力検索はてなの告知については、人力検索はてなの日記にて行っています。 使い方に関するご質問、不具合報告やご要望は、お問い合わせ窓口で承ります。 使い方のコツなどを知りたい時は、人力検索はてなの「はてなの使い方」カテゴリーをご利用ください。 ※コメント欄へのご質問には対応できない場合がございますのでご了承ください。 2016年6月2日をもって「はてなクラブ」のサービス提供を終了いたします はてなでは、新しいサービスや新機能、新しいデザインなど開発中のサービスをユーザー様にご利用いただき、直接ご意見ご感想をお聞かせいただくためのサービスとして、「はてなクラブ」を提供しておりました。 こちらを、2016年6月2日をもって、サービスの提供を終了させていただきます。これまで、サービス改善にご協力いただき誠にありがとうございました。 また、はて

  • PHP コード最適化 Best Practices 63+ - カタコト日記

    みたいなタイトルの記事を Digg 経由で発見。チートシート代わりにと思い超訳。*1 A Software Architect PHP 最適化 ベストプラクティス! 01. static にできるメソッドは static として宣言しよう。(4倍速い) 02. echo の方が print より速い。 03. echo '文','字'; (カンマ区切り)の方が、'文'.'字' (ドット連結)より速い。 04. ループの最大値は、ループ「内」ではなく「前」にセットしておこう。 05. 大きい配列のような変数は unset() してメモリを解放しよう。 06. マジックメソッド(例: __get, __set, __autoload)は使用を避けよう。 07. require_once はハイコストなのです。 08. include や require でファイルはフルパスで指定しよう。 09

    PHP コード最適化 Best Practices 63+ - カタコト日記