タグ

wikipediaとapacheに関するfukudamasa09のブックマーク (2)

  • ウェブスクレイピング - Wikipedia

    ウェブスクレイピング(英: Web scraping)とは、ウェブサイトから情報を抽出するコンピュータソフトウェア技術のこと。通常このようなソフトウェアプログラムは低レベルのHTTPを実装することで、もしくはウェブブラウザを埋め込むことによって、WWWのコンテンツを取得する。ウェブスクレイピングはユーザーが手動で行なうこともできるが、一般的にはボットやクローラ(英: Web crawler)を利用した自動化プロセスを指す。 ウェブスクレイピングは多くの検索エンジンによって採用されている、ボットを利用してウェブ上の情報にインデックス付けを行うウェブインデクシングと密接な関係がある。ウェブスクレイピングではウェブ上の非構造化データの変換、一般的にはHTMLフォーマットからデータベースやスプレッドシートに格納・分析可能な構造化データへの変換に、より焦点が当てられている。また、コンピュータソフトウ

  • Liferay - Wikipedia

    Liferay(ライフレイ)とは、短時間でWebシステムを構築するためのオープンソースのフレームワーク及びそのフレームワークで開発されたポートレット(機能部品)の名称。または、前述ソフトウエアの有償版サプスクリプションを提供している会社の名称[3]。無償のコミュニティ版のフレームワーク及びポートレットのセキュリティパッチ、バッグフィックスなどはコミュニティによって管理/改善されている。 Javaで開発された当ソフトウェアはJBoss, Apache Tomcat[4], WebSphereなど多くのアプリケーションサーバ上で動く。 従来のWebシステムはWebページ単位で開発されていた。それと比較してポートレットによりWebシステムは1Webページ及びWebページ間で共通機能を1機能部品とする。コンテンツ管理システム (CMS)、SNS、グループウェア用のポートレットが提供されているが文書

  • 1