タグ

2014年2月5日のブックマーク (6件)

  • そろそろ Simple HTML DOM Parser を使うのはやめたほうがいい - localdisk

    Simple HTML DOM Parser といえば定番のスクレイピングライブラリで、僕も随分お世話になったわけだけど遅いし重いので Goutte 使ったほうがいいという話です。某サイトをスクレイピングするのに比較したら特にメモリ消費に大きな差がでました。 比較したスクリプトは Github においてありますので自由に使ってください。なおプロファイラは @koriym さんが Qiita にポストしたものを使用させていただきました。 PHPの簡単ベンチマーク プログラム スクレイピング対象のサイトはこのブログにしました。あざといですね。タイトルのリストを出力するプログラムです。 Simple HTML DOM Parser <?php require_once './vendor/autoload.php'; require_once './profiler.php'; $html =

    そろそろ Simple HTML DOM Parser を使うのはやめたほうがいい - localdisk
    okinaka
    okinaka 2014/02/05
  • Easy Automated Snapshot-Style Backups with Rsync

    Easy Automated Snapshot-Style Backups with Linux and Rsync page last modified 2004.01.04 Updates: As of rsync-2.5.6, the --link-dest option is now standard! That can be used instead of the separate cp -al and rsync stages, and it eliminates the ownerships/permissions bug. I now recommend using it. Also, I'm proud to report this article is mentioned in Linux Server Hacks, a new (and very good, in m

  • Radar - O’Reilly

    Now, next, and beyond: Tracking need-to-know trends at the intersection of business and technology AI/ML Few technologies have the potential to change the nature of work and how we live as artificial intelligence (AI) and machine learning (ML). Future of the Firm Everything from new organizational structures and payment schemes to new expectations, skills, and tools will shape the future of the fi

    Radar - O’Reilly
    okinaka
    okinaka 2014/02/05
  • DBの値を自動でJavaオブジェクトに変換するライブラリ「DBUtils」のご紹介

    連載では、サーバーサイドJavaを使って業務アプリケーション開発を行う熱血若手エンジニアのために、面倒な作業が楽になる便利なツールをご紹介します。「定時になったらスマートに帰社してアフター5を存分に楽しみたい!」や「設計書やレビューの準備に煩わされるのは嫌だ、コーディングに集中したい!」などを実現してくれる便利なツールやソフトウエアを、サンプルコードを交えて説明します。 はじめに サーバーサイドJavaによるWebシステムでは、クライアントから受け取ったデータをもとに、データベース上のデータを参照したり、更新したりすることがよくあります。 当は、クラス設計などに時間をたっぷり費やして、効率がよく品質の高いプログラムを書きたいのに、データベースに登録されたたくさんのテーブル/カラムから必要な値をResultSetで受け取り、それをJavaの一つ一つオブジェクトに格納して……など単調な作業

    DBの値を自動でJavaオブジェクトに変換するライブラリ「DBUtils」のご紹介
  • 増えるログ、多様化するログをどう効率的に運用するか

    増えるログ、多様化するログをどう効率的に運用するか:今さら聞けないfluentd~クラウド時代のログ管理入門(1)(1/2 ページ) 仮想化やクラウド化、モバイル化の進展に伴い、管理すべきログが多様化・肥大化しています。そんな中でも効率よく、意味のあるログ管理を実現するツールとして注目されている「fluentd」を、これから始めたい方のために一から解説します。 システムを安定して効率良く運用していくために、ログ管理は欠かせない要素の1つです。仮想化やクラウド化、モバイル化の進展につれてシステムはますます大規模化し、それに伴い管理すべきログが多様化・肥大化する傾向にあります。 fluentdはこういった中でも、効率よく、意味のあるログ管理を実現するために非常に有用なツールです。連載では、fluentdの基と具体的な活用方法を紹介します。 ログ管理の現状と課題 環境の仮想化・クラウド化、さ

    増えるログ、多様化するログをどう効率的に運用するか
  • さくらのクラウドを Vagrant up した - rch850 の上澄み

    Vagrant Sakura Provider を使って、Vagrant でさくらのクラウド使ってみた。これとは別に vagrant-sacloud ってのがあるけど、インストールが楽ってことで Vagrant Sakura Provider を選んだ。 うん、コンパネ使わなくていいのは快適だな。 使うときは一点注意があって、sakura.disk_source_archive に適切な値をいれてやる必要がある。デフォだと Ubuntu 12.04.2LTS-server 64bit の ID として '112500182464' になるんだけど、こいつが古いのかなんなのか使えなくて、代わりに '112500459149' を指定すると動く。つまりはこういうこと。 Vagrant.configure("2") do |config| config.vm.box = "dummy" conf

    さくらのクラウドを Vagrant up した - rch850 の上澄み