# -*- coding: utf-8 -*- require 'nokogiri' # HTMLページのロード ############################ # # 文字列の場合 html ="<html>...</html>" doc = Nokogiri::HTML(html) # fileの場合 File.open("test.html") do |f| doc = Nokogiri::HTML(f) end # webページの場合 open-uri利用 require 'open-uri' doc = Nokogiri::HTML(open('http://mukaer.com')) # xml doc = Nokogiri::XML(open('http://mukaer.com/atom.xml')) # 要素の検索 #######################
スクレイピングのチュートリアルを書いてみた。 参考:http://nokogiri.rubyforge.org/nokogiri/Nokogiri.html まだまだたくさんのクラスやメソッドがあるが(読んでない)、HTMLのスクレイピングに限定すれば多分これくらいで十分。 2014-02-16追記 なんかたくさんブックマークされていることに気づいたので、サンプルコードのRuby1.9/2対応のアップデート。 Mechanize周りも修正。WWW::Mechanize → Mechanize 等 (0) 前提知識 Ruby、HTML、DOM、CSSセレクタまたはXPath (1) クラス構造の理解 Nokogiri::HTML::Document < Nokogiri::XML::Document < Nokogiri::XML::Node < Object Nokogiri::XML::
実行環境としては、KURO-BOX上で動作するPHP-4.4.4にPEARのXML_RPCパッケージ1.5.0を別途インストールして動作させています。XML_RPCパッケージは標準では含まれていないようです。 ちなみに、PHPでのXML-RPCの実装はいくつかあるようです。WordPressでは、IncutioのXML-RPCライブラリが使われているようです。 つぎに、PHPでXML-RPCのサーバとクライアントを作成します。以下のサイトの情報を参考にしています。 参考:PHPを用いたXML-RPCの基礎 以下のserver.phpとclient.phpを同一のサーバ、同一フォルダに置いて、client.phpにアクセスすると、server.phpとの通信結果が表示されます。自分的な肝としては、以下の赤字の部分です。通常、XML-RPCでは複数のメソッドが定義されているはずなので、foo1
XML-RPCを使ってWordPressに記事投稿しようと思って色々ググッたら古い情報ばっかりで、v3.4で追加されたAPIを使ってる例があまりに少なかったのでAPIドキュメントとにらめっこしながらクラスを作ってみました。XML-RPCを使ってWordPressに記事投稿しようと思って色々ググッたら古い情報ばっかりで、v3.4で追加されたAPIを使ってる例があまりに少なかったのでAPIドキュメントとにらめっこしながらクラスを作ってみました。 対応環境 PHP5.3+, WordPress3.4+, PEAR::XML_RPC 使い方 基本的に$wp->newPost($data)するだけで設定したアイキャッチ画像を自動でアップロードしたり、存在しないタグ・カテゴリ(Term)などが指定されていた場合は自動で作成したりしてくれるのでこのメソッド1つでほとんど問題なく投稿できちゃいます。 送信
何番煎じだかわかりませんが,備忘録として.XML-RPCを使って,スクリプトからWordpressに記事を投稿しまくる方法です.参考にしたのは以下のエントリ. [WordPress] XML-RPC を使用する方法 | Sun Limited Mt. 見ればわかりますが,プログラミング言語はPHPです.まずは,何はなくとも,PHPでXML-RPCを扱えないといけないので,PEARからインストールします. # pear install XML_RPC 続いて,これもサンプルコードそのままなので,深く考えずに,書いていきます.ところが,どっこい!このエントリではカスタムフィールドの扱い方が説明されていません.なんてこったい!これは困りました.今回はカスタムフィールドに値を入れられないと,ものごっつ面倒くさいことになるような件数を突っ込むのです.ですので,どうしてもXML-RPCでやりたいので,
pearの「XML_RPC」モジュールをインストールしておきます。 # pear install XML_RPC ソースはこんな感じ。 $host = "xxx.yyyyy.zzz"; // WordPressのホスト名 $user = "userid"; // WordPressのユーザーID $pass = "password"; // WordPressのパスワード $xmlrpc = "/xmlrpc.php"; // XML-RPCのパス $title = "記事のタイトル"; $description = "記事の本文"; require_once("XML/RPC.php"); // クライアント作成 $client = new XML_RPC_client($xmlrpc, $host, 80); // メッセージ作成 $message = new XML_RPC_Mess
XML-RPC を使用して、WordPress に投稿する方法です。 XML-RPC とは簡単に言うと XML を HTTP でやり取りしてリモート手続き呼び出しを行うための方法です。非常に簡単な仕様で、仕様書も短いですので興味のある方は下記サイトで仕様を確認してください。 XML-RPC Specification XML-RPC 仕様書 (上記仕様の日本語訳) その他の参考サイト PEAR の XML_RPC のマニュアル Manual :: XML_RPC WordPress でサポートされている XML-RPC API Blogger API MetaWeblog API Movable Type API WordPress の XML-RPC API XML-RPC wp ? WordPress Codex 日本語の情報では下記サイトが見やすくまとめられています。 Movable
HOME>WEBプログラム覚書>[WordPress]XML-RPCを利用して外部から投稿したりする。 [WordPress]XML-RPCを利用して外部から投稿したりする。 小粋空間: PHPでXML-RPCを利用する方法でMovable Typeで、XML-RPCを利用する方法がエントリーされてたのでWordPressについて書いておきます。もちろん適当に。 XML-RPCって? XMLをPOSTしてXMLを取得するための規格です。POSTの誤用の最たる例として「Webを支える技術 -HTTP、URI、HTML、そしてREST (WEB+DB PRESS plus)」でさらされてますw そんなわけで現在では下火な感がありなかなかお目にかかれませんが、FotoliaのAPIはXML-RPCとなっています。 WordPressで何ができる? WordPressでは、XML-RPCを利用する
今回はWordpressに標準に備わっているXML-RPCサーバー機能を使って、 管理ページからではなく、csvファイル等をアップして一括投稿をする方法を試してみます。 例えば、商品を同じレイアウトで一気にアップしたいときなんか、便利じゃないですかね?? ちなみに私の制作環境はMacなので、Macで使用する方法をご紹介します。 Winの方は下の内容の【1】の部分をWinで設定する方法を別途見つけて下さい。 【2】以降は同じで大丈夫だと思います。 参考にさせていただいた記事はこちらです [WordPress] XML-RPC を使用する方法 1. まずはXAMPPでPEARのライブラリであるXML-RPCを使えるように設定する [ターミナル]で以下のコマンドを入力する $ cd /Applications/XAMPP/xamppfiles/bin $ sudo ./pear in
IXR Manual | Download the Library | Example Web Services The Incutio XML-RPC library (IXR) is designed primarily for ease of use. It incorporates both client and server classes, and is designed to hide as much of the workings of XML-RPC from the user as possible. A key feature of the library is automatic type conversion from PHP types to XML-RPC types and vice versa. This should enable developers
PHP(FeedCreator.class.php)を使ったRSSの生成 一体こいつはなんなんだ?長い間この「RSS」というのが理解できませんでした。何しろこれをクリックしても「この XML ファイルにはスタイル情報が関連づけられていないようです。以下にドキュメントツリーを表示します。」なんて表示されて、なんだかページソースみたいなものが生の形で表示されるだけなので、「一体こいつはなんなんだ?」・・・という感じでした。 やがて、このRSSというのは、プラウザ上で表示させるものでなく、RSSリーダーなるもので情報を取得して、ページの更新を自動的に「お知らせ」してもらうための「仕掛け」だと言うことは理解できました。 しかし、その「仕掛け」をどのようにすれば生成できるかがなかなか理解できませんでした。 ブログなんかでは最初から組み込まれているので、その「仕掛け」について全く無知でもインストールし
「ウェブリブログ」は 2023年1月31日 をもちましてサービス提供を終了いたしました。 2004年3月のサービス開始より19年近くもの間、沢山の皆さまにご愛用いただきましたことを心よりお礼申し上げます。今後とも、BIGLOBEをご愛顧賜りますよう、よろしくお願い申し上げます。 ※引っ越し先ブログへのリダイレクトサービスは2024年1月31日で終了いたしました。 BIGLOBEのサービス一覧
XMLを生成するためのライブラリ「XML_Builder」をOpenpearにて公開しています。1月ごろにはもう公開していたのですが、ブログに書いていなかったので、簡単な紹介を書いてみたいと思います。(4/1ですがエイプリルフール関係ない記事です) github pagesに簡単なドキュメントも置いています。 php-XML_Builder document https://github.com/hirak/php-XML_Builder インストール PHP PEAR形式のライブラリです。OpenpearなのでPEARコマンドで簡単です。 % pear channel-discover openpear.org % pear install openpear/XML_Builder 肝心のXMLを出力するにはDOMやXMLWriterが必要ですが、arrayを生成するだけのモードもあるた
今度はPHPでXMLを簡単に出力する方法の紹介です。 Flexとの連携で威力を発揮するでしょう。 昨日の日記と同じようにpearのXML_Serializerのインストールです。 # pear install http://download.pear.php.net/package/XML_Serializer-0.18.0.tgzPHPでデータベースの内容をXML_Serializerを使って効率よく出力する方法。 <?php require_once 'XML/Serializer.php'; $options = array( "indent" => " ", "linebreak" => "\n", "typeHints" => false, "addDecl" => true, "encoding" => "UTF-8", "rootName" => "result", "def
第1回 PostgreSQLとXML 響 楽人 XMLが制定されてから11年経ち、データベースの世界でもXML対応が進んでいます。そのような中、PostgreSQL は一段とXML対応を本格化させています。本連載では、PostgreSQL 8.3でのXMLの取り扱い方について基本から応用まで説明してゆきます。 第1回はPostgreSQLとXMLというテーマですので、まずはPostgreSQLを使える状態にした上で、XMLの形をしたデータを格納し、そのデータをSQLによって操作可能かを試みます。 PostgreSQLは、8.3からXML型のデータの内容をXPathで操作できるようになりました。XPathとは、XMLの中の特定の箇所を指定するための仕組みです。XPathの詳細は第二回以降で取り上げますが、今回もXMLインスタンスをデータベースに格納した後、この機能を使ったSELECTを行って
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く