Wikipedia の膨大な情報を、PHP で作ったプログラムから参照する方法について、簡単にまとめてみました。 まず、Wikipedia の情報は、ブラウザで通常のアクセスを行うとレンダリングされた結果が帰ってきます。 こんな URL ですね。 [code lang=’text’] http://ja.wikipedia.org/wiki/検索ワード [/code] そして、XML 形式でデータを取り出したい場合は、次のような形式の URL でアクセスすれば OK です。 [code lang=’text’] http://ja.wikipedia.org/wiki/特別:データ書き出し/検索ワード [/code] ※実際の URL では、日本語部分はすべて URL エンコードする必要があります そして、プログラムから上記 URL を呼び出そうとすると、問題が起きます。 たぶん次の様なエ
最近、Wikipediaのデータを引用して表示するサービスが良くある。どうやって、実現しているのか? Wikipediaには、収録データをHTMLではなくXMLで返してくれるモードもあるが、これはWebブラウザ向けのサービスで、PHPなどでアクセスして取得しようとすると、403のエラーで拒否される。また、「サーバーに負担がかかるので、クローリングしないでください」と明記されている。 その代わり、Wikipediaの全データをXML形式でダンプしたものが自由にダウンロードできるようになっている。これを読み込んで、自分のデータベースサーバに投入して使えばいいのだ。データベースはMySQLやPostgreSQLに対応し、投入用のツールも用意されている。 Wikipediaのシステムである、MediaWikiのソースコードも提供されていて、これに含まれているimportDump.phpを使う例が上
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く