HTML Parser (Java) 概要 HTMLの構造を解析する Java のクラスライブラリ。 内容の抽出、構造の変換が可能。 HTTP接続の機能を含む。 簡単な特徴のまとめ (MYCOMジャーナル) 公式ページ / ダウンロード 公式ページ (sourceforge) ダウンロードは公式ページの左のメニュー -> Downloads -> Current 正式リリースでは htmlparser1_6_20060610.zip が最新 (2007年9月28日現在) ダウンロード元は jaist など近いところを選ぶ。 Vine Linux 3.1 を使用している場合は Firefox をインストールして、それを使ってダウンロードすること。 インストール htmlparser1_6_20060610.zip が ~/Desktop/ に保存されているものとする。 インストール先は ~/
HTMLからリンクを抽出する処理を書く必要があったので、そこで書いたコードを サンプルとしてちょっと公開。(実際に書いたコードとは若干違いますが) ここでは、はてなブックマークの人気エントリーからリンクを抽出するようにしています。 HTMLの取得から解析までhtmlparserのライブラリがやってくれるので、非常に 使い勝手がいいです。java.netパッケージや正規表現を使用しても同じことは 出来ますが、それなりに面倒ですから。 http://htmlparser.sourceforge.net/ import java.util.ArrayList; import java.util.HashMap; import java.util.Iterator; import java.util.List; import java.util.Map; import org.htmlparser
検索エンジンの上位表示を狙ってアクセス数アップ!本誌の読者ならばSEOに関して相当詳しく理解して実践していることだろう。しかし、改めてSEOの基本を理解しておくことも大切だ。 SEOとは「検索エンジン最適化」(Search Engine Optimization)のこと。検索エンジンで検索したときに、検索結果で自分のウェブサイトの表示順位をより上位に押し上げるためのマーケティング上のテクニックだ。検索結果の上位に表示されるものほど、より多くのユーザーの目に留まりクリックされることは明らかなので、SEOのアクセスアップに対する効果は非常に大きい。 SEOの対象とする検索エンジンは、日本でよく使われている順に、ヤフー、グーグル、そして余力があればMSN(Liveサーチ)を選ぶのが一般的だ。オプトとクロス・マーケティングが2006年4月に発表した「検索エンジン利用状況実態調査」では、国内検索エン
mysql-5.0.20を使いたいのですが、文字化けで困っております。日本語の文字が?になってしまいます。 WIN2000+AN HTTP+mysql+perl5.8で使いたいと思っております。 文字化けしなかったのでv3使っていましたが、VIEWとかサブクエリ使えないので新しいバージョンのものを使いたいです。 前回質問しましたが何かが足りないんだと思うのですが、解決できませんでした。 http://q.hatena.ne.jp/1145535408 こちらのリンク先のパッチを当てたバイナリファイルを使った場合の設定の方法でもかまいません。 http://www.mysql.gr.jp/frame/modules/bwiki/?Contrib phpMyAdmin 2.8.0.3も使ってます。 ずばりの手順、方法、ページなどお待ちしております。 ずばりでなくてもよいので、Q&Aで原因を潰し
以下の手順でインストールした. 必須ではないが,自分でMeCabをRubyから使うので品詞IDを利用できるようにしておいた. MeCab-0.96からは品詞IDの利用がデフォルトで有効になっているため,以下のうちMakefileの修正は不要です. cd /usr/local/src wget http://keihanna.dl.sourceforge.jp/mecab/21187/mecab-0.93.tar.gz tar zxvf mecab-0.93.tar.gz cd mecab-0.93 ./configure --with-charset=utf8 make sudo make install cd /usr/local/src wget http://keihanna.dl.sourceforge.jp/mecab/20904/mecab-ipadic-2.7.0-20060
ウィキペディアのコンテンツなどのデータは、再配布や再利用のために利用できる一元化されたデータベース・ダンプでの提供が行われています。クローラを用いてコンテンツを収集しないでください。このデータベース・ダンプの生成は不定期に行われています。 ウィキペディアのコンテンツは Creative Commons Attribution-ShareAlike 4.0 International License (CC BY-SA 4.0) および GNU Free Documentation License (GFDL) の下にライセンスされています(Wikipedia:著作権と利用規約を参照)。画像などのメディアファイルは異なるライセンスで提供されることもあり、ファイルページで明記されています。 より詳しい解説はmeta:Data dumps(英語)を参照してください。 全プロジェクトのダンプ:du
7 Brilliant Free Fonts: Faceplate, Sling, Cicle | Smashing Magazine Every month we take a look around, browse through dozens of fonts collections and select most irresistible typefaces released recently. シンプルで使いやすい7つのフリーフォントが紹介されていました。 Web2.0風なサイトを作ったりするのにぴったりなフォントもあります。 Faceplate™ A Gauge Sling Cicle Steiner Existence Light FF Mt FF Clan Narrow Bold 個人的には Steiner がカッコいいんじゃないかと思ってます。
Firebugを使えばいいじゃん、という突っ込みはさておき、Pingdom Toolsでなかなか使える診断ツールが提供されています。 任意のURLを指定すればページのどこがどれぐらいの速度で表示されているかを診断してくれます。「最近サイトがちょっと重いなぁ」というときに使ってみてはいかがでしょうか。 詳しい使い方は以下のとおり。 ↑ このサイトでとりあえずテスト。 ↑ 結果はこのとおり。時間がかかっている画像がどれだけわかりますね。 ↑ それぞれのバーの色の見方はこんな感じです。 ↑ ロード時間のサマリーもこのように表示してくれます。 ロード時間がかかりすぎている場合はどれを圧縮すればいいかが一目瞭然ですね。またどのプラグインやスクリプトに時間がかかっているかもわかるのでサイトを軽くしたい場合には外す優先順位がわかってよろしいかと。 ご利用は以下からどうぞ。 » Pingdom Tools
アクセス向上の入り口「新規ユーザーを増やす」ワザを理解したら、次は「一度来てくれたユーザーにまた来てもらう」ワザだ。多くの新しいユーザーを獲得できたとしても、そのほとんどが「通りすがり」になってしまうと、常に同じだけの新規ユーザーを獲得し続けても永遠にユーザーが増えないことになってしまう。一度来てくれたユーザーに再訪問してもらい、リピーターとなってもらうにはどうすればいいのだろうか? 69遅い! イライラ! もう来ない! 今や多くのインターネットユーザーはブロードバンド接続になっているため、昔ほどページ全体のサイズに気を遣ったり、大きな画像を使わないように工夫したりする必然性は少なくなった。とは言え、あのグーグルでさえ、ウェブ検索の結果が表示されるまでの応答時間が0.5秒長くなっただけでユーザーが検索を控えるようになったと延べている。そこまで厳密になる必要はないが、サイトが重くなっていない
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く