正規表現の概要 正規表現は、Perlの中で最も重宝する機能のひとつです。正規表現にはテキスト処理のための様々な機能があり、文字列の中から特定のパターンを見つけ出したり、置換したりすることができます。 正規表現の基本的な使用方法 たとえば、$strという変数に格納したデータの中から、「A」で始まって途中は何があるかわからないが最後が「E」という文字列を探したい場合、次のように記述することで、条件にマッチする文字列を見つけることができます。 $str =~ /A.*E/; 上記では、ドット( . )が改行以外の1文字を表し、アスタリスク( * )がその任意の文字の0回以上の繰り返しを意味します。このように、正規表現において特殊な働きを持った文字を正規表現演算子、またはメタ文字と呼びます。また、=~ はパターン結合演算子と呼ばれ、「左辺の値から右辺の値を検索する」という意味があります。 正規表現
Google や Microsoft など検索エンジンを運営している会社は、インターネット上のウェブサイトの情報を収集してサーバーに保存している。 これはプログラムを使って自動的に行っている。 そのようなプログラムはロボットのほか、ボット、クローラー、スパイダーなどと呼ばれている。 ボットは定期的にサイトを巡回して情報を更新している。 巡回頻度はサイトの更新頻度などにより異なる。 ボットがサイトにアクセスすると、そのユーザーエージェントがアクセス解析や Apache などウェブサーバーのログに残る。 昔のボットは基本的にJavaScriptを無視するため、それを使ったアクセス解析はボットのユーザーエージェントを取得できない場合があったが、のちにJavaScriptを実行するボットも増えてきた。 ボットのユーザーエージェントは変更される場合がある。 2018年7月現在、私が運営しているサイト
SEO fundamentals Introduction Search Essentials SEO Starter Guide How Google Search Works Do you need an SEO? Crawling and indexing Sitemaps robots.txt Meta tags Crawler management Removals Canonicalization Redirects JavaScript SEO Ranking and search appearance Visual Elements gallery Title links Snippets Images Videos Structured data Favicons Site-specific guides Ecommerce International and multi
ユーザーエージェントから検索エンジンロボット/Webクローラを判別するPHP関数を下記に記載します。 <?php #------------------------------------------------------------------------------------------------- $UserAgent = getenv('HTTP_USER_AGENT'); #ユーザーエージェント取得 #------------------------------------------------------------------------------------------------- function isRobot($UserAgent) { if(!$UserAgent) $UserAgent = $_SERVER['HTTP_USER_AGENT']; $r
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く