タグ

ブックマーク / www.geek.sc (4)

  • 画像のExif情報とセキュリティ

    Exif情報とは何か デジカメの写真などの画像ファイルには、画像データだけではなくて、Exif情報というメタデータが埋め込まれています。それは次のような情報です。 撮影日時 撮影機器のメーカー名(製造・販売元) 撮影機器のモデル名(カメラ付き携帯電話・スマートフォンの機種名など) 画像全体の解像度 水平・垂直方向の単位あたり解像度 撮影方向 シャッタースピード 絞り(F値) ISO感度 測光モード フラッシュの有無 露光補正ステップ値 焦点距離 色空間 GPS情報 – GPS付きカメラの場合、緯度・経度・標高など。 サムネイル つまり、デジカメやスマホやガラケーで撮影された写真には、撮影された機種や撮影日やGPS情報などが埋め込まれていることが多く、この情報から写真がどのような状況で撮影されたのかの詳細を知ることができます。 Exif情報は簡単に取得が出来て、例えば先日のPC遠隔操作事件

    画像のExif情報とセキュリティ
  • 毎日新聞のサーバーはPHP5.1.6、民主党海江田党首のサーバーはApache1.3.42

    毎日新聞のWEBサーバーはApache2.2.3とPHP5.1.6 まずFirefoxにLive HTTP Headersのアドオンを入れた状態で、毎日新聞のサイトを開いて、右クリックで「ページの情報を表示」→「ヘッダ」を選ぶとレスポンスヘッダが見られるのですが、ここに「X-Powerd-By  PHP5.1.6」と書かれてあるのが確認できるかと思います。PHPのバージョンが露出している状態です。 ServerヘッダでApacheのバージョンも露出していることがわかります。Apache2.2.3と比較的古めのバージョンを使っていることがわかります。Apache2.2.3やPHP5.1.6のバージョンに関しては既に報告されている脆弱性がいくつもあって、パッチを適用していないならば、Apache Killerなどの攻撃スクリプトが叩きこめてしまう可能性があることがわかってしまいます。 これは不

    毎日新聞のサーバーはPHP5.1.6、民主党海江田党首のサーバーはApache1.3.42
  • 大手サイトのrobots.txtでわかる「検索でヒットされたくないページ」の特徴

    robots.txtとは robots.txtは、検索エンジンのクローラー(bot)に、クロールされたいページや、クロールされたくないページを教えるテキストファイルのことです。多くの検索エンジンのクローラーは、そのドメインの最上位ディレクトリに設置されたrobotst.txtを最初に読み込んで、クロールするべきページとクロールするべきでないページを取得し、それに基づいて巡回します。ただ、一部のクローラーには、このrobots.txtを無視するものもあります。 robots.txtの書き方はおよそ以下の通りです。 User-agent:(ここにbotのユーザーエージェントを記述。ワイルドカード指定も可能) Crawl-Delay:(クロールの時間間隔を指定) Disallow:(クロールされたくないページやディレクトリを指定) Allow:(Disallowで指定されたディレクトリの小階層で

    大手サイトのrobots.txtでわかる「検索でヒットされたくないページ」の特徴
  • マルコフ連鎖と日本語形態素解析によるワードサラダSEO

    マルコフ連鎖とは マルコフ連鎖は未来の挙動が現在の値だけで決定され、過去の挙動と無関係であることを利用した確率統計モデルです。定義としては次のような形を取ります。 マルコフ連鎖は、一連の確率変数 X1, X2, X3, … で、現在の状態が決まっていれば、過去および未来の状態は独立であるものである。形式的には、 であるような過程をいう。一般の、時間的に均一でないマルコフ連鎖は、この等式を満たさない。(Wikipedia:「マルコフ連鎖」より) はい、難しい数式が出てきましたね。私もこの中身は完全には理解していません。しかし、このマルコフ連鎖を使うと、現在のデータを一定の出現率で並び替えるアルゴリズムを作成することも可能という事を憶えておいてください。実はGoogleのページランクアルゴリズムなどにもマルコフモデルが応用されています。 日形態素解析とは 日語は単語と助詞を中心に、日

    マルコフ連鎖と日本語形態素解析によるワードサラダSEO
  • 1