私たちは情報を識別する時に視覚的要素や過去の経験や知識を用いて自動的に情報の意味を判断することがあります。例えば新聞の1面を開いた時、どの範囲がひとかたまりの記事であるとか、どれが広告でどれが新聞名であるとか、文字を読まなくても判断できます。それが日本語で書かれていなくても、例えば英語やベトナム語であっても、「文字読めないけどこれがヘッドライン」などと推定を立てることができるわけです。 しかしながら視覚情報や知識や経験といったものに頼れない検索エンジンはそうはいかないのです。あるページを開いたとき、人間であれば明らかに「これは主トピックではない」といった情報も検索エンジンにはあたかもそれが重要な言葉のように捉えてしまい、検索クエリに対してまとはずれな答え(ページ)を表示してしまうことは多々あります。 例えばGoogleニュース検索で「アイレップ」と検索すると3番目(2007年5月6日18時
![ヤフーが新たにサポートした「Robots-Nocontent」って何だ?:渡辺隆広のサーチエンジン情報館](https://cdn-ak-scissors.b.st-hatena.com/image/square/a77358e61022c6d0d998c1bf4056ed48d5aae1e9/height=288;version=1;width=512/https%3A%2F%2Fjapan.cnet.com%2Fmedia%2Fc%2F2012%2Fimages%2Flogo%2Flogo_ogp.png)