MozillaがWebページの構成要素を識別し、意味を抽出するJavaScriptフレームワーク「Fathom」を開発している。MozillaでFathom開発を進めるErik Rose氏がブログで明らかにした。現在GitHubでそのソースコードが公開されている。 すでにページ内の要素をブラウザが理解する手がかりとしてマイクロフォーマットやセマンティックタグ、RDF、link/relヘッダなどが使われているが、これらは普及に至らなかったとし、その反省からFathomの開発に至ったようだ。実際、これら機能を活用するSafariとFirefoxのリーダーモードの土台であるReadabilityは先に閉鎖されている。 Fathomはセマンティックな抽出を作成するための「ミニ言語」で、DOMのノードを測定して設定した条件を基に抽出する。これにより、Webページにある「前へ戻る」「次に進む」などのコ
![Webページから意味を抽出するJSフレームワーク「Fathom」 | OSDN Magazine](https://cdn-ak-scissors.b.st-hatena.com/image/square/4196864a37518a8c4219cc80d90c0a0b1a82a491/height=288;version=1;width=512/https%3A%2F%2Fmag.osdn.jp%2Fimages%2Fmag%2Fmagazine-200x200.png)