今回からは、PDFドキュメントの内部データにアクセスする方法を説明しよう。まず最初のターゲットは、テキストを取り出す事だ。テキストにアクセスできれば、検索などの処理が可能になる。 だが現状のiOSでは、PDFデータにアクセスするAPIが用意されてはいるものの、何らかの有意なデータを取り出すにはPDFフォーマット自体の理解が不可欠となる。そこでまずは、簡単にPDFフォーマットについて説明しよう。 PDFフォーマットとは PDF (Portable Document Format)は、アドビシステムズが開発した電子文書のためのフォーマットだ。1993年に登場しており、現在の最新バージョンは1.7となっている。2008年にISO 32000-1として標準化された。フォーマットの仕様書は公開されており、アドビシステムズのWebサイトからダウンロードすることができる。 PDFの特徴として、異なるデバ