テキストPDFから、構造化されたマークダウン(簡易HTML)テキストを取り出すことにイーストが成功。PDFから簡単にEPUBを生成できるクラウドサービスとして、「EPUBpack」という名称で出版社向けに販売する。第一弾として岩波書店が、岩波新書のEPUB化を始めた。 イーストはこのほど、テキストPDFから、構造化されたマークダウン(簡易HTML)テキストを取り出すことに成功したと発表した。同社は、「日本語で複雑に組版されたPDFからの正確な構造化テキスト抽出は世界初と思われる」としている。PDFから簡単にEPUBを生成できるクラウドサービスとして、「EPUBpack」という名称で出版社向けに販売する。第一弾として岩波書店が、このサービスを使って岩波新書のEPUB化を始めた。 日本語や欧文、中国語などで利用でき、縦組みや縦中横など、複雑な日本語組版にも対応したツール。 PDFファイルを読み
![PDFから構造化テキスト抽出に成功 岩波新書をEPUB化 イースト](https://cdn-ak-scissors.b.st-hatena.com/image/square/2af23e06f9356097708b7e4fe021c4c64a7a8e7b/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fnews%2Farticles%2F1907%2F25%2Fcover_news059.jpg)