テキストPDFから、構造化されたマークダウン(簡易HTML)テキストを取り出すことにイーストが成功。PDFから簡単にEPUBを生成できるクラウドサービスとして、「EPUBpack」という名称で出版社向けに販売する。第一弾として岩波書店が、岩波新書のEPUB化を始めた。 イーストはこのほど、テキストPDFから、構造化されたマークダウン(簡易HTML)テキストを取り出すことに成功したと発表した。同社は、「日本語で複雑に組版されたPDFからの正確な構造化テキスト抽出は世界初と思われる」としている。PDFから簡単にEPUBを生成できるクラウドサービスとして、「EPUBpack」という名称で出版社向けに販売する。第一弾として岩波書店が、このサービスを使って岩波新書のEPUB化を始めた。 日本語や欧文、中国語などで利用でき、縦組みや縦中横など、複雑な日本語組版にも対応したツール。 PDFファイルを読み