タグ

2019年7月25日のブックマーク (3件)

  • PDFから構造化テキスト抽出に成功 岩波新書をEPUB化 イースト

    テキストPDFから、構造化されたマークダウン(簡易HTML)テキストを取り出すことにイーストが成功。PDFから簡単にEPUBを生成できるクラウドサービスとして、「EPUBpack」という名称で出版社向けに販売する。第一弾として岩波書店が、岩波新書のEPUB化を始めた。 イーストはこのほど、テキストPDFから、構造化されたマークダウン(簡易HTML)テキストを取り出すことに成功したと発表した。同社は、「日語で複雑に組版されたPDFからの正確な構造化テキスト抽出は世界初と思われる」としている。PDFから簡単にEPUBを生成できるクラウドサービスとして、「EPUBpack」という名称で出版社向けに販売する。第一弾として岩波書店が、このサービスを使って岩波新書のEPUB化を始めた。 日語や欧文、中国語などで利用でき、縦組みや縦中横など、複雑な日語組版にも対応したツール。 PDFファイルを読み

    PDFから構造化テキスト抽出に成功 岩波新書をEPUB化 イースト
  • BtoBマーケティングで絶対に知っておきたい7つの要諦――ベイジ枌谷氏が解説 | ウェブ解析士会議

    業界特性だからと諦めてしまうことなかれ。これは「ひとえにマーケティング不足」だと枌谷氏は言う。 企業相手の仕事なら、企業ならではの作法に従うべきというのが、BtoBマーケティングの根底にある考え方。それによって、上に挙げたような問題は起こりにくくなり、場合によっては解消するという。 BtoBマーケティング自体は非常に濃密なテーマだが、25分の限られたセッションということで、すぐに理解できるであろう以下の7点に話をしぼって、枌谷氏はポイントを紹介した。 BtoBとBtoCの違いを知ろう購買プロセスを把握しようBANT条件を決めよう言葉を磨こう課題買い掛けのストーリーを作ろう自社サイトをうまく活かそう情報発信を積極的に行おう1. BtoBとBtoCの違いを知ろう「BtoBといっても相手は人だから、人の気持ちを動かすという意味では同じだろう、というのは乱暴な意見」だと枌谷氏は言う。先に挙げた7つ

    BtoBマーケティングで絶対に知っておきたい7つの要諦――ベイジ枌谷氏が解説 | ウェブ解析士会議
  • 【スクレイピングツール】面倒な情報収集はGoogle Spreadsheetにやらせよう! - DAINOTE

    毎日同じような作業でこのように思っている人はいないでしょうか。 あ~毎日ネットにアクセスして、同じデータ収集するの面倒くさいなぁ こういう退屈な作業、自動でやってくれないかな でもプログラミングできないしなぁ。勉強すんのも面倒くさいなぁ。 そんな人に朗報です。今回は、プログラムをかけない人でも、ネットから情報を自動収集する方法をまとめます。 今回使うのは、Google Spreadsheetという、エクセルに似たWeb上のアプリケーションです。実はネット上の情報を自由に取得(スクレイピング)できるツールだとは知られていません。そんな裏の使い方を今回は説明したいと思います。

    【スクレイピングツール】面倒な情報収集はGoogle Spreadsheetにやらせよう! - DAINOTE