evernoteの全文を抽出する必要がありその時に使った方法を公開します。 EvernoteAPIを使えばできそうですが、それほどのことでないので面倒ですよね。 そこで、全ノートをhtml形式で出力してBeautifulSoupでスクレイピングする方法を紹介していきます。 #Evernoteの全ノートをhtml形式で出力する まず、Command + Aで全ノートを選択します。そこからノートをエクスポートします。 出力する形式はhtmlを選択してください。 今回はこれをmynoteとしてデスクトップに保存します。 mynoteのindex.htmlには出力したファイル全てのノートの目次になっていて、各htmlファイルへのリンクがあるのでそれを利用します。 手順としては index.htmlから出力するノートのurlを抽出する。 url先からテキストを抽出する。 それをSQLiteに保存する
