エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
NewsApiのURLから本文を抽出してSQLite3に挿入する - やってみる
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
NewsApiのURLから本文を抽出してSQLite3に挿入する - やってみる
本文はHTMLでなくプレーンテキスト。だが、スクレイピングに大問題。 成果物 github 動作確認 以下のよ... 本文はHTMLでなくプレーンテキスト。だが、スクレイピングに大問題。 成果物 github 動作確認 以下のような手順でテストデータを用意する。 NewsApiを取得する(NewsApiでカテゴリ別にニュースを取得する) 1で取得したJSONファイルをnews.jsonとでもリネームしておく 2のJSONファイルをコピーする 3のうち最新(先頭)の2件くらいを削除してnews_old.jsonとでもリネームしておく SQLite3DBファイル作成する(NewsApiで得たニュースを保存するSQLite3テーブルを考える) 3のJSONファイルをDBファイルに取り込む(NewsApiのJSONからSQLite3DBファイルへ挿入する) 6の全レコードに対してbody=''してしまう この状態で、以下コードを実行し、最新2件だけが追加されたことを確認する。そしてHTMLから本文を抽出されている