スクレイピングに関するAZERのブックマーク (2)

  • 年越し前に自分のYouTubeの視聴履歴を解析したよ【Python】 - myaun’s blog

    はじめに 今年もあと数週間で終わりますが、1年間の振り返り方は人それぞれ色々あると思います。 記事では、私が最も使っているサービスであるYouTubeの視聴履歴という楽しげなデータを見つけたので、自分が1年間どんな動画どれだけ視聴したかを確認してみました。 やったこと YouTubeの視聴履歴データを取得 視聴履歴の動画タイトルからキーワードを抽出 各キーワードの期間ごとの遷移を確認 1. YouTubeの視聴履歴データを取得 以下のURLからYouTubeデータのアーカイブをダウンロードできます。(Google関連サービスの色んなデータとれるようですが、今回はYouTubeのみ) 自分のデータをダウンロード: https://takeout.google.com/settings/takeout ダウンロードしたデータの中にwatch-history.htmlというファイルが含まれてお

    年越し前に自分のYouTubeの視聴履歴を解析したよ【Python】 - myaun’s blog
  • 年末年始の新幹線をPythonで予約する - ふしみのブログ

    年末年始の新幹線はすぐに予約で一杯になってしまう。最近はエクスプレス予約のWebサイトを使えばスマホやPCから即時予約できるようになったが、年末年始の「都合が変わって1週間前など新幹線を予約したい」みたいな状況では難しい。ぼくはエクスプレス予約の割引額が増えるJ-WESTカードを持っているのだけど、特にキャンセル待ちなどに優遇があるわけではないので、CYBER STATIONという空席確認Webサイトでじっといい時間の空席が現れるのを待つしかない。 というわけでPythonで解決しよう。 この記事は ふしみ Advent Calendar の10日目の記事です。 CYBER STATIONは (見た目的にも) パースがとても簡単そうなので、素直なスクレイピングが通用しそうだ。予約サイト (エクスプレス予約) は自動操作が難しそうだが、Pythonに空席状況を監視してもらって、空席が見つかっ

    年末年始の新幹線をPythonで予約する - ふしみのブログ
  • 1