タグ

ブックマーク / qiita.com/keitakurita (3)

  • 忘れがちだが、便利なPythonのデータ型 5つ - Qiita

    Pythonは標準ライブラリが非常に強力ですが、ライブラリが多すぎて把握しきれていない、把握しているけれども存在を忘れて車輪の再発明をしてしまう人も多いのではないでしょうか?少なくとも筆者はそんな人間の一人なので、自分用のメモも兼ねて、便利だが意識していないと使わない、Pythonの標準ライブラリに含まれているデータ型を幾つか紹介します。 DefaultDict 公式ドキュメント: https://docs.python.jp/3/library/collections.html#collections.defaultdict 文字通り、デフォルトの値を設定できる辞書型。 これが便利なのは、いちいちキーが辞書に登録されているかを確認しなくていい点です。例えば、単語の出現回数を数え上げる時に、以下のような形で使えます: >>> from collections import defaultd

    忘れがちだが、便利なPythonのデータ型 5つ - Qiita
  • Pythonのジェネレーターってなんのためにあるのかをなるべく分かりやすく説明しようと試みた - Qiita

    はじめに Pythonのジェネレーターについて説明してあるページは他にもありますが、英語だったり、あまり自分としてしっくりこないものが多かったので、自分の中で考えを整理することも兼ねて、ジェネレーターについて自分なりに説明しようと思います。 断っておくと、筆者は基的ににわかなので、誤ったことを口走るかもしれません。間違い等がありましたらコメントしていただけると自分の勉強にもなるので大変助かります。 あと、ここで紹介するジェネレーターの利用法はあくまでも利用法の数例で、決して他に利用法がないというわけではありません。 ジェネレーターとは? 詳しい、正確な説明は他にも素晴らしい記事があるので、そちらをご参照ください: Pythonのイテレータとジェネレータ 簡潔に説明すると、「通常の関数の、return文をyieldに置き換えたもの」ととりあえずは思ってください。(色々と違いますが、とりあえ

    Pythonのジェネレーターってなんのためにあるのかをなるべく分かりやすく説明しようと試みた - Qiita
  • 無限スクロールするページをクロールする方法 - Qiita

    無限スクロールとは? FacebookやTwitterのタイムラインなんかで見られる、ページの下までスクロールすると、新しい情報が読み込まれる、あれです。 動機 無限スクロールのページをクロールしようと思った理由は、学校の課題の関係でTwitterの過去ツイートを引っ張ってくる必要があったからです。 え、Twitterは公式APIがあるじゃないか、というそこのあなた。Twitterの公式APIがあまり親切でなく、1週間より前のツイートは取得できない仕様になっています。つまり、それより昔のツイートをとってきたい場合は自分でクロールしなければいけません。そして、Twitterの検索結果は、無限スクロールで表示されるので、無限スクロールするページをクローリングしなければいけません。 無限スクロールをクロールするのが難しい理由 クローラーは基的に、以下のように動作します: 1. 与えられたurl

    無限スクロールするページをクロールする方法 - Qiita
  • 1