エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Beautiful Soupのパフォーマンス改善について - 風柳メモ
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Beautiful Soupのパフォーマンス改善について - 風柳メモ
BSXPath.pyをいじっていて…… どうも、想像以上にパフォーマンスが悪いので、ボトルネックを調べていたの... BSXPath.pyをいじっていて…… どうも、想像以上にパフォーマンスが悪いので、ボトルネックを調べていたのですが……。 ひとつには、Beautiful Soup にも原因がありそうだということが分かりました。 例えば、全ノード検索(soup.findAll())は結構早いにも関らず、属性指定検索(soup.findAll(attrs={'class':'slow'}))になると想像以上に時間がかかります(後者は前者の数倍からひどいときには十数倍時間がかかる)。 比較にかかる分を考慮しても、ちょっとかかりすぎな気が……。 で、調べていくうちに Beautiful Soupでは、ノード(Tag)の属性への初回アクセス時に、node.attrs([(key1,val1),...,(keyN,valN)]のようなキーと値がペアになったtupleのリスト)をnode.attrMap({key1: