You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
一般的なスクレイピング手法とその問題点 スクレイピングというと、HTTPクライアントライブラリを用いてHTML取得し、HTML/XMLパーサーで解析するというのが一般的だと思います。 この手法の場合、以下の場合にうまく処理できません。 ターゲットのページがJavaScriptにより動的にDOMを操作する場合 HTML/XMLパーサーが取得したHTMLを正しく解釈できない場合(正しくないHTMLでもブラウザはなんとか処理するが、パーサーライブラリは正確なHTMLでないと処理できないことがある) 特に問題になるのは前者でしょう。最近のWebサイトではJavaScriptでDOMを操作することは珍しくなくなってきています。SPAであればなおさら難しく、もはやこういった手法によるスクレイピングは不可能でしょう。 ヘッドレスブラウザによるスクレイピング 動的なDOMやパーサーがうまく解釈できないとい
疑惑どころか 99.99% くらい黒な話。 (後記:セッション盗まれたと思ってたけど、よくよく考え直してみると生パスワードごと盗まれてる可能性もあるしやばい) 追記:続報 11月3日 今回指摘した HTTP Headers 以外にも、「Tab Manager」「Give Me CRX」「Live HTTP Headers」等で同様(?)の問題が報告されています。第三者が元の作者からソフトウェア権利を買い取って悪用する、というケースが割とある模様(?)。皆さま情報ありがとうございます。 11月4日 Zaif については、「不正な Chrome 拡張」と「スクリプトから保護されていなかったクッキー」のコンボによりセッションが盗まれていた可能性あり。 Zaif のセッション情報が盗まれた原因のひとつについて。JavaScript からクッキー値を取得させない方法。 - clock-up-blog
保護・うぷぷぷ どんなページ? 色々な所から見たり聞いたりした事を実際にやってみよう!という私の雑記帳ページです。 PukiWikiを使ってますが私しか編集できません…すみませんです。 ↑ 名前: ムーンドルド MoonDoldo 瑠川 菜月 るかわ なつき 自己紹介: 妖精なので性別はありません、中の人なんていません、色々安心で安全で合法です 性格は天使にも悪魔にもなれるハイブリット 種族: 緑の妖精 エルフだったり、 ニューマンだったり、 なで魔族だったり… 属性: ✓エルフ耳 ✓羽 ✓亜人種 ✓モコモコ ✓ょぅι゛ょ ↑ 使用上の注意 用法・容量を守って正しくお使い下さい 情報が間違ってる事による副作用が見られた場合は服用をお止め下さい ブックマーク迷子防止として必ず移転先リンクを設置しますので、安全・安心してお使いいただけます 成分の半分は優しさで出来ています ぴんぽーん♪ ↑
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く