はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    Pixel 10

『mono.kmc.gr.jp』

  • 人気
  • 新着
  • すべて
  • Ruby Scraping - feedalizer

    3 users

    mono.kmc.gr.jp/~yhara

    公式サイトより。 url = "http://sydsvenskan.se/serier/nemi/article101047.ece?context=serie" feedalize(url) do feed.title = "Nemi" feed.about = "..." feed.description = "Daily Nemi strip scraped from Sydsvenskan" scrape_items("option") do |rss_item, html_element| rss_item.link = html_element.attributes["value"] rss_item.date = Time.parse(html_element.inner_html) rss_item.title = rss_item.date.strftime("

    • 世の中
    • 2009/05/16 22:29
    • feed
    • rss
    • tutorial
    • ruby
    • Ruby Scraping - Nokogiriのタグ検索機能

      3 users

      mono.kmc.gr.jp/~yhara

      XML::NodeSetクラスのリファレンスです。 mapとかfindとかfind_allなど、Enumerableモジュールのメソッドは全て使えます。 まあNodeクラスの配列みたいなもんだと思えばいい。 NodeSetクラスはNodeクラスとの継承関係はありません。 中身の要素を取得したい empty?() Is this NodeSet empty? each() {|self[x]| ...} Iterate over each node, yielding to block first() Get the first element of the NodeSet. last() Get the last element of the NodeSet. size() document このNodeSetが含まれているDocumentを返す。 再検索 /(*paths)

      • 暮らし
      • 2009/02/04 00:56
      • Ruby
      • Ruby Scraping - Nokogiri

        23 users

        mono.kmc.gr.jp/~yhara

        @@ -8,7 +8,7 @@ ! 機能 :[[Nokogiri/search]]: XML/HTML要素の検索 -:[[Nokogiri/Document]]: +:[[Nokogiri/Node]]: XML/HTMLノードに対する操作 :[[Nokogiri/Builder]]: Rubyのブロックを使ったXML/HTML生成機能 :[[Nokogiri/SAX]]: SAXスタイルのXML/HTMLパーサ :[[Nokogiri/Reader]]: メモリからXMLを読み込む(?)

        • テクノロジー
        • 2008/11/09 05:18
        • nokogiri
        • ruby
        • scraping
        • スクレイピング
        • html
        • xml
        • library
        • ramaze-users.jp - ramaze-users.jp

          8 users

          mono.kmc.gr.jp/~yhara

          YAPC::Asia 2008 で Michael Schwern は (中略) ここに ramaze-users.jp を開始します。ドメインはまだ取ってません。 ノープラン(笑)です。 Ramazeとは Rubyで書かれた新進気鋭のWebアプリケーションフレームワークです。 参考: Ramazeとは - はてなダイアリー 軽い、小さい Ramazeは簡潔・軽量をモットーに開発されており、Railsよりもずっとシンプルなフレームワークになっています。 モジュラー MVCのMやVに決まったライブラリがなく、Ramazeがサポートするたくさんのライブラリの中から自分の好きなものを選んで使うことができます。(もっと詳しく → Model, View)

          • 学び
          • 2008/06/17 19:25
          • ramaze
          • Ruby
          • framework
          • まとめ
          • Ruby Scraping - WWW::Mechanize::Page

            4 users

            mono.kmc.gr.jp/~yhara

            ページを表すクラス。1枚のhtmlに相当する。 agent.get()とか、form.submit() の返り値として得られる。 クラスメソッド new(uri=nil, response=nil, body=nil, code=nil, mech=nil) new(uri=nil, response=nil, body=nil, code=nil, mech=nil) {|self| ...} インスタンスメソッド forms [R] formタグを表すノード一覧(Mechanize::List) frames [R] frameタグを表すノード一覧(Mechanize::List) iframes [R] iframeタグを表すノード一覧(Mechanize::List) links [R] aタグを表すMechanize::Link一覧(Mechanize::List) meta

            • 学び
            • 2008/02/15 09:06
            • Ruby Scraping - WWW::Mechanize

              7 users

              mono.kmc.gr.jp/~yhara

              クローラ本体。 普通、 agent = WWW::Mechanize として使う。 一番良く使うのは agent.get("http://...") クラスメソッド new() new() {|self| ...} インスタンスメソッド ca_file [RW] SSLのPEM形式の証明書のパス名 cert [RW] SSLのX509形式の証明書のパス名 key [RW] SSLのRSA形式の暗号鍵のパス名 pass [RW] SSLのRSA形式の暗号鍵のパスワード(文字列) cookie_jar [RW] cookie入れ。Mechanize::CookieJarのインスタンス history [R] 取得したページの履歴(Mechanize::Pageの配列) log [RW] Loggerのインスタンス max_history [RW] 最大何ページまでhistoryを記録するか o

              • 学び
              • 2008/02/15 09:05
              • Mechanize
              • lib
              • Ruby Scraping - Hpricot::Traverse

                3 users

                mono.kmc.gr.jp/~yhara

                あるノード内を探索するモジュール。全てのノードに有効。 インスタンスメソッド 要素の検索 /(expr, &blk) search(expr, &blk) 文字列exprで指定したCSSセレクタ/XPathにマッチする要素の配列を返す。ブロックを与えたときは、マッチする要素を順に渡してブロックを実行する。 %(expr) at(expr) 文字列exprで指定したCSSセレクタ/XPathにマッチする最初の要素を返す。 previous_node() この要素の前の兄弟ノードを返す。タグでないもの(テキスト、コメント、CDATAなど)も含む。それらを除きたいときはprevious_sibling()を使うこと。 next_node() この要素の次の兄弟ノードを返す。タグでないもの(テキスト、コメント、CDATAなど)も含む。それらを除きたいときはnext_sibling()を使うこと

                • 学び
                • 2008/02/03 00:52
                • http://mono.kmc.gr.jp/~yhara/rubyscraping/?scRUBYt

                  5 users

                  mono.kmc.gr.jp/~yhara

                  • 世の中
                  • 2007/12/14 17:29
                  • Ruby
                  • Ruby Scraping - Hpricot/Showcase

                    28 users

                    mono.kmc.gr.jp/~yhara

                    Hpricot RubyでHTMLを解析するためのライブラリHpricotの使い方まとめです。 書きかけです。 AnHPricotShowcaseを ベースにしていますが、改変したり省略している箇所も結構あります。 Basics ライブラリのロード HTMLを開く(Hpricot) 要素を探す(search, /) 要素を一つだけ探す 要素の中身のHTMLを得る(inner_html) 要素のタグを含めたHTMLを得る(to_html) 繰り返し(Elements#each) 要素の中を検索する(search, /) HTMLを編集する(set) 要素のパス名を得る(css_path, xpath) Elements 複数の要素の中を検索する Elements#at( expression, &block ) Elements#search( expression, &block ) 複数

                    • テクノロジー
                    • 2007/11/29 18:58
                    • hpricot
                    • ruby
                    • スクレイピング
                    • scraping
                    • howto
                    • チュートリアル
                    • japan
                    • Web
                    • Ruby Scraping - Hpricot

                      45 users

                      mono.kmc.gr.jp/~yhara

                      あるページのリンク (aタグ) を全て抜き出すスクリプト。 require 'hpricot' require 'open-uri' doc = Hpricot( open("http://www.kmc.gr.jp/").read ) (doc/:a).each do |link| puts "#{link.inner_html} → #{link[:href]}" end

                      • 暮らし
                      • 2007/11/06 01:58
                      • hpricot
                      • ruby
                      • scraping
                      • library
                      • HTML
                      • ダウンロード
                      • *プログラミング
                      • programming
                      • Ruby Scraping - Mechanize

                        94 users

                        mono.kmc.gr.jp/~yhara

                        自動google検索。 require 'rubygems' require 'mechanize' agent = WWW::Mechanize.new # インスタンス生成 agent.user_agent_alias = 'Mac Safari' # User-Agentの設定 page = agent.get('http://www.google.com/') # ページ取得 search_form = page.forms.with.name('f').first # "f"という名前のフォームを探す search_form.q = 'Hello' # テキストボックス"q"に"Hello"を入力 search_results = agent.submit(search_form) # フォームのsubmitボタンを押す puts search_results.body # 結果

                        • 暮らし
                        • 2007/10/13 08:02
                        • ruby
                        • mechanize
                        • library
                        • programming
                        • Scraping
                        • reference
                        • http
                        • *プログラミング
                        • web
                        • Ruby Scraping - FrontPage

                          191 users

                          mono.kmc.gr.jp/~yhara

                          RubyによるWeb Scrapingライブラリの情報をまとめるためのWikiです。 HpricotHTMLを「Rubyらしく」扱うライブラリ MechanizeWebサイトへ自動でアクセスするためのライブラリ scRUBYt!DSLを使って簡単にスクレイピングを行うライブラリ feedalizerhtmlからRSSフィードを作るのに役立つライブラリ scrAPIパーサを定義することでHTMLを解析するライブラリ ウェブサイトから必要なデータを抽出すること。(Scrape = 削り取る) ライブラリによっては、受信したデータの解析だけでなくデータの送信にも対応している。 例: RSSを配信していないウェブサイトのHTMLをスクレイピングして野良RSSを作る Googleの検索結果をスクレイピングして自動でGoogle検索するスクリプトを書く ブログの投稿ページを解析して、コマンドラインから

                          • 暮らし
                          • 2007/10/10 03:21
                          • ruby
                          • scraping
                          • hpricot
                          • html
                          • mechanize
                          • library
                          • scRUBYt
                          • スクレイピング
                          • programming
                          • tips

                          このページはまだ
                          ブックマークされていません

                          このページを最初にブックマークしてみませんか?

                          『mono.kmc.gr.jp』の新着エントリーを見る

                          キーボードショートカット一覧

                          j次のブックマーク

                          k前のブックマーク

                          lあとで読む

                          eコメント一覧を開く

                          oページを開く

                          はてなブックマーク

                          • 総合
                          • 一般
                          • 世の中
                          • 政治と経済
                          • 暮らし
                          • 学び
                          • テクノロジー
                          • エンタメ
                          • アニメとゲーム
                          • おもしろ
                          • アプリ・拡張機能
                          • 開発ブログ
                          • ヘルプ
                          • お問い合わせ
                          • ガイドライン
                          • 利用規約
                          • プライバシーポリシー
                          • 利用者情報の外部送信について
                          • ガイドライン
                          • 利用規約
                          • プライバシーポリシー
                          • 利用者情報の外部送信について

                          公式Twitter

                          • 公式アカウント
                          • ホットエントリー

                          はてなのサービス

                          • はてなブログ
                          • はてなブログPro
                          • 人力検索はてな
                          • はてなブログ タグ
                          • はてなニュース
                          • ソレドコ
                          • App Storeからダウンロード
                          • Google Playで手に入れよう
                          Copyright © 2005-2025 Hatena. All Rights Reserved.
                          設定を変更しましたx