タグ

2015年12月12日のブックマーク (5件)

  • 仕事のスピードを上げたければ、Altキーを使え!

    ボストン大学卒業後、モルガン・スタンレー証券投資銀行部に入社し、大型M&Aや資金調達プロジェクトをリード。退社後はグロービス経営大学院にてMBA取得、その後、大手上場インターネット企業に入社し、事業責任者として事業計画の立案から戦略遂行までを行う。現在は、スマートニュース株式会社にて、収益計画策定、資金調達、上場準備など財務企画業務全般をリード。「グローバル投資銀行のエクセルスキルを、分かりやすく伝えたい」というモットーの下、2013年10月から週末に個人向けエクセルセミナーを開催したところ、参加者数は1年で3000人を超え、大人気セミナーとなった。現在は、個人向けセミナーに加えて、企業研修も数多く開催しており、多くのビジネスパーソンの収益計画の作成指導を行っている。https://www.facebook.com/simulation2013/ 外資系投資銀行のエクセル仕事術 ウェブ版

    仕事のスピードを上げたければ、Altキーを使え!
  • pythonのフレームワークの「scrapy」を使ってみた。 - ITの隊長のブログ

    急遽クローラーが必要なことに 何でする!何でする!とキャッキャッヾ(*´∀`*)ノ ウフフしていたところ 久々にPythonを打ちたくなったので、Pythonを選定。 んで、便利なライブラリないかなーって探索していたら 「scrapy」という、フレームワークに出会った。 フレームワークかよ。と思いきや、結構便利そう。 せっかくなんで試してみることに! 環境は mac os x 10.9.3 python 2.7 インストール $ sudo pip install scrapy おし!入った。 ちな、easy_installでも入れられるっぽい $ easy_install Scrapy では、次にどれどれ・・・ あれ・・・? プロジェクトを作成しなきゃいけないっぽい。Djangoみたいだ。。。 ちなみに、ドキュメントはこちら Scrapy 0.22 documentation 全くではない

    pythonのフレームワークの「scrapy」を使ってみた。 - ITの隊長のブログ
  • Pythonでクローリング・スクレイピングに使えるライブラリいろいろ - orangain flavor

    2016-12-09追記 「Pythonクローリング&スクレイピング」というを書きました! Pythonクローリング&スクレイピング -データ収集・解析のための実践開発ガイド- 作者: 加藤耕太出版社/メーカー: 技術評論社発売日: 2016/12/16メディア: 大型この商品を含むブログを見る これはクローラー/スクレイピング Advent Calendar 2014の7日目の記事です。 Pythonでクローリング・スクレイピングするにあたって、いろいろなライブラリがあるので一覧でまとめてみます。 以下の4つのカテゴリにわけて紹介します。 Webページを取得する Webページからデータを抜き出す Webページの自動操作 総合的なフレームワーク なんでこれが載ってないの?この説明はおかしい!などありましたらお気軽にお知らせください。なお、この記事はいろいろなライブラリを紹介することを目

    Pythonでクローリング・スクレイピングに使えるライブラリいろいろ - orangain flavor
  • Scrapy 1.0が公開されました - orangain flavor

    Pythonの有名なWebスクレイピングフレームワークのScrapyがバージョン1.0になりました。*1 0.24からの主要な変更点は下記のとおりです。 SpiderでItemの代わりにdictを返せるようになった Spiderごとにsettingsを設定できるようになった Twistedloggingの代わりにPythonloggingを使うようになった CrawlerのコアAPIがリファクタリングされた いくつかのモジュール配置場所が変更された 他にも数多くの変更点がリリースノートに記載されています。 Scrapy 1.0の感想 大きな機能の追加よりも、APIの整理と安定性の向上がメインのようです。これまではバージョンを重ねるごとに便利になっていくものの、あまりAPIが安定していない印象でしたが、APIを安定させた区切りのリリースと言えるでしょう。1.0というメジャーバージョンに到

    Scrapy 1.0が公開されました - orangain flavor
  • Webstemmer(クローラーツール)

    語サイトでは、具体的な性能は測定していませんが、 以下のようなサイトで正しく動くことがわかっています: アサヒ・コム Nikkei NET Mainichi INTERACTIVE Yomiuri On-line IT media 東京新聞 日刊スポーツ 信濃毎日新聞 livedoor ニュース 使いかた Webstemmer をつかったテキスト抽出は以下のようなステップになります: まず、特定のニュースサイトから種となる HTML ページを多数取得する。 取得したページのレイアウトを学習する。 別の日に、同一のニュースサイトから新しい HTML ページを取得する。 2. で学習した結果をつかって、新しい HTML ページから文を抽出する。 1. および 2. のステップが必要なのは最初の 1回だけです。 ひとたびサイトのレイアウトを学習してしまえば、 あとはレイアウトが大きく変更さ