都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト R Advent Calendar 2017の11日目を担当するMr_Sakaueです。 今回はrvestパッケージを用いて、友人がハマっているポケモンの情報を集めてみようと思います。 もっとも、業務でWebスクレイピングする際はPythonでBeautifulSoupやSeleniumを使うことがほとんどなのですが、たまにはRでやってみようと思います。 目次 ・やりたいこと ・rvestについて ・データの取得と集計と可視化と分析 ・まとめ ・参考情報 やりたいこと
一人Rアドベントカレンダーの3日目。何日まで続くかわからないが、@dichika さんを見習って続ける。 今日は仕事の話だ。植物生態学、特に群集データを扱う時のtipsについて書いてみたい。 群集を対象にした調査を行った場合、1種だけが出現した、ということは稀であり、群集内に生育するさまざまな種をデータとして扱う必要がある。その際、種名データは和名で記載されているものを学名にして、さらに単純化のために属名と種小名からなる記号として扱うことがしばしばある。 この時の和名を学名に直す作業を、図鑑を参照しながらちまちまやると時間がかかるし、打ち間違えも発生しやすい(学名は長い)。特に30種とかになると辛い。そのため以前は「BG Plants 和名−学名インデックス(通称YList)」(http://ylist.info) が提供しているcsvファイルから、和名と種名(学名)のマッチングで対応して
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く