!/usr/bin/env python -*- coding: utf-8 -*-
※2019年3月時点の情報です Twitterデータを分析しようと思い、データ収集方法を調べました。 地味に色々なサイトを見て回ることになったので備忘録としてまとめておきます。 準備 Twitterは事前の承諾なしのスクレイピングを禁止しているので、APIを使う必要があります。 Twitter APIの登録については以下の記事がわかりやすいです。 Twitter API 登録 (アカウント申請方法) から承認されるまでの手順まとめ 300文字の英作文では以下の記事が役に立ちました。 TwitterAPIの申請に必要な英作文をユルく和訳してみた 私の場合、新規に作成したアカウントで申請から4時間程度で承認されました。 使うライブラリ OAuth1Session twitter python-twitter tweepy などからどれか好きなもの。どれを使っても大差はないと思います。 今回は一
1. はじめに 週刊少年ジャンプ(以下,ジャンプ)は,日本で最も売れている漫画雑誌1です.言うまでもなく,私は大ファンです. ジャンプ編集部の連載会議は非常にシビアです.ジャンプ作家の奮闘を描いたフィクション漫画「バクマン。」では,編集部が毎号の読者アンケートをもとに各漫画の人気を評価し,掲載順や打ち切り作品を決定する様子が描かれています2.連載開始から10週以内(単行本約1冊分)で連載が打ち切られてしまうことも珍しくありません.とても厳しい世界です. 本記事では,機械学習を使って,短命作品(10週以内に終了する作品)の予測を行います.究極の目標は,ジャンプ編集部より先に打ち切り作品を予測し,好みの作品が危ない場合はアンケートを出して打ち切りを回避することです3.我々は読者アンケートの結果を知ることができないので,掲載順の履歴を入力とし,短命作品か否かを出力する多層パーセプトロン4をTen
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く