タグ

2020年12月29日のブックマーク (2件)

  • Youtube Data APIを使ってPythonでYoutubeデータを取得する - Qiita

    はじめに 最近、APIを用いて色々なデータを取得できないかを調べています。 Youtube Data APIを使用して動画の再生回数やいいね数などの情報取得する方法を調べて実践したので覚書的に記事にまとました。 参考 Youtube Data APIの使用に当たって下記を参考にいたしました。 PythonでYoutube動画検索 YouTube Data API の概要 Youtube Data API のリファレンス APIの使用準備 Youtube Data APIの登録 Youtube Data APIの取得にはまずGoogleアカウントが必要になります。 下記手順でYotube Data APIの登録を行い、APIキーを取得します。 Google Cloud Platformにアクセスした後新しいプロジェクトを作成 新たに作成したプロジェクトにチェックを入れた状態で「APIとサービ

    Youtube Data APIを使ってPythonでYoutubeデータを取得する - Qiita
  • pLSAとNMFが等価なのか確かめてみた - Qiita

    この記事は古川研究室 Advent_calendar 10日目の記事です。 記事は古川研究室の学生が学習の一環として書いたものです。内容が曖昧であったり表現が多少異なったりする場合があります。 はじめに 文書をクラスタリングする有名な手法として非負値行列因子分解(NMF)や確率的潜在意味解析(pLSA)があります. 2つの手法は実は等価であるらしいので参考論文を読んでメモ書き程度に自分なりにまとめてみました. 詳しくは参考資料をみてください. 与えられるデータについて 各文書を単語の出現頻度で表現するBag of Wordsの形で文書を表現します. $F_{ij}$は$\sum_{i}^{I} \sum_{j}^{J} F_{ij}=1$を満たし、単語$w_i$が文書$d_j$での出現する確率を$p(w_i,d_j)$を表しています. $M$: 単語数 $N$: 文書数 データ行列: $

    pLSAとNMFが等価なのか確かめてみた - Qiita