タグ

ブックマーク / qiita.com/tsurime (1)

  • テレビ放送から諸々扱えそうなテキストを取得する - Qiita

    はじめに マイニングに使われていたらしい「ビデオ出力のないビデオカード(RX470)」と「PCIExpress x1が10個以上あるマザーボード(CPU込)」を入手しました。「目的のためのお買い物」ではなく「目的は買ってから考える」のはいつものこと^^;、ということで。 今更マイニングもないし、機械学習とかかな?チャットボット作ってみたいな~、と調べてみると、大量の学習データが必要とか。学習データ、どうやって調達するのかしら?と先人の業を見るに、ネットにある会話コーパスを利用したり、twitterでreplyを集めたり、とからしく。 他に会話を集める方法はないのかしら?と考えていたら 「放送電波に垂れ流しになってる会話を利用すればいいんじゃね?」 となにかが降りてきました。 そういえば、データ放送に文字情報ってあるよね? 目的 というわけで。テレビの放送電波に乗ってる文字情報を、いろいろに

    テレビ放送から諸々扱えそうなテキストを取得する - Qiita
  • 1