どん底から這い上がるまでの記録[B!]新着記事・評価 - はてなブックマーク

『どん底から這い上がるまでの記録』

収集したTwitterの対話データの前処理をする。 - どん底から這い上がるまでの記録
3 users
www.pytry3g.com

以前書いた記事でTwitterの対話データを集める方法を紹介しました。 www.pytry3g.com 紹介した方法を使えば膨大な数の対話データが簡単に手に入るというメリットがありますが、一方でTwitter特有の単語が多く含まれていてデータとして使えないなどのデメリットもあります。今回はその収集したデータに前処理をかけて、データとして使えるものとそうでないものに分けたいと思います。関連リンク正規表現を使う URL URLを含まないテキスト URL(https)を含むテキスト URL(http)を含むテキスト使用例おまけハッシュタグサンプル１サンプル２サンプル３ - 顔文字ユーザ名サンプル１サンプル２サンプル３ - 顔文字サンプル４ - 顔文字サンプル５ - 顔文字 replaceを使う。ソースコードおわりに関連リンク 6.2. re — 正規表現操作
- テクノロジー
- 2021/02/02 21:15
- python
- twitter

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx