エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Treasure Data Analytics 第5回 〜ブックレビューデータセットによるデータ解析入門(実践編2) - doryokujin's blog
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Treasure Data Analytics 第5回 〜ブックレビューデータセットによるデータ解析入門(実践編2) - doryokujin's blog
前回の続きです。 5. 複数のノード・アクションをまたいだ分析 前回までは主に個々のノード・アクション... 前回の続きです。 5. 複数のノード・アクションをまたいだ分析 前回までは主に個々のノード・アクションのセグメント分析を行ってきましたが,ここからは,複数のノード・アクション(Query 的には複数のテーブルをまたがった記述に)をまたいだ解析を行っていきます。 5.1 過小/過大評価ユーザーおよび怠惰なユーザー(外れ値)の特定 ここではあるステータスから導かれる,外れ値とみなせるサンプルを特定してみましょう。 今回のようなレビューデータセットでは,例えば 10 段階評価の付け方であっても悪い評価を付けたがらないユーザーもいますし,めったに高評価を付けない辛口なユーザーもいます。もちろんこれらのユーザーは例外では無く,こういった多様性を考慮した上で解析を行っていくことは重要です。 ただ評価の付け方があまりにも偏っているユーザーに関しては外れ値として考慮した方が良いケースもあります。今回は以下