PPSのメリット 先の通り、二次関係𝑦=𝑥² の相関係数は0となりますが、PPS は𝑥から𝑦が0.67 、𝑦から𝑥のPPSは0となります。相関では関係の有無がわからない非線形関係もPPSなら検出することができます。 ブログでは、kaggle「タイタニック生存予測」での比較例も示されていました。 『「中程度の負の相関(-0.55)」があったTicketPriceとClass(客室クラス)のPPSをみると「TicketPriceはClass (客室クラス)の強い予測因子(0.9PPS)、Class (客室クラス)はTicketPriceを0.2PPSで予測するだけ」という関係にあった』とあります。 ※Datasetのカラム名 Fare⇒TicketPrice,Ticket⇒TicketID,Pclass⇒Class,Embarked⇒Portに変えてる? TicketPriceでC