WOE and IV in R

2017-02-07

閱讀完參考資料的心得

WOE

  • Weighted of Evidence
  • 變項中各選項對於最後結果(好或壞)的影響
  • WoE越高風險越低
  • $ Distr\ Goods $ 為一比率,分母是所有的正例數,分子是該變量的正例數。

$$ WoE = [ln(\frac{Distr\ Goods}{Distr\ Bads} )] * 100 $$

IV

  • Information Value
  • 例如性別變數有男女兩類,i就等於2
  • IV代表的是單一變項對於結果的影響力
  • 通常 IV > 0.3代表變項對結果有強烈的影響力, 0.1~0.3代表中度影響力

$$ IV = \sum_{i=1}^{n}[(Distr\ Goods_{i} - Distr\ Bads_{i}) * ln(\frac{Distr\ Goods_{i}}{Distr\ Bads_{i}})] $$