閱讀完參考資料的心得
WOE
- Weighted of Evidence
- 變項中各選項對於最後結果(好或壞)的影響
- WoE越高風險越低
- $ Distr\ Goods $ 為一比率,分母是所有的正例數,分子是該變量的正例數。
$$ WoE = [ln(\frac{Distr\ Goods}{Distr\ Bads} )] * 100 $$
IV
- Information Value
- 例如性別變數有男女兩類,i就等於2
- IV代表的是單一變項對於結果的影響力
- 通常 IV > 0.3代表變項對結果有強烈的影響力, 0.1~0.3代表中度影響力
$$ IV = \sum_{i=1}^{n}[(Distr\ Goods_{i} - Distr\ Bads_{i}) * ln(\frac{Distr\ Goods_{i}}{Distr\ Bads_{i}})] $$