代码详解:准确率惊人!用Credit R创建信用风险评分模型(14)

clustering_data <- variable.clustering(eliminated_data\"creditability\" 2)

clustering_data

输出:

# Returns the data for variables that have the maximum gini value in the dataset

selected_data <- variable.clustering.gini(eliminated_data\"creditability\" 2)

在某些情况下 , 集群的平均相关性很重要 , 因为集群的数量设置可能不正确 。 因此 , 如果集群具有较高的平均相关性 , 则应该对其进行详细检查 。 相关性值(在集群1中只有一个变量)为NaN 。

correlation.cluster(eliminated_dataclustering_datavariables = \"variable\"clusters = \"Group\")

输出:

推荐阅读