标签:特征选择

特征工程

专栏 | 基于 Jupyter 的特征工程手册:特征选择(五)

5

红色石头 发布于 2020-05-24

数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行...

阅读(9628)评论(0)赞 (2)

特征工程

专栏 | 基于 Jupyter 的特征工程手册:特征选择(四)

6

红色石头 发布于 2020-05-07

数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行...

阅读(10474)评论(0)赞 (1)

特征工程

专栏 | 基于 Jupyter 的特征工程手册:特征选择(三)

6

红色石头 发布于 2020-04-24

数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行...

阅读(10100)评论(0)赞 (2)

特征工程

专栏 | 基于 Jupyter 的特征工程手册:特征选择(二)

11

红色石头 发布于 2020-04-24

数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行...

阅读(8729)评论(0)赞 (2)

特征工程

专栏 | 基于 Jupyter 的特征工程手册:特征选择(一)

9

红色石头 发布于 2020-04-22

数据预处理后,我们生成了大量的新变量(比如独热编码生成了大量仅包含0或1的变量)。但实际上,部分新生成的变量可能是多余:一方面它们本身不一定包含有用的信息,故无法提高模型性能;另一方面过这些多余变量在构建模型时会消耗大量内存和计算能力。因此,我们应该进行特征选择并选择特征子集进行...

阅读(10536)评论(0)赞 (7)