1.特征选择主要方法,过滤式,嵌入式,包裹式 PCA主成分分析法,消减回归分析或者聚类分析中特征的数量 机器学习学习思想: 学会分析问题,学会用这些算法解决问题 机器学习算法分类: 监督学习:有特征值+目标值(***) 分类:离散型 回归:连续型 非监督学习:特征值 1000个样本
及建立模型:1.根据数据类型划分模型种类,原始数据 明确问题做什么 2.数据的基本处理:pd去处理数据(缺失值,合并表,,,) 3.特征工程(对特征进行处理)(重要) 分类: 回归: 4.找到合适算法去预测 5.模型的评估,判定效果