数据挖掘课程培训预测和分类预测预测分类分类目标变量是连续型或有序值目标变量是离散型或类属标号预测器分类器回归分析、移动平均法决策树、贝叶斯、支持向量机未来销量预测未知类别分类如何分类获取相应数据构造分类器1测试分类器优化分类器2模型训练训练数据分类算法分类规则决策树贝叶斯神经网络K-近邻(KNN)支持向量机模型测试测试数据分类规则新数据特征a、b、c判定所属分类为x准备工作数据清洗相关分析数据规约评估标准准确率速度鲁棒性可伸缩性可解释性分类器正确预测未知数据的能力训练和使用分类器的时间消耗分类器对噪声数据和缺失数据的处理能力分类器对大量数据的处理能力容易理解解释的分类器规则决策树否还款婚姻状况纳税收入是否否否是已婚 单身,离异 8K Gain(湿度)Gain(是否有风)Gain(温度),所以选择天气作为第一层分支节点。对于其每一个分支,重复前面三步,直至决策树生成完毕。决策树模型