1、人工智能基础-简单线性回归实战大纲回顾场景说明KNIME 建立工作流节点注释大纲回顾回归(Regression)简单线性回归偏置(Bias)权重(Weight)协变量(Covariance)特征(Feature)响应,应变量(Response)标记(Label)大纲场景说明场景说明 根据工作年限与工资的对应关系表,找出二者之间的关系,并预测“未知”工作年限时,工资会有多少。大纲KNIME 建立工作流机器学习工作流程数据获取数据处理模型训练模型测试模型优化KNIME建立工作流数据获取数据处理模型训练模型测试模型优化KNIME建立工作流KNIME建立工作流 导入数据待设置,且有警告已设置,待运行这
2、个节点状态是是什么待运行正在运行已运行错误单选题1分KNIME建立工作流 观察数据选中刚建的节点工具栏“运行按钮”已运行KNIME建立工作流 数据可视化KNIME建立工作流数据获取数据处理模型训练模型测试模型优化KNIME建立工作流 已有数据划分为训练数据和测试数据 训练数据:训练模型 测试数据:测试模型KNIME建立工作流 训练 已知 x 和 y,求 b 和 wKNIME建立工作流 测试 根据训练出来的 b 和 w,使用没有参加训练的 x 预测 y 是多少,然后比较这个预测的 y 与真实的 y 的差别KNIME建立工作流 数据划分:训练集,测试集数据训练数据(多数)训练模型测试数据(少数)测
3、试模型新的数据预测现有数据KNIME建立工作流 数据划分:训练集,测试集数据训练数据(多数)上课听讲测试数据(少数)课后作业新的数据考试现有数据下列关于数据的说法正确的是训练数据应该多于测试数据测试数据可有可无训练数据用来训练模型测试数据包括完整的特征和标记数据,所以测试数据也可以用来训练模型多选题2分KNIME建立工作流 数据划分:训练集,测试集数据划分训练集:75%,测试集:25%KNIME建立工作流数据获取数据处理模型训练模型测试模型优化KNIME建立工作流 建立模型 设置特征和目标使用线性回归模型设置目标和特征KNIME建立工作流 建立模型 运行模型KNIME建立工作流 解释模型模型K
4、NIME建立工作流 解释模型 Intercept:没有工作经验的话,能拿多少钱 Coeff.:每增加一年工作经验,工资涨多少?你觉得你想这两数怎么变?如果这是你的个人数据预测结果你希望?斜率更大Intercept更大斜率更小Intercept更小投票最多可选2项KNIME建立工作流 解释模型R-Squared(决定系数)越接近 1 越好P值(P Value)越小越好一般小于0.05的才算小P 值某参数w可能取值0但是仍然有可能取 0模型建立以后,权重 w 如果是 0 的话,模型其实没什么用权重 w 有可能是 0 吗P 值某参数w可能取值0但是仍然有可能取 0模型建立以后,权重 w 如果是 0
5、的话,模型其实没什么用权重 w 有可能是 0 吗P 值零假设:假设参数就是 0p值检验零假设成立的可能性。p值若与选定显著性水平(0.05或0.01)相比更小,则零假设会被否定而不可接受。某参数w可能取值0W 有多大可能是 0?KNIME建立工作流数据获取数据处理模型训练模型测试模型优化KNIME建立工作流 验证及测试模型模型新的输入历史数据未知训练预测KNIME建立工作流 验证及测试模型 预测:将测试数据输入已训练模型输入训练好的模型输入测试数据KNIME建立工作流 验证及测试模型 查看预测效果KNIME建立工作流 对比真实数据与测试数据KNIME节点注释 提高可读性损失函数损失函数(loss function,cost function)是用来估量模型的预测值与真实值的不一致程度一个非负实值函数损失函数越小,模型的稳健性就越好。我们会通过叫做梯度下降算法的方法使损失函数最小化,从而优化模型。对于线性回归问题,R2很常用(统计方法)都是损失函数,一般看MSE就行了https:/ R2来优化模型小结&提问 KNIME可以方便的建立机器学习工作流 KNIME可以方便的查看模型效果