CSDN热搜
1.1.3.1.1. 这种方法并不总能验证因果假设或预测结果,但确实能够使用算法定义或改善变量之间的关系,从而为这种分析提供输入
1.1.3.2.1. 虽然它使用类似于数据挖掘和预测分析的技术,但其目的却不同
1.1.3.2.2. 它不能预测结果,只是将模型结果与现有数据相匹配
1.1.3.2.3. 预测分析的关键是通过训练模型来学习,学习方法的效果取决于它在测试集(与训练集相互独立)上的预测能力
1.1.3.2.4. 评估将指导学习算法的选择并度量所选模型的质量
1.1.3.2.5. 避免过度拟合——这种情况发生在用于训练模型的数据集不具有代表性,模型过于复杂,或者将少量噪声数据具有的特性当作大部分数据的共性时
1.1.3.2.6. 训练误差会随着模型复杂性的提高而持续降低,并且可以降至零
1.1.3.2.6.1. 它不是对测试误差的可用估量
1.1.3.2.6.2. 将数据集随机分为三个部分:训练集、测试集和校验集
1.1.3.2.6.3. 重复使用相同的测试集可能会低估真正的测试误差
使用道具 举报
本版积分规则 回帖并转播 回帖后跳转到最后一页
程序园优秀签约作者
0
粉丝关注
14
主题发布