域名备案_出租云服务器_最新活动

小七 2019年10月25日 21:23 141 0

企业邮箱_快云域名注册_多少钱

这个博客将有助于使用python应用线性回归。

（这是博客的续集，人工智能技术发展，可在

上找到）https://blogs.sap.com/2019/07/04/linear-regression-in-machine-learning/)

使用数据科学和机器学习解决的问题涉及数据，大数据怎么查询，需要数据清洗。

一旦数据清洗完成，数据按照70/30规则进行划分。这意味着70%的总体数据用于训练，30%的数据保留在一边以测试模型。

采用70/30分布没有硬性规定。分区率是一个重要的方面，经验以及领域知识和可用记录的数量有助于很好地选择这个比率。

为什么要将数据分为训练数据和测试数据？

这样做是为了避免过度装配。假设数据集不分为训练数据和测试数据，大数据怎么学，使用完整的数据来训练模型。一旦模型准备好进行测试，那么测试数据将来自于训练数据本身。模型已经学习到了这些数据，一元云购下载，它将始终给出正确的答案。这意味着模型在部署之前从未正确测试过，而且很有可能在新数据集上表现不好。

测试将通过使用一组单独的测试数据来正确描述模型有多好，因为模型在训练期间从未见过这些数据。

python中的SKLearn库有助于实现这个

实例化一个对象

用拟合函数拟合模型

用测试数据预测标签

这里，y\u pred有预测值，y\u test有实际结果

现在，企业管理类软件，让我们比较y\u pred和y\u test来查看误差。

计算RMSE和R-square

均方误差和r2\u分数度量可用于评估模型性能。

本文地址： /shichang/66809.html