Python机器学习 给你一个数据集,这个数据集有缺失值,且这些缺失值分布在高中值有1一个标准偏差的的范围内,百分之多少的数据不会受到影响?为什么? 大约有32%的数据将不会受到缺失值的影响。因为,由于数据分布在中位数附近,让我们先假设这是一...
Python机器学习 在 K-means 或者 KNN,我们是用欧氏距离来计算最近的邻居之间的距离,为什么不用曼哈顿距离? 我们不用曼哈顿距离,因为它只计算水平或者垂直距离,有维度的限制。另一方面,欧氏距离可以用于任...
Python机器学习 你的数据集有 50 个变量,但是8个变量的缺失值高于 30%。如何解决这个问题? 您可以采用 3 种一般方法: 只是删除它们(不理想) 为缺失值分配唯一的类别,以查看是否有趋...