Python 机器学习面试题阅读指南(必看)
大家好,我是帅地。 为了方便大家复习,这些面试题的展示采取了右边面试题目,左边答案的方式,方便大家按需查看。 由于手机端不支持这种展示方式,当然,为了手机方便阅读,下面会贴出所有面试题答案链接,不过大家最好在 PC 电脑端阅读哈,相关面试题还会持续更新,尽量补充完善起来,建议收藏帅地的网站哦。
面试题链接汇总
3. 什么是机器学习的过度拟合现象?过度拟合产生的原因?如何避免过拟合问题?
22. 使用 scikit-learn 时,是否确实需要在特征值变化很大时调整特征值?
23. 你的数据集有 50 个变量,但是8个变量的缺失值高于 30%。如何解决这个问题?
25. 你认为把分类变量当成连续型变量会得到一个更好的预测模型吗?
26. 在 K-means 或者 KNN,我们是用欧氏距离来计算最近的邻居之间的距离,为什么不用曼哈顿距离?
27. 给你一个数据集,这个数据集有缺失值,且这些缺失值分布在高中值有1一个标准偏差的的范围内,百分之多少的数据不会受到影响?为什么?
32. 我们知道,独热编码(OneHotEncoder)会增加数据集的维度。但是标签编码(LabelEncoder)不会。为什么?