2019十大机器学习面试必看问题

e43bcc22-05ef-4cf8-86e3-5b024a8f441e

机器学习

本文由|翻译dzone.com

新兴技术席卷全球。他们带来的创新,机遇和威胁是独一无二的。随着他们的成长,对这些领域的专家的需求也在增长。

根据最新的行业报告,机器学习,人工智能和数据科学等新兴技术的研究是最热门的新兴行业。在机器学习,人工智能或数据科学等新兴技术领域的职业生涯可以带来丰厚的利润和智慧。

在本文中,我编写了一些最常见的机器学习面试问题并给出了相应的答案。那些对机器学习感兴趣的人,以及经验丰富的ML专业人员,可以在面试前使用它来提高他们的基本知识。

1. 机器学习和深度学习的区别是什么?

机器学习是人工智能的一个子集,它使机器能够在没有任何明确编程的情况下自动学习和改进。深度学习是机器学习的一个子集,人工神经网络可以做出直观的决策。

2. 你对回忆和精确的理解是什么?

召回率也称为真正的正率。它指的是模型声明的正数与整个数据中可用的正数之比。

准确性,也称为阳性预测值,基于预测。它衡量的是模型声明的确切阳性数量与模型实际声明的阳性数量的比较。

3. 有监督机器学习和无监督机器学习的区别?

在监督学习中,机器在标记数据的帮助下进行训练,即具有正确答案标签的数据。在无人监督的机器学习中,模型通过自己发现信息来学习。无监督学习模型比监督学习模型更适合于执行困难的处理任务。

4. k -的意思和KNN是什么?

K-means是一种用于聚类问题处理的无监督算法。 KNN或K最近邻是用于回归和分类处理的监督算法。

5. 什么使分类不同于回归?

这两个概念都是监督机器学习技术的重要方面。通过分类,输出被分成不同的类别用于预测。回归模型通常用于查找预测和变量之间的关系。分类和回归之间的关键区别在于前者的输出变量是离散的,而后者是连续的。

6. 如何处理数据集中丢失的数据?

数据科学家面临的最大挑战之一是数据丢失问题。您可以通过多种方式设置缺失值的属性,包括分配唯一类别,行删除,使用均值/中位数/模式替换,使用支持缺失值的算法以及预测缺失值。

7. 你对归纳逻辑编程(ILP)理解是什么?

归纳逻辑编程是机器学习的一个子领域,它使用逻辑编程来开发预测模型以搜索数据中的模式。该过程假设逻辑程序是假设或背景知识。

8. 您需要哪些步骤来确保您不与特定的模型过度匹配?

当模型在训练中提供大量数据时,它从噪声和其他错误数据集的数据开始。这使得模型难以学习概括新的示例。除了训练集之外,还有三种方法可以避免机器学习过度拟合。第一种方法是保持模型简单,第二种方法是使用交叉验证技术,第三种方法是使用正规化技术,如LASSO。

9. 什么是整体学习?

集成方法也称为学习多个分类器系统或基于提交的学习。积分方法是一种学习算法,它构建分类器集,然后对新数据点进行分类以预测它们。这种方法训练许多假设来解决同样的问题。集成建模的最佳示例是随机林树,其中许多决策树用于预测结果。

10. 请说出机器学习项目中需要的步骤?

为了实现一个良好的工作模型,您应该采取的一些关键步骤是收集数据、准备数据、选择机器学习模型、模型培训、评估模型、调整参数以及最终预测。

http://www.sugys.com/bdsI/w5Lc