机器学习与深度学习的区别

Anonim

什么是机器学习?

机器学习是一组用于创建计算机程序的方法,可以从观察中学习并进行预测。机器学习使用算法,回归和相关科学来理解数据。这些算法通常可以被认为是统计模型和网络。

什么是深度学习?

深度学习是机器学习方法的一个子集。通过深度学习网络的多个层解析数据,以便网络可以得出结论并对数据做出决策。深度学习方法可以在大数据集上实现高精度,但这些特性使得深度学习比传统的机器学习更加耗费资源。

机器学习与深度学习的区别

与人工智能的关系

几十年来,机器学习一直被用作在机器中实现人工智能的方法。机器学习领域的核心是创建可以学习和制定决策的计算机,这使得机器学习非常适合人工智能研究。然而,并非所有机器学习模型都旨在开发完全匹配或超越人类智能的“真实”人工智能。相反,模型通常用于研究特定的有限问题。

在机器学习讨论的早期阶段提出了深度学习,但很少有研究人员采用深度学习方法,因为深度学习的计算要求比经典机器学习要大得多。然而,计算机的计算能力自2000年以来呈指数级增长,使研究人员能够在机器学习和人工智能构建方面取得巨大进步。由于深度学习模型可以随着数据的增加而扩展,因此深度学习有可能克服创建真正人工智能的重大障碍。

机器基础建设与深度学习

机器学习和深度学习都是算法。在经典机器学习中,研究人员使用相对少量的数据,并确定算法所需的数据中最重要的特征是什么,以便进行预测。此方法称为特征工程。例如,如果正在教授机器学习程序以识别飞机的图像,则其程序员将制作允许程序识别商用飞机的典型形状,颜色和尺寸的算法。利用这些信息,机器学习程序将预测它是否与包含飞机一起呈现的图像。

深度学习通常通过其多层决策与经典机器学习区分开来。深度学习网络通常被认为是“黑匣子”,因为数据是通过多个网络层解析的,每个网络层都进行观察。这可能使结果比传统机器学习的结果更难理解。决策层的确切层数或步骤取决于所选模型的类型和复杂程度。

机器和深度学习中的数据和可伸缩性

机器学习传统上使用小数据集来学习和预测。通过少量数据,研究人员可以确定有助于机器学习计划理解和学习数据的精确功能。但是,如果程序遇到无法根据其预先存在的算法进行分类的信息,研究人员通常需要手动分析有问题的数据并创建新功能。因此,经典机器学习通常不能很好地扩展大量数据,但它可以最小化较小数据集上的错误。

深度学习尤其适用于大型数据集,而模型通常需要大型数据集才有用。由于深度学习网络的复杂性,网络需要大量的训练数据和额外的数据来在训练后测试网络。目前,研究人员正在改进深度学习网络,这种网络可以更高效并使用更小的数据集。

机器和深度学习的性能要求

机器学习具有可变的计算机性能要求有很多型号可以在普通的个人电脑上运行。统计和数学方法越先进,计算机就越难以快速处理数据。

深度学习往往是非常耗费资源的。通过多层决策解析大量信息需要大量的计算能力。随着计算机变得更快,深度学习越来越容易获得。

机器和深度学习的局限性

传统上,机器学习有一些共同的和重要的限制。过度拟合是一个统计问题,可能会影响机器学习算法。机器学习算法在分析和预测数据时包含一定量的“错误”。该算法应该显示相关变量之间的关系,但是在过度拟合中,它也开始捕获错误,这导致“噪声更大”或不准确的模型。机器学习模型也可能变得偏向于他们训练的数据的特性,这个问题在研究人员在整个可用数据集上训练算法而不是保存一部分数据来测试算法时尤为明显。

深度学习与经典机器学习具有相同的统计缺陷,以及一些独特的问题。对于许多问题,没有足够的可用数据来训练一个相当准确的深度学习网络。收集更多数据或模拟现实问题往往成本过高或不可能,这限制了深度学习可用于的当前主题范围。

机器和深度学习的比较表

机器概述深度学习

机器学习和深度学习都描述了教授计算机学习和决策的方法。深度学习是经典机器学习的一个子集,一些重要的分歧使得深度学习和机器学习都适合不同的应用。

  • 经典的机器学习通常包括程序员的特征工程,这有助于算法对一小组数据进行准确的预测。深度学习算法通常设计有多层决策,需要较少的特定特征工程。
  • 传统上,深度学习用于非常大的数据集,因此可以训练网络或算法以做出许多分层决策。经典机器学习使用较小的数据集,并不像深度学习那样可扩展。
  • 尽管深度学习可以很好地学习大量数据,但是存在许多问题,其中没有足够的可用数据来使深度学习变得有用。深度学习和机器学习都具有标准的统计限制,如果训练数据集非常特殊或者使用不正确的统计技术收集,则可能存在偏差。