什么是深度学习?

霍林郭勒网 2020-02-07 15:14:23

深度学习是一种先进的人工智能技术，在过去的几年中，由于海量的数据和增强的计算能力，它已变得越来越流行。这是我们每天使用的许多应用程序背后的主要技术，包括在线语言翻译和社交媒体中的自动面部标记。

该技术还被证明对医疗保健有用：今年早些时候，麻省理工学院(MIT)的计算机科学家利用深度学习创建了一种用于检测乳腺癌的新计算机程序。

经典模型要求工程师手动定义检测癌症的规则和逻辑，但是对于这种新模型，科学家们提供了深度学习算法，对来自60,000名患者的90,000次全分辨率乳房X线照片进行了扫描，并让其找到了患者扫描之间的常见模式最终罹患乳腺癌的人和那些没有患乳腺癌的人。它可以提前五年预测乳腺癌，比以前的风险预测模型有了很大的改进。

机器学习到底是什么?

深度学习是机器学习的一个子集，它是人工智能的一个分支，可将计算机配置为通过经验执行任务。与经典的基于规则的AI系统相反，机器学习算法通过处理带注释的示例来开发其行为，该过程称为“训练”。

例如，要创建欺诈检测程序，您可以使用银行交易清单及其最终结果(合法或欺诈)来训练机器学习算法。机器学习模型检查示例，并开发合法交易和欺诈交易之间共同特征的统计表示。之后，当您向算法提供新银行交易的数据时，它将根据从训练示例中收集的模式将其分类为合法或欺诈。

根据经验，您提供的数据质量越高，机器学习算法在执行任务时就越准确。

机器学习在解决规则定义不明确且无法编码为不同命令的问题时特别有用。不同类型的算法擅长于不同任务。

深度学习和神经网络

尽管经典的机器学习算法解决了基于规则的程序所遇到的许多问题，但它们在处理诸如图像，视频，声音文件和非结构化文本之类的软数据时却表现欠佳。

AI研究人员和数据科学家Jeremy Howard表示，例如，使用经典的机器学习方法创建乳腺癌预测模型将需要数十名领域专家，计算机程序员和数学家的努力。研究人员将不得不进行大量的特征工程设计，这是一个艰巨的过程，需要对计算机进行编程才能在X射线和MRI扫描中找到已知的图案。之后，工程师在提取的功能之上使用机器学习。创建这样的AI模型需要花费数年时间。

深度学习算法使用深度神经网络解决了相同的问题，深度神经网络是一种受人脑启发的软件体系结构(尽管神经网络与生物神经元不同)。神经网络是一层层的变量，它们可以根据自己所训练的数据的属性进行调整，并能够执行诸如对图像进行分类以及将语音转换为文本之类的任务。

神经网络特别擅长在非结构化数据中独立查找常见模式。例如，当您在不同对象的图像上训练深层神经网络时，它会找到从这些图像中提取特征的方法。神经网络的每一层都检测特定的特征，例如边缘，拐角，面部，眼球等。

神经网络的顶层检测一般特征。更深的层检测实际对象(来源：arxiv.org)

通过使用神经网络，深度学习算法消除了对特征工程的需求。就麻省理工学院的乳腺癌预测模型而言，得益于深度学习，该项目所需的计算机科学家和领域专家的工作量大大减少，开发时间也减少了。此外，该模型还能够找到人类分析师错过的乳房X线照片扫描中的特征和图案。

自1950年代以来(至少在概念上)存在神经网络。但是直到最近，AI社区还是大都拒绝了它们，因为它们需要大量的数据和计算能力。在过去的几年中，存储，数据和计算资源的可用性和可承受性将神经网络推向了AI创新的前沿。

深度学习有什么用?

深度学习可以在多个领域帮助计算机解决以前无法解决的问题。

计算机视觉：计算机视觉是使用软件来理解图像和视频内容的科学。这是深度学习取得很大进步的领域之一。除了乳腺癌之外，深度学习图像处理算法还可以检测其他类型的癌症并帮助诊断其他疾病。

但是，深度学习也根植于您每天使用的许多应用程序中。苹果的Face ID使用深度学习，而Google相册也将深度学习用于各种功能，例如搜索对象和场景以及校正图像。Facebook使用深度学习来自动标记您上传的照片中的人物。

深度学习还可以帮助社交媒体公司自动识别和阻止可疑内容，例如暴力和裸露内容。最后，深度学习在使无人驾驶汽车了解周围环境方面发挥着非常重要的作用。

语音和语音识别：当您向Amazon Echo智能扬声器或Google Assistant说出命令时，深度学习算法会将语音转换为文本命令。一些在线应用程序使用深度学习来转录音频和视频文件。Google最近发布了一款设备上的实时Gboard语音转录智能手机应用程序，该应用程序使用深度学习功能在您讲话时进行打字。

自然语言处理(NLP)和生成(NLG)：自然语言处理是提取非结构化文本含义的科学，一直是经典软件的历史难题。用计算机规则定义书面语言的所有细微差别和隐藏含义实际上是不可能的。但是在大量文本上训练的神经网络可以准确地执行许多NLP任务。

当Google转换为深度学习时，其翻译服务的性能突然提升。智能扬声器使用深度学习的NLP来了解命令的各种细微差别，例如您询问天气或方向的不同方式。

深度学习在生成有意义的文本(也称为自然语言生成)方面也非常有效。Gmail的Smart Reply和Smart Compose使用深度学习来对您的电子邮件和建议进行相关回复，以完善您的句子。OpenAI今年早些时候开发的文本生成模型创建了连贯文本的长篇摘录。

深度学习的局限性

尽管有很多好处，深度学习也有一些缺点。

数据依赖性：通常，深度学习算法需要大量的训练数据才能准确地执行任务。不幸的是，对于许多问题，没有足够的质量训练数据来创建深度学习模型。

可解释性：神经网络以极其复杂的方式发展其行为-即使其创建者也难以理解其行为。缺乏可解释性使得在深度学习算法中对错误进行故障排除和修复错误极为困难。

算法偏差：深度学习算法与其所训练的数据一样好。问题在于训练数据通常包含隐藏或明显的偏差，而算法继承了这些偏差。例如，主要在白人的图片上训练的面部识别算法在非白人上的表现会较不准确。

缺乏概括性：深度学习算法擅长执行重点任务，但不擅长概括其知识。与人类不同，经过训练可以玩《星际争霸》的深度学习模型将无法玩类似的游戏：例如《魔兽争霸》。而且，深度学习在处理偏离其训练示例(也称为“边缘案例”)的数据方面很差。在无人驾驶汽车等情况下，这可能会带来危险，因为错误可能导致致命的后果。

深度学习的未来

今年早些时候，深度学习的先驱者获得了图灵奖，这是与诺贝尔奖相当的计算机科学。但是深度学习和神经网络的工作还远远没有结束。正在努力改善深度学习。