深度学习

初学者必看!深度学习入门指南

前言

机器学习技术为现代社会的许多领域提供了强大的技术支持:从网络搜索到社交网络的内容过滤,再到电子商务网站的产品推荐。机器学习技术正越来越多的出现在消费级产品上,比如照相机和智能手机。 机器学习系统可用于识别图像中的对象,将语音转换成文本,选择搜索结果的相关项,以及匹配新闻、帖子或用户感兴趣的其他东西。 类似的应用越来越多,它们都使用了一种叫做深度学习的技术。

深度学习(也称为深层结构学习、层次学习或深度机器学习)是基于对数据中的高级抽象进行建模的算法,它属于机器学习的分支。最简单的例子,你可以有两组神经元:接收输入信号的神经元和发送输出信号的神经元。当输入层接收到输入时,它将输入的修改版本传递给下一层。在深层网络中,输入和输出层之间有很多层(层并不是由神经元构成,这里只是为了帮助你思考),这些层允许算法使用多个处理层,这些层包含了多个线性和非线性变换。

一文读懂深度学习与机器学习的差异

机器学习和深度学习变得越来越火。突然之间,不管是了解的还是不了解的,所有人都在谈论机器学习和深度学习。无论你是否主动关注过数据科学,你应该已经听说过这两个名词了。

为了展示他们的火热程度,我在 Google trend 上搜索了这些关键字:

如果你想让自己弄清楚机器学习和深度学习的区别,请阅读本篇文章,我将用通俗易懂的语言为你介绍他们之间的差别。下文详细解释了机器学习和深度学习中的术语。并且,我比较了他们两者的不同,别说明了他们各自的使用场景。

什么是机器学习和深度学习?

让我们从基础知识开始:什么是机器学习?和什么是深度学习?如果你对此已有所了解,随时可以跳过本部分。

什么是机器学习?

一言以蔽之,由 Tom Mitchell 给出的被广泛引用的机器学习的定义给出了最佳解释。下面是其中的内容:

2017年10月24日,中国AI创业公司深鉴科技在北京举行盛大的2017新品发布会,面向如火如荼的AI应用集中推出五款基于赛灵思全可编程技术的自主研发的智能产品与深鉴深度学习开发软件DNNDK,强势参与人工智能领域软件、场景、数据战场的角逐,为更广泛的人工智能应用注入了强大的驱动力。

深鉴科技此次发布的五款产品包括深鉴科技的人脸检测识别模组、人脸分析解决方案、视频结构化解决方案、深鉴ARISTOTLE架构平台,以及深鉴语音识别加速方案。其中前四款均为视频监控应用平台及相关解决方案。(图1:深鉴科技CEO 姚颂发布基于赛灵思Zynq-7020 的DP-1200-F1 人脸分析和识别解决方案)

赛灵思公司FPGA 实现软件及SDx 应用副总裁Sudip Nag博士出席了深鉴科技的发布会并发言,展示了赛灵思与深鉴在深度学习领域良好而稳固的合作关系,对深鉴在FPGA领域的潜能及发展速度表示的肯定的同时,也表示深鉴科技紧密合作, 共同深耕深度学习市场, 推动更多基于深度学习的精彩应用。

给 AI 换个“大动力小心脏”之通用 CNN 加速设计

作者:王玉伟

导语

基于FPGA的通用CNN加速设计,可以大大缩短FPGA开发周期,支持业务深度学习算法快速迭代;提供与GPU相媲美的计算性能,但拥有相较于GPU数量级的延时优势,为业务构建最强劲的实时AI服务能力。

WHEN?深度学习异构计算现状

随着互联网用户的快速增长,数据体量的急剧膨胀,数据中心对计算的需求也在迅猛上涨。同时,人工智能、高性能数据分析和金融分析等计算密集型领域的兴起,对计算能力的需求已远远超出了传统CPU处理器的能力所及。

深度学习初学者必须了解的基本知识

深度学习是计算机领域中目前非常火的话题,不仅在学术界有很多论文,在业界也有很多实际运用。本篇博客主要介绍了三种基本的深度学习的架构,并对深度学习的原理作了简单的描述。

简介
机器学习技术在当代社会已经发挥了很大的作用:从网络搜索到社交网络中的内容过滤到电子商务网站的个性化推荐,它正在快速的出现在用户的消费品中,如摄像机和智能手机。机器学习系统可以用来识别图像中的物体,将语音转变成文字,匹配用户感兴趣的新闻、消息和产品等,也可以选择相关的搜索结果。这些应用越来越多的使用一种叫做“深度学习(Deep Learning)”的技术。

基于AWS使用深度学习的10个Linux命令

在AWS上执行大规模的深度学习处理是一个廉价而且有效的学习和开发方式。花少量的钱就可以使用数十GB的内存,数十个CPU,多个GPU,这是值得推荐的。

如果你是使用EC2或者Linux 命令的新人,在云端执行深度学习脚本的时候, 这些命令是非常有效的。
本文的主要内容包括:
1)在本机和EC2实例间复制数据
2)使脚本按天,周,月安全地运行
3)监测进程,系统和GPU 的性能

注意:所有命令在类linux环境中执行(Linux,OS x 或者 cygwin)

0、环境约定

假设AWS EC2 已经正常运行,方便起见,对环境做如下的设定:
1)EC2 服务器的IP地址为 54.218.86.47
2)用户名为ec2-user
3)SSH 密钥位于 ~/.ssh/ 中,文件名为aws-keypair.pem;
4)使用python 脚本工作

关于如何搭建一个 基于GPU的EC2实例来 执行深度学习,可以参见:
https://machinelearningmastery.com/develop-evaluate-large-deep-learning-...

1、 登陆到服务器

一项新兴技术多久能成为主流?--可能是两年

近日,技术研究与分析公司Gartner发布了一份名为《2017年新兴技术炒作周期(The Hype Cycle for Emerging Technologies, 2017)》的报告。报告指出,一项技术一般需要2年的时间能够成为主流技术--如果以深度学习为判断基础的话。

该公司对2000多种技术进行了追踪和分析,当中包括了5G、人工通用智能、深度学习、深度强化学习、数字孪生体、边缘计算、Serverless PaaS、认知计算等。

在上面的图表可以看到,处在炒作周期顶端位置的深度学习需两年时间内成为主流。不过对于另外一项也处在炒作周期顶端附近的自动驾驶汽车来说,其成为主流技术的时间却需要10多年。

当然,Gartner的报告并不是完美的,它似乎遗漏了一些新兴技术,诸如802.11ax、情感计算、语境代理、手势控制设备、数据经纪人PaaS、微型数据中心、自然语言问答、个人分析、智能数据挖掘、虚拟个人助理等。

文章来源:cnBeta.COM

深度学习项目成功的六要素

深度学习可以应用在哪些场合呢?这是大家在理解深度学习和其它人工智能技术时首先想到的问题。我们往往陷入一个误区,认为“人工智能”可以搞定一切。

若要回答这个问题,首先要知道另一个问题的答案,“我们手中是否已经有足够的数据”?然而,这个问题也需要足够的领域知识才能作答。在学术意义上,我们想理解“边界条件”;或者换句话说,我们想理解问题的内在约束条件。那么,深度学习和人工智能问题的“边界条件”究竟是什么呢?

早些时候,笔者讨论过“什么是可知的”和“什么是知识的当前状态?若想理解领域知识,就必须搞明白知识的当前状态是什么。不确定度是以可知的内容为参照来衡量未知知识的度量。但不确定度有一个奇怪的假设,即假设一切事物最终都是可知的。这相当于我们相信决定论,可是在真实的世界往往捉摸不定。

然而,这个度量名称对我们识别问题的边界很有帮助。下面是问题清单。若问题的答案是否定的,那预示着不确定性的存在。以下采用执行者、活动和环境来描述整个语境。

  • 执行的不确定性 - 从环境的初始状态开始,执行者不同的执行顺序是否总是得到同样的最终状态?
  • 观测的不确定性 - 执行者是否能够获取完整的环境信息?
  • 时间的不确定性 - 执行者是否知道活动将会持续多久?
  • 深度学习的五个能力级别

    本文作者在读完“理解AI四种类型”一文后,对深度学习进行了更加细致的能力分类,以下为译文:

    Arend Hintze写了一篇很好的短文,叫《理解AI的四种类型》,分别是反应机器(Reactive Machine)、有限的记忆(Limited Memory)、思维理论(Theory of Mind)、自我意识(Self-Awareness)。

    IBM一直在努力促使计算机变得更智能化、更人性化。本周该公司宣布,已经开发出一种技术,可以大幅缩短处理海量数据并得出有用结论的时间。IBM使用的“深度学习”技术是人工智能(AI)的一个分支,可模仿人脑的工作原理。它也是微软、Facebook、亚马逊和谷歌的重大关注焦点。

    IBM的目标是将深度学习系统消化数据所需要的时间从数天缩短到数小时。IBM研究所的IBM研究员和系统加速及记忆主管希拉里·亨特(Hillery Hunter)说,这些改进可以帮助放射学家更快、更准确地找到病变部位,并读取大量医学图像。

    到目前为止,深度学习主要是在单一服务器上运行的,因为在不同计算机之间移动大量数据的过程太过复杂。而且,如何在许多不同服务器和处理器之间保持数据同步也是一个问题。

    IBM在周二的公告中说,已经开发出了能够将这些任务分配到64台服务器的软件,这些服务器总共有256个处理器,可在速度方面取得巨大飞跃。凡是拥有IBM Power系统服务器的用户,以及其他想要测试的技术人员,均可获得这项技术。

    IBM使用了64个自主开发的Power 8服务器,每一个都将通用的英特尔微处理器和英伟达图形处理器连接起来,并使用快速的NVLink连接,以促进两种芯片之间的数据流传输。

    同步内容