机器学习

机器学习

【视频】易于使用且可扩展的超小型 CNN 加速器

本视频由 Kortiq 公司提供,视频演示了一款易于使用的、可扩展的小型 CNN 加速器。该器件不仅支持所有类型的 CNN,而且还可动态加速网络中不同类型的层。Xilinx Zynq 系列 SoC 及 MPSoC 不仅可帮助 Kortiq 器件实现所需的性能水平和灵活性,同时还具有低成本优势。

2月2日在北京举办的“AI:从云到端实现技术私享会”上,威视锐CEO姚远正式对外介绍了威视锐、眼擎科技、IBM、Xilinx联合推出的机器学习开发平台“DeepRED”。在现场介绍中,DeepRED 系列是专为机器学习和嵌入式智能推理终端而开发的一款高性价比解决方案,可以帮助高校、科研院所、中小企业和行业客户快速部署AI视觉算法。

该平台由IBM 研究院最新的PowerAI AccDNN软件技术赋能深度学习,威视锐提供整体解决方案,眼擎科技提供机器视觉模块,基于Xilinx公司 ZYNQ SoC芯片开发,可以实现Caffe 框架的深度学习模型自动转换硬件代码,实现快速验证和部署到 FPGA平台上。同时DeepRED平台也可以支持 Xilinx reVISION 和 SDSoC 开发流程,四方希望通过共同努力,加速AI在嵌入式平台的部署,降低企业、研发、爱好者的AI学习门槛,快速推动嵌入式视觉开发进程。

针对DeepRED与目前市场上其他AI解决方案的区别,威视锐科技CEO姚远介绍道:DeepRED是针对延迟敏感的应用场景设计,比如自动驾驶、机器人等领域。DeepRED提供了从成像芯片到算法部署的一体化解决方案,而且可以根据客户需求定制,大大降低行业客户部署门槛。

一文图解机器学习的基本算法

本文为你分析如何选择机器学习的各种方法。

每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客,讲述了如何选择机器学习的各种方法。

另外,Scikit-learn 也提供了一幅清晰的路线图给大家选择:

其实机器学习的基本算法都很简单,下面我们就利用二维数据和交互图形来看看机器学习中的一些基本算法以及它们的原理。(另外向Bret Victor致敬,他的 Inventing on principle 深深的影响了我)

所有的代码即演示可以在我的Codepen的这个Collection中找到。

首先,机器学习最大的分支的监督学习和无监督学习,简单说数据已经打好标签的是监督学习,而数据没有标签的是无监督学习。从大的分类上看,降维和聚类被划在无监督学习,回归和分类属于监督学习。

无监督学习

【视频】:AWS 云上的 FPGA 演示

本视频向您概述了亚马逊 AWS EC2 F1 实例,及其加速工作负载(如数据分析、机器学习、视频转码以及基因组学...)的功能。

【视频】AWS 云上的机器学习加速堆栈

视频演示了亚马逊 AWS EC2 F1 实例上实现的机器学习,该方案展示了每秒超过 10,000 张图像的处理和学习能力。该视频同时也展现了 FPGA 池是如何为您提供一个高性能、且低功耗的解决方案的。一个 x86 可以同时搭配 8 个 FPGA 进行工作,从而不再需要 1:1 地对 CPU 和 FPGA 进行配比。

【视频】“从端到云”的视频分析方案

本视频演示了赛灵思是如何通过“机器学习”来加速实时高清视频应用的开发和部署。另外还有在单一系统中使用业界标准的 FFmpeg 和 YOLO 标准进行视频处理以及机器学习的方案。

IDC中国于2017年12月发布了《机器学习、深度学习开源项目应用机会分析》,针对开源机器学习项目的商业化应用进展做了深入研究。 在此次研究中,我们调研了中国机器学习市场进展,研究了开源项目商业化应该考虑的问题,并且深入访谈了机器学习系统部署的案例,也分析了开源技术产品化的潜在机会。希望能够为开源技术使用者提供参考和借鉴。

开源社区赋能+开发者高度热情+企业降本增效的需求驱动机器学习项目部署
越来越多的行业组织开始部署机器学习、深度学习项目,这些项目中有很多技术组件来源于开源社区。用户基于开源框架开始在云服务中或者本地数据中心探索面向各种业务场景的行业应用解决方案。对机器学习有高度热情的开发者、开源社区的赋能、已被成功应用的社区开发模型,催生了正在增长的机器学习、深度学习市场。

开源项目应该看什么

机器学习算法简介

引言

本文是对机器学习算法的一个概览,以及个人的学习小结。通过阅读本文,可以快速地对机器学习算法有一个比较清晰的了解。本文承诺不会出现任何数学公式及推导,适合茶余饭后轻松阅读,希望能让读者比较舒适地获取到一点有用的东西。

本文主要分为三部分,第一部分为异常检测算法的介绍,个人感觉这类算法对监控类系统是很有借鉴意义的;第二部分为机器学习的几个常见算法简介;第三部分为深度学习及强化学习的介绍。最后会有本人的一个小结。

1 异常检测算法

异常检测,顾名思义就是检测异常的算法,比如网络质量异常、用户访问行为异常、服务器异常、交换机异常和系统异常等,都是可以通过异常检测算法来做监控的,个人认为这种算法很值得我们做监控的去借鉴引用,所以我会先单独介绍这一部分的内容。

异常定义为“容易被孤立的离群点 (more likely to be separated)”——可以理解为分布稀疏且离密度高的群体较远的点。用统计学来解释,在数据空间里面,分布稀疏的区域表示数据发生在此区域的概率很低,因而可以认为落在这些区域里的数据是异常的。

说到如何用Python执行线性回归,大部分人会立刻想到用sklearn的linear_model,但事实是,Python至少有8种执行线性回归的方法,sklearn并不是最高效的。

今天,让我们来谈谈线性回归。没错,作为数据科学界元老级的模型,线性回归几乎是所有数据科学家的入门必修课。抛开涉及大量数统的模型分析和检验不说,你真的就能熟练应用线性回归了么?未必!

在这篇文章中,文摘菌将介绍8种用Python实现线性回归的方法。了解了这8种方法,就能够根据不同需求,灵活选取最为高效的方法实现线性回归。

“宝刀不老”的线性回归

时至今日,深度学习早已成为数据科学的新宠。即便往前推10年,SVM、boosting等算法也能在准确率上完爆线性回归。

为什么我们还需要线性回归呢?

一方面,线性回归所能够模拟的关系其实远不止线性关系。线性回归中的“线性”指的是系数的线性,而通过对特征的非线性变换,以及广义线性模型的推广,输出和特征之间的函数关系可以是高度非线性的。另一方面,也是更为重要的一点,线性模型的易解释性使得它在物理学、经济学、商学等领域中占据了难以取代的地位。

那么,如何用Python来实现线性回归呢?

近日,kdnuggets做了一个关于数据科学、机器学习语言使用情况的问卷调查,他们分析了954个回答,得出结论——Python已经打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。有关此次问卷更具体的情况如何?雷锋网 AI科技评论将kdnuggets上发表的总结文编译整理如下:

之前我们在kdnuggets上做了这样一个问卷调查,2016、2017两年,在分析、数据科学和机器学习的工作中,你用R语言,还是Python,或两者都用,或选择其他的语言?

通过分析954个回答,我们得出了这样的结论:虽然Python并没有完全取代R语言,但在2017年,Python已经成功打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。

在2016年Python还是第二位(主要用Python的人占34%,主要用R语言的人占42%),在2017年Python就以5%的优势领先于R语言(主要用Python的人占41%,主要用R语言的人占36%)。同时用Python和R两种语言的人也从2016年的8.5%增长到12%了,而用其他语言的人则从16%降到11%。

同步内容