机器学习

机器学习

机器学习算法之旅

在这篇文章中, 我们将介绍最流行的机器学习算法.

浏览该领域的主要算法以了解可用的方法有哪些是有用的.

有很多算法是可用的, 当算法名称被抛出时, 它会让人感到无所适从, 而你只需要知道它们是什么以及它们适合用在哪里.

我想给你两种方法来思考和分类你可能在机器学习领域遇到的算法:

  • 第一种是按学习风格进行分组的算法.
  • 第二种是按照形式或功能上的相似性进行分组的算法(如将相似的动物分组在一起).
  • 这两种方法都是有用的, 但我们重点放在按相似性对算法进行分组, 继续浏览各种不同的算法类型.

    阅读完这篇文章之后, 你将更好地理解最受欢迎的监督学习机器学习算法以及它们之间的关系.

    一个线性拟合一个很酷的例子. 弱成员是灰色的, 综合预测是红色的.

    来自维基百科的绘图, 在公共领域许可.

    按学习风格分组的算法
    算法可以根据与经验或环境的交互方式或任何我们想要调用输入数据的方式对问题进行建模.

    GL Research 的 Javier Garcia 于 2018 年 1 月 9 日在法兰克福举办的 XDF 2018 Edge Track 上分享了一个用例演示。Javier 讨论了 GL Research 专注于人工智能,并分享了 Xilinx All Programmable SoC 的使用心得。

    机器学习经典算法优缺点总结

    作者:姚凯飞

    1.决策树:判别模型,多分类与回归,正则化的极大似然估计
    特点:

    适用于小数据集

    优点:

    计算量简单,可解释性强,比较适合处理有缺失属性值的样本,能够处理不相关的特征;

    缺点:

    容易过拟合(后续出现了随机森林,减小了过拟合现象),使用剪枝来避免过拟合;

    适用数据范围:

    数值型和标称型

    CART分类与回归树:

    决策树分类方法,采用基于最小距离的基尼指数估计函数,用来决定由该子数据集生成的决策树的拓展形。决策树回归方法,采用切分点与切分变量来计算的损失来估计函数。如果目标变量是标称的,称为分类树;如果目标变量是连续的,称为回归树。分类树是使用树结构算法将数据分成离散类的方法。

    优点:

    非常灵活,可以允许有部分错分成本,还可指定先验概率分布,可使用自动的成本复杂性剪枝来得到归纳性更强的树,产生的分类规则易于理解,准确率较高。

    缺点:

    【视频】易于使用且可扩展的超小型 CNN 加速器

    本视频由 Kortiq 公司提供,视频演示了一款易于使用的、可扩展的小型 CNN 加速器。该器件不仅支持所有类型的 CNN,而且还可动态加速网络中不同类型的层。Xilinx Zynq 系列 SoC 及 MPSoC 不仅可帮助 Kortiq 器件实现所需的性能水平和灵活性,同时还具有低成本优势。

    2月2日在北京举办的“AI:从云到端实现技术私享会”上,威视锐CEO姚远正式对外介绍了威视锐、眼擎科技、IBM、Xilinx联合推出的机器学习开发平台“DeepRED”。在现场介绍中,DeepRED 系列是专为机器学习和嵌入式智能推理终端而开发的一款高性价比解决方案,可以帮助高校、科研院所、中小企业和行业客户快速部署AI视觉算法。

    该平台由IBM 研究院最新的PowerAI AccDNN软件技术赋能深度学习,威视锐提供整体解决方案,眼擎科技提供机器视觉模块,基于Xilinx公司 ZYNQ SoC芯片开发,可以实现Caffe 框架的深度学习模型自动转换硬件代码,实现快速验证和部署到 FPGA平台上。同时DeepRED平台也可以支持 Xilinx reVISION 和 SDSoC 开发流程,四方希望通过共同努力,加速AI在嵌入式平台的部署,降低企业、研发、爱好者的AI学习门槛,快速推动嵌入式视觉开发进程。

    针对DeepRED与目前市场上其他AI解决方案的区别,威视锐科技CEO姚远介绍道:DeepRED是针对延迟敏感的应用场景设计,比如自动驾驶、机器人等领域。DeepRED提供了从成像芯片到算法部署的一体化解决方案,而且可以根据客户需求定制,大大降低行业客户部署门槛。

    一文图解机器学习的基本算法

    本文为你分析如何选择机器学习的各种方法。

    每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客,讲述了如何选择机器学习的各种方法。

    另外,Scikit-learn 也提供了一幅清晰的路线图给大家选择:

    其实机器学习的基本算法都很简单,下面我们就利用二维数据和交互图形来看看机器学习中的一些基本算法以及它们的原理。(另外向Bret Victor致敬,他的 Inventing on principle 深深的影响了我)

    所有的代码即演示可以在我的Codepen的这个Collection中找到。

    首先,机器学习最大的分支的监督学习和无监督学习,简单说数据已经打好标签的是监督学习,而数据没有标签的是无监督学习。从大的分类上看,降维和聚类被划在无监督学习,回归和分类属于监督学习。

    无监督学习

    【视频】:AWS 云上的 FPGA 演示

    本视频向您概述了亚马逊 AWS EC2 F1 实例,及其加速工作负载(如数据分析、机器学习、视频转码以及基因组学...)的功能。

    【视频】AWS 云上的机器学习加速堆栈

    视频演示了亚马逊 AWS EC2 F1 实例上实现的机器学习,该方案展示了每秒超过 10,000 张图像的处理和学习能力。该视频同时也展现了 FPGA 池是如何为您提供一个高性能、且低功耗的解决方案的。一个 x86 可以同时搭配 8 个 FPGA 进行工作,从而不再需要 1:1 地对 CPU 和 FPGA 进行配比。

    【视频】“从端到云”的视频分析方案

    本视频演示了赛灵思是如何通过“机器学习”来加速实时高清视频应用的开发和部署。另外还有在单一系统中使用业界标准的 FFmpeg 和 YOLO 标准进行视频处理以及机器学习的方案。

    IDC中国于2017年12月发布了《机器学习、深度学习开源项目应用机会分析》,针对开源机器学习项目的商业化应用进展做了深入研究。 在此次研究中,我们调研了中国机器学习市场进展,研究了开源项目商业化应该考虑的问题,并且深入访谈了机器学习系统部署的案例,也分析了开源技术产品化的潜在机会。希望能够为开源技术使用者提供参考和借鉴。

    开源社区赋能+开发者高度热情+企业降本增效的需求驱动机器学习项目部署
    越来越多的行业组织开始部署机器学习、深度学习项目,这些项目中有很多技术组件来源于开源社区。用户基于开源框架开始在云服务中或者本地数据中心探索面向各种业务场景的行业应用解决方案。对机器学习有高度热情的开发者、开源社区的赋能、已被成功应用的社区开发模型,催生了正在增长的机器学习、深度学习市场。

    开源项目应该看什么

    同步内容