机器学习

机器学习

在加州圣克拉拉举行的嵌入式视觉峰会上,赛灵思 ML 套件 获得了最佳云技术 2018 年度视觉产品大奖,我们对此深感荣幸。

传统的数据中心处理器已无法跟上当今云端运行的诸如机器学习、基因组学、视频转码等计算密集型工作负载的发展要求。ML 套件利用独特且灵活应变的赛灵思技术为机器学习推断性能带来了显著提升。

赛灵思 ML 套件可以帮助开发人员将加速机器学习 (ML) 推断功能轻松集成到他们的当前应用中。赛灵思 ML 套件的独到创新之处在于:相对于基于 CPU 的基础设施而言,ML 推断的云端用户能便捷地大幅提升性能并节约成本,而且无需定制开发。

在美国和欧洲的众多地区,赛灵思 ML 套件已用于 Amazon EC2 F1 等大型云端平台部署。它可支持 Caffe、MxNet、Tensorflow、Python 和 RESTful API 等广受欢迎的机器学习框架。采用 ML 套件的应用同时支持云端与本地部署环境。

赛灵思 ML 套件为现实应用提供了低时延、高吞吐量以及低功耗的机器学习推断。

机器学习几种常见模型的介绍

这里我主要介绍以下几种模型:
1. k近邻法
2. 朴素贝叶斯法
3. 决策树
4. 逻辑斯蒂回归
5. 支持向量机
6. adaBoost方法

K近邻法
原理
输入:实例的特征向量
输出:实例的类别
算法描述:
(1)在训练集中找出与实例最近邻的k个点,涵盖这k个点的邻域记做Nk(x)
(2)在Nk(x)中根据分类决策规则决定x的类别

优缺点
优点:精度高,对异常值不敏感,无数据输入假定
缺点:计算复杂度高,空间复杂度高

适用场景
一般适用于数值型数据和标称型数据

决定要素
距离度量、k值选择、分类决策规则,是k近邻的三大要素,它不具有显示学习的过程。

参考文献
1.Cover T,Hart P.Nearest neighbor pattern classification.IEEE Transaction on information Theory 1967

朴素贝叶斯方法
原理
朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。
输入:随机向量X
输出:类标记Y

从 Stack Overflow 2018 调查报告看机器学习发展趋势

Stack Overflow 的数据科学家 Julia Silge 通过对数据进行深入研究,分析处理了 2018 年最受欢迎的机器学习技术及其趋势。本次调查报告整理了超过10万名受访者的回答记录,并发现,软件开发中的机器学习是一个很重要的趋势。 但关键的工具和技术有哪些呢,我们一起来看看:

受欢迎的框架

今年,TensorFlow 超过 React 和 Node.js,成为最流行的 Web 框架,这是一个由 Google 在 2015 年作为开源发布的机器学习库。 去年的调查中并未提及 TensorFlow,因为那时它刚刚开始普及。然而 TensorFlow 发展非常快,在堆栈溢出问题上,它呈现出有史以来最高的同比增长率之一。

TensorFlow 通常用于深度学习,它流行度的上升也是机器学习工具兴起的最好证明。

技术关联

你不应该忽略的五个机器学习项目一览

摘要: 本文介绍5个新的机器学习项目,这些项目你可能还没有听说过,但确实对项目开发有所帮助,感兴趣的读者可以动手实践一下。

随着人工智能和深度学习的兴起,网络上存在的学习资源以及开源项目也越来越多。本文精选了的五个项目,都含有潜在新的机器学习想法,且全都是用Python实现。下面简单介绍下这五个项目,感兴趣的可以自己上手复现一下,说不定会对自己的项目产生一些新的想法。

1.实时损失曲线图(Live Loss Plot)

机器学习者都应该知道的五种损失函数!

在机器学习中,所有的机器学习算法都或多或少的依赖于对目标函数最大化或者最小化的过程,我们常常把最小化的函数称为损失函数,它主要用于衡量机器学习模型的预测能力。在寻找最小值的过程中,我们最常用的方法是梯度下降法。

虽然损失函数可以让我们看到模型的优劣,并且为我们提供了优化的方向,但是我们必须知道没有任何一种损失函数适用于所有的模型。损失函数的选取依赖于参数的数量、异常值、机器学习算法、梯度下降的效率、导数求取的难易和预测的置信度等若干方面。这篇文章将介绍各种不同的损失函数,并帮助我们理解每种损失函数的优劣和适用范围。

由于机器学习的任务不同,损失函数一般分为分类和回归两类,回归会预测给出一个数值结果而分类则会给出一个标签。这篇文章主要集中于回归损失函数的分析。本文中所有的代码和图片都可以在这个地方找到!

reVISION 专区更新:机器学习 & 设计范例 上线

reVISION 专区汇集了各种实用资源,可充分满足软硬件及系统开发人员的需求。

reVISION 堆栈包括 5 个计算机视觉设计示例和 5 个机器学习演示,未来还将提供更多内容。这些示例旨在帮助您以更短的时间启动运行。这些设计示例将帮助您轻松了解 Xilinx SoC 在高性能嵌入式视觉应用中的显著优势。要访问这些示例,请按照 reVISION 入门指南操作。

机器视觉设计范例

  • LK 密度光流算法:进行运动分段的金字塔形迭代实现方案
  • 立体视差法映射:仅使用本地模块匹配从 2 个传感器输入计算视差法映射
  • 扭曲变换
  • Harris 角点
  • 双边滤波器
  • 支持开发环境: SDSoC 2018.2 版本
    支持开发板卡与 SOM:ZCU102 及 ZCU104

    机器学习设计范例

  • GoogLeNet
  • ResNet
  • AlexNet
  • VGG-16
  • SSD-300
  • FCN-AlexNet
  • Yolo
  • Densebox (人脸检测)
  • Xilinx 自适应机器学习加速方案

    比 CPU* 性能高 90 倍!
    * 针对 AWS EC2 上的 c4. 大型实例的测量初始 V1

    XILINX ML SUITE——赛灵思机器学习套件

    Xilinx ML Suite (赛灵思机器学习套件)可帮助开发者优化和部署加速型 ML 推断。它支持许多常见的机器学习框架,如 Caffe、MxNet 和 Tensorflow,以及 Python 和 RESTful API 等。套件包括:

  • xfDNN 编译器/优化器 — 自动图层融合、内存优化和框架集成
  • xfDNN 量化器 — 通过自动模型高精度 INT8 校准提升性能
  • 平台 — 可在本地或通过云服务部署
  • 可在本地或通过云服务部署:亚马逊、Nimbix、华为、阿里巴巴云、百度、腾讯
  • 作者:Anton Shaleynikov

    通过本文我们来一起看一些用于人工智能的高质量AI库,它们的优点和缺点,以及它们的一些特点。

    人工智能(AI)已经存在很长时间了。然而,由于这一领域的巨大进步,近年来它已成为一个流行语。人工智能曾经被称为一个完整的书呆子和天才的领域,但由于各种开发库和框架的发展,它已经成为一个友好的IT领域,并有很多人正走进它。

    在这篇文章中,我们将研究用于人工智能的优质库,它们的优缺点以及它们的一些特征。让我们深入并探索这些人工智能库的世界!

    1. TensorFlow
    “使用数据流图表的可伸缩机器学习的计算”

    语言:C ++或Python。

    当进入AI时,你会听到的第一个框架之一就是Google的TensorFlow。

    卷积神经网络CNN中的各种意义

    只是知道CNN是不够,我们需要对其进行解剖,继而分析不同部件存在的意义

    CNN的目的
    简单来说,CNN的目的是以一定的模型对事物进行特征提取,而后根据特征对该事物进行分类、识别、预测或决策等。在这个过程里,最重要的步骤在于特征提取,即如何提取到能最大程度区分事物的特征。如果提取的特征无法将不同的事物进行划分,那么该特征提取步骤将毫无意义。而实现这个伟大的模型的,是对CNN进行迭代训练。

    特征
    在图像中(举个例子),目标事物的特征主要体现在像素与像素之间的关系。比如说,我们能区分一张图片中有一条直线,是因为直线上的像素与直线外邻像素的区别足够大(或直线两边的像素区别足够大),以至于这“直线”能被识别出来:

    除了直线外,其他特征也同理。在CNN中,大部分特征提取依赖于卷积运算。

    卷积与特征提取

    Python 扩大领先优势,其中 PyTorch 仅占 6.4%

    近日,著名数据科学网站 KDnuggets 发布了 2018 年数据科学和机器学习工具调查结果。超过 2000 人对自己「过去 12 个月内在项目开发中使用过的数据挖掘/机器学习工具和编程语言」进行了投票。该统计还对过去三年来的排名进行了对比分析。

    这份投票结果既有预料之内,也有预料之外的部分。数据显示,Python 作为机器学习常用的编程语言正在不断扩大领先优势,R 语言的使用率第一次降到了 50% 以下。在深度学习框架上,最近呼声很高的深度学习框架 PyTorch 仅仅占据了 6.4% 的使用率,远远落后于 TensorFlow 的 29.9% 和 Keras 的 22.2%。

    Python 继续侵蚀着 R 的用户领域,RapidMiner 热门度增加,SQL 保持稳定,TensorFlow 和 Keras 引领前进,Hadoop 衰落,数据科学平台整合等等。

    同步内容