机器学习

机器学习

本文介绍了 10 个常见机器学习案例,这些案例需要用线性代数才能得到最好的理解。

线性代数是数学的分支学科,涉及矢量、矩阵和线性变换。
它是机器学习的重要基础,从描述算法操作的符号到代码中算法的实现,都属于该学科的研究范围。

虽然线性代数是机器学习领域不可或缺的一部分,但二者的紧密关系往往无法解释,或只能用抽象概念(如向量空间或特定矩阵运算)解释。

阅读这篇文章后,你将会了解到:

  • 如何在处理数据时使用线性代数结构,如表格数据集和图像。
  • 数据准备过程中用到的线性代数概念,例如 one-hot 编码和降维。
  • 深度学习、自然语言处理和推荐系统等子领域中线性代数符号和方法的深入使用。
  • 让我们开始吧。

    这 10 个机器学习案例分别是:

    1. Dataset and Data Files 数据集和数据文件

    2. Images and Photographs 图像和照片

    3. One-Hot Encoding one-hot 编码

    4. Linear Regression 线性回归

    5. Regularization 正则化

    6. Principal Component Analysis 主成分分析

    机器学习中的这12条经验,希望对你有所帮助

    华盛顿大学 Pedro Domingos 教授的“A Few Useful Things to Know about Machine Learning”这篇论文总结了机器学习研究者和从业者的 12 个宝贵经验,包括需要避免的陷阱、需要关注的重点问题、常见问题的答案。希望这些经验对机器学习爱好者有一些帮助。

    1. “表征+评估+优化”构成机器的主要内容!

    构成机器学习算法的 3 部分:

    表征(Representation):分类器必须用计算机可以处理的形式化语言来表示。相反地,为训练模型选择一个表征就等同于选择可训练分类器的集合。这个集合称为训练模型的「假设空间」。如果分类器不在「假设空间」中,那么它就不能由训练所得到。一个相关的问题是如何表征输入,即使用哪些特征。

    评估(Evaluation):需要一个评估函数来区分分类器的好坏。算法内部使用的评估函数可能与分类器优化的外部评估函数不同,这是为了便于优化,并且是由我们下一节所要讨论的问题导致的。

    优化(Optimization):我们要用一种方法搜索得分最高的分类器。优化方法的选择对于提升模型的效率非常关键。另外,如果评估函数具有一个以上的最优值,则优化方法有助于确定最后产生的分类器。新的训练模型一开始常常使用现有的优化器,后来常会转而使用自定义的优化器。

    一文介绍机器学习中基本的数学符号

    作者:Jason Brownlee;机器之心编译;参与:Edison Ke、黄小天

    本文介绍了机器学习中的基本数学符号。具体来说有算数符号,包括各种乘法、指数、平方根以及对数;数列和集合符号,包括索引、累加以及集合关系。此外,本文还给出了 5 个当你在理解数学符号遇到困难时可以应急的小技巧。

    在机器学习中,你永远都绕不过数学符号。

    通常,只要有一个代数项或一个方程符号看不懂,你就完全看不懂整个过程是怎么回事了。这种境况非常令人沮丧,尤其是对于那些正在成长中的机器学习初学者来说更是如此。

    如果你能了解一些基本的数学符号以及相关的小技巧,那你就在看懂机器学习方法的论文或书籍描述上前进了一大步。

    在本教程中,你将学到机器学习技术描述中遇到的基本数学符号。

    在学完整个教程后,你会知道:

  • 算术符号,包括若干种乘法、指数、平方根以及对数
  • 数列和集合符号,包括索引、求和以及集合关系
  • 5 种当你看不明白数学符号的时候可以采用的应急方法
  • 让我们开始学习吧!

    机器学习中的基本数学符号

    教程概览
    本教程分为 7 个部分,分别是:
    1. 看不懂数学符号的沮丧

    使用 Python 开始机器学习

    目前机器学习红遍全球。男女老少都在学机器学习模型,分类器,神经网络和吴恩达。你也想成为一份子,但你该如何开始?

    在这篇文章中我们会讲Python的重要特征和它适用于机器学习的原因,介绍一些重要的机器学习包,以及其他你可以获取更详细资源的地方。

    为什么用Python做机器学习
    Python很适合用于机器学习。首先,它很简单。如果你完全不熟悉Python但是有一些其他的编程经验(C或者其他编程语言),要上手是很快的。其次,Python的社区很强大。这使得Python的文档不仅条理性好,而且容易读。你还可以在StackOverFlow上找到关于很多问题详细解答(学习基石)。再次,一个强大的社区带来的副产品就是大量有用程序库(Python内部自带的和第三方软件),基本上可以解决你所有的问题(包括机器学习)。

    但我听说Python很慢
    Python是很慢。它不是执行最快的语言,拥有那么多好用的抽象是要付出代价的。

    但这是个可以解决的问题:程序库可以把计算量繁重的部分外包给其他更高效(但更难使用)的语言,例如C和C++。比如NumPy这个提供数值运算的程序库,就是用C写的,运行速度超快。在实际运用中,几乎所有程序库都会使用NumPy去完成计算繁重的部分。如果你看到Numpy,你应该想到它很快。

    【视频】AWS 云端的机器学习加速堆栈

    亚马逊 EC2 F1 实例的机器学习演示将通过每秒 10,000 个图像的速率展示。这将介绍与 x86 解决方案相比,FPGA 池化是如何产生高性能、低功耗解决方案的。单个 x86 可以服务 8 个 FPGA,无需 x86 与 FPGA 的 1 比 1。

    作者:Steve Leibson,编译:黑夜

    说起AI相信大家肯定大家都不陌生,搞过深度学习的人可能都会碰到一个问题,那就是没有一个好的加速硬件,例如GPU,很难做深度学习。小编今天带大家走进一篇关于机器学习加速芯片的报告,来看一下未来的机器学习加速市场。在这篇名为“加速器:下一代机器学习芯片”的报告中,德勤全球预测,“到2018年底,用于加速数据中心机器学习的所有芯片中,超过25%将是FPGA,ASIC”。报告接着说道:“这些芯片将大大提高机器学习的使用率,使应用程序能够消耗更少的功率,同时变得更具相应能力,灵活性和处理能力,这将扩大其市场”。在后来的报告中指出:“机器学习应用还将售出20万多个FPGA和10万个ASIC芯片”。

    2018年3月6日, 深鉴科技宣布在亚马逊AWS正式上线基于深鉴Descartes稀疏神经网络处理架构的自动语音识别引擎DDESE (DeePhi Descartes Efficient Speech Recognition Engine), 开始面向全球用户提供加速试用服务。DDESE自动语音识别加速引擎在AWS的发布,标志着深鉴科技成为首个在AWS上线基于FPGA平台加速方案的中国人工智能公司。

    FPGA芯片可定制化和多功能的灵活特性,满足了云计算便捷经济、易于扩展的需求。从2016年起,各大云服务提供商就开始部署FPGA云加速业务。全球最大的云供应商亚马逊网络服务(AWS)与FPGA龙头厂商赛灵思 (Xilinx) 达成合作,充分证明了云计算数据中心将是FPGA应用释放潜力的重要市场。同时,通过大型数据中心的影响力和服务能力,FPGA影响着数十万应用开发商和企业用户,快速成为公有云服务青睐的应用趋势。

    机器视觉系统需要考虑的10个问题

    为了使用户在选择一款机器视觉系统时应该考虑的关键的、基本的特性方面提供指导。下面是选择一款机器视觉系统时要优先考虑的十个方面:

    1. 定位器 对象或特征的精确定位是一个检测系统或由视觉引导的运动系统的重要功能。传统的物体定位采用的是灰度值校正来识别物体。尽管这种技术得到了广泛的应用,但是,它在图象质量变差的情况下,就缺乏稳定性。图象质量变差可能是由于凌乱、亮度不同和遮盖等因素的影响。相反,几何对象定位法是一种最新的方法,它使用对象的轮廓来识别对象及其特征。Adept的HexSight 软件和AdeptVision sAVI 系统两者都是用非常先进的轮廓检测技术来进行识别对象。一个可靠的定位器可不需要夹具来定位零件,因此节约了成本。

    2. 光与照明 众所周知,适当的灯光和照明对视觉应用的成功至关重要。有时,尽管选择了最合适的灯光和照明,但是,如果被监测的对象或特征稍微变动一下,就要求相应改变灯光和照明亮度。例如,晶片的抛光表面的不同,在OCR应用中激光蚀刻的标志的质量的不同。一个稳定性好的定位工具如Adept的几何对象定位器能轻松地处理由于光聚集和亮度不同的改变使得图象质量变差这样的情况。使用适当的软件能让你消除必要的调光操作,无论其图象质量如何改变。

    机器学习算法之旅

    在这篇文章中, 我们将介绍最流行的机器学习算法.

    浏览该领域的主要算法以了解可用的方法有哪些是有用的.

    有很多算法是可用的, 当算法名称被抛出时, 它会让人感到无所适从, 而你只需要知道它们是什么以及它们适合用在哪里.

    我想给你两种方法来思考和分类你可能在机器学习领域遇到的算法:

  • 第一种是按学习风格进行分组的算法.
  • 第二种是按照形式或功能上的相似性进行分组的算法(如将相似的动物分组在一起).
  • 这两种方法都是有用的, 但我们重点放在按相似性对算法进行分组, 继续浏览各种不同的算法类型.

    阅读完这篇文章之后, 你将更好地理解最受欢迎的监督学习机器学习算法以及它们之间的关系.

    一个线性拟合一个很酷的例子. 弱成员是灰色的, 综合预测是红色的.

    来自维基百科的绘图, 在公共领域许可.

    按学习风格分组的算法
    算法可以根据与经验或环境的交互方式或任何我们想要调用输入数据的方式对问题进行建模.

    GL Research 的 Javier Garcia 于 2018 年 1 月 9 日在法兰克福举办的 XDF 2018 Edge Track 上分享了一个用例演示。Javier 讨论了 GL Research 专注于人工智能,并分享了 Xilinx All Programmable SoC 的使用心得。

    同步内容