IDC发布《机器学习、深度学习开源项目应用机会分析》研究报告

IDC中国于2017年12月发布了《机器学习、深度学习开源项目应用机会分析》,针对开源机器学习项目的商业化应用进展做了深入研究。 在此次研究中,我们调研了中国机器学习市场进展,研究了开源项目商业化应该考虑的问题,并且深入访谈了机器学习系统部署的案例,也分析了开源技术产品化的潜在机会。希望能够为开源技术使用者提供参考和借鉴。

开源社区赋能+开发者高度热情+企业降本增效的需求驱动机器学习项目部署
越来越多的行业组织开始部署机器学习、深度学习项目,这些项目中有很多技术组件来源于开源社区。用户基于开源框架开始在云服务中或者本地数据中心探索面向各种业务场景的行业应用解决方案。对机器学习有高度热情的开发者、开源社区的赋能、已被成功应用的社区开发模型,催生了正在增长的机器学习、深度学习市场。

开源项目应该看什么
开源软件已在业界广泛应用,大部分组织对开源都有比较深入的理解(虽然偶尔也会有些误区)。很多开发者也接触过大量开源的开发工具以及编程语言,或者已经将这些开源技术集成到商业化产品组合中。但无论如何,使用开源软件是一个正式商业化的选择。在使用之前,有必要先明确如下问题:项目的管理方是谁,是高校研究机构还是商业化公司?贵公司正在使用的License模型是怎样的,组织是否已经充分理解该License所要求的权利和义务?贵公司是否要在商业化产品中使用开源技术,您的产品和开源技术的区隔是什么?如果您是技术最终用户,是否有比较过开源社区工具和商业化产品的总成本?

除了上述要考虑的问题之外,在此机器学习研究报告中,IDC也重点介绍了以下10个开源项目的背景、更新频率以及用户活跃度等。

终端用户机器学习系统部署案例
随着开源项目的成熟,中国市场已经有很多行业企业开始部署基于开源技术组件的人工智能系统。IDC在报告中研究了4个有关行业组织部署机器学习系统的深度访谈案例,分别是广州某医院基于TensorFlow部署辅助诊疗决策系统;北京市某公安分局基于TensorFlow部署人脸识别系统;某银行基于Caffe开发图像识别系统;某航空公司基于TensorFlow部署人脸识别系统。

机器学习商业化产品案例
开源项目只处理完整人工智能解决方案的部分工作。大部分情况下,今天提供的开源机器学习工具只处理构建完整的认知/人工智能应用程序所需的部分工作。即使是最先进的开源的机器学习库也不提供收集、汇总数据的工具,不会提供实际部署过程中的完整框架。IDC看到市场上已经有很多硬件以及软件技术供应商在整合这些工具,一些硬件以及基础架构供应商在其平台上提供对开源社区软件的支持。

另外,多家大型云服务商已上线基于开源项目的商业化服务,甚至提供机器学习的部署、实施服务。云计算服务商在云上开放机器学习平台,能够集模型训练、预测、部署的功能于一体,并提供公共数据集和业界模型,赋能用户快速释放数据价值。

未来市场机会分析
从2017年人工智能技术投资的进展来看,目前互联网、金融、医疗、制造、汽车、游戏是技术投资主力。29%是互联网企业,这其中包含BATJ级别的互联网公司,还包含新美大、网易、聚美优品等互联网公司,以及互联网+教育、互联网+汽车等互联网+传统行业的公司,可以说是AI技术投资的第一梯队。占据19%份额的制造业主要以消费级产品制造商为主,如智能家电、机器人等,还包括汽车制造业。消费级产品制造商是本次人工智能浪潮中AI技术投资的第二梯队。16%是金融业,领先的银行、保险以及投资管理机构在探索基于深度学习的刷脸身份验证、刷脸支付、图片识别、智能投顾等应用场景。14%的份额是医疗行业,以专科医院、民营医院以及对新技术持开放态度的大型医院为主。此外,游戏行业也是机器学习、深度学习技术应用的主力。


在本次研究中,IDC也发现,在APeJ地区只有11%的组织已经部署了人工智能系统,有53%的组织计划在5年之内部署人工智能系统,这一数字意味着未来5年内人工智能解决方案市场将有巨大的增长潜力。

IDC中国研究经理卢言霞认为:“市场上现在有各种各样的框架、库等工具可用,但现在还不清楚在特定的场景下使用哪些库或者工具更容易成功。建议最终用户将技术供应商和服务商作为可信的顾问,这将利于双方共同取得项目成功。”

特别说明:本报告发布于2017年12月。在2017年12月之后上线的机器学习产品未在本次研究范围之内。所有结论基于2017年12月1日之前的数据。

文章来源: IDC咨询