2016年爆热的人工智能,2017年值得加入吗?
作者 林安2017-01-18阅读 7305

keywords:AI、机器学习、算法、大数据

从2015年被炒热的大数据开始,2016年人工智能越来越多地被大众探讨。从Alphago 战胜围棋九段李世石,到今年年初的 Alphago 升级版 master 30连胜数位围棋大师,再到去年 HBO 一部探讨未来人工智能与人类关系的美剧《西部世界》的火爆,人工智能无疑是去年被科技领域讨论最多的话题之一。

特别是近几年,人工智能在获得高曝光量的同时,融资总额也呈逐年稳步增长的趋势。就在今天,百度宣布任命人工智能领域世界级的技术权威陆奇为集团副总裁和首席执行官,并宣布将人工智能列为未来十年最重要的战略方向。

那么,看上去很火的人工智能现在发展到了哪个阶段?需要怎样的人才?未来的发展趋势怎样?

想必这是许多想从事人工智能领域技术工作的工程师们都想了解的问题。继上一篇从技术 Leader 的招聘需求看,如何转岗为当前紧缺的大数据相关人才?后,100offer又走访了一些人工智能领域相关的公司,试图从人才流动的角度,给大家一个答案。


一、人工智能的发展现状

  • 人工智能有哪些分支?

目前人工智能主要有三大分支:机器AI、认知AI和深度学习。

认知AI是最受欢迎也最难实现的人工智能分支之一,能够处理复杂性和二义性,持续不断地在数据挖掘和自然语言处理以及智能自动化的经验中学习,负责所有「像人一样」的交互。

机器学习AI是在大数据中寻找一些「模式」,让机器在没有人为解释的情况下,自行判断并预测结果。对于机器学习AI来说,最关键的因素是要有大量的数据输入,这样才能教给人工智能新的技巧。例如特斯拉已经发送了它所搜集的所有数据、驾驶员的干预措施、成功逃避等到总部,让机器逐步锐化感官。

深度学习则在机器学习上更上一层楼,它的应用通常围绕庞大的未标记数据集,灵感完全来自我们大脑的神经网络,未来的发展方向是可以自主回答客户的咨询,完全模糊机器人和人类之间的界限。

目前,国内大部分企业对人工智能的研究还停留在机器学习阶段,一些技术比较前沿的公司已经在这些领域有所突破,比如很早就开始布局无人车技术的百度,而认知AI和深度学习是大部分人工智能领域研究和发展的终极目标。

了解完人工智能的三大分支,下面我们再来看看人工智能的三大发展阶段以及我们现在正处在哪个阶段。


  • 人工智能发展到了哪个阶段?

人工智能发展有三个阶段:计算智能、感知智能和认知智能。

第一阶段的计算智能即快速计算和记忆存储,像机器人战胜围棋大师,靠的就是超强的记忆能力和运算速度。人脑的逻辑能力再强大,也敌不过人工智能每天和自己下几百盘棋,通过强大的计算能力对十几步后的结果做出预测,从这一角度来说,人工智能多次战败世界级围棋选手,足以证明这一领域发展之成熟。

第二阶段的感知智能,即让机器拥有视觉、听觉、触觉等感知能力。自动驾驶汽车做的就是这一方面的研究,使机器通过传感器对周围的环境进行感知和处理,从而实现自动驾驶。

感知智能方面的技术目前发展比较成熟的领域有语音识别和图像识别,比如做安全领域人脸识别技术的Face++,以成熟的计算机视觉技术深耕电商、短视频等领域的Yi+,能够对多种语言进行准确识别翻译的科大讯飞等。


第三阶段的认知智能与前面在人工智能的3大分支里提到的认知AI类似,就是让机器拥有自己的认知,能理解会思考。认知智能是目前机器和人差距最大的领域,因为这不仅涉及逻辑和技术,还涉及心理学、哲学和语言学等学科。

目前的人工智能已在图像识别、语音识别和自然语言处理等方面取得了成功应用,特别是视觉和语音识别的成功率目前已经超过95%,已经具备感知层的基础技术。

这些进步离不开2012年深度学习和神经网络井喷式的成长,而人工智能发展了近60年,为什么会在近几年爆发呢?视觉搜索类AI型创业公司Yi+的产品负责人张子昂认为:得益于近年来计算机处理能力的突破和互联网大数据的爆发,再加上深度学习算法在数据训练上取得的进展。算法、计算、数据三大领域基本都已成熟。

那么这些领域业已成熟的具体表现有哪些?在人脸识别领域有着十几年从业经验,目前在计算机视觉领域的大数据公司格灵深瞳担任 CTO 一职的邓亚峰给 100offer 举出了详细的例子:

深度学习的方法相对于传统方法(手工设计规则)有巨大的提升,主要有三个方面:
1.数据量:互联网兴起之初人们还没有对数据给予足够的重视,以前最大的数据库可能在几百、几千左右,现在很多公司的数据库都是千万甚至破亿,最少也是百万级别的流量。
2.运算能力的增强:以前训练一个模型,即使是很浅的一个模型,三层也需要运算三周时间。现在训练几十层只需要一周左右的时间。运算能力大大增强后,实验速度也加快了,项目落地的可行性也随之增强。
3.算法的进步。

数据量的积累、运算能力的增强和算法的进步共同促成了人工智能的火爆,机器学习也正被运用到越来越多的应用场景中。现阶段的人工智能,正处在以计算机视觉和自然语言处理为代表的感知智能蓬勃发展期,从以往的发展规律来看,未来5-10年内,机器学习和深度学习应该会逐渐成熟并运用到越来越多的生活和工作领域中。

然而人类离认知智能时代,还有很长一段距离。


  • 目前国内有哪些人工智能领域的优秀公司?

目前国内外人工智能领域的公司大致可以分为以下几个类型:

深度学习/机器学习、自然语言处理、计算机视觉/图像识别、手势控制、虚拟个人助理、智能机器人、推荐引擎和协同过滤、情境感知计算、语音翻译、视频内容自动识别。(其中机器学习和计算机视觉还可以进一步细分为通用型和应用型)

上图是不同领域人工智能领域公司的数量,从中可以看出:机器学习、计算机视觉和自然语言处理是目前公司数量最多的三大领域,其中机器学习类人工智能公司在数量上遥遥领先(263家)。

实际上,融资金额上机器学习同样最受资本欢迎,截至目前共获得了近20亿美元的融资总额。

目前国内机器学习涉及到的领域比较广,在机器之心去年公布的一份「全球最值得关注的100家人工智能公司」中,中国有27家公司上榜,100offer 整理了这些公司的信息,它们分别是:

语音和自然语言


计算机视觉


芯片和硬件


智能机器

智能驾驶


垂直应用


金融


医疗


大公司


我们可以看出,机器学习涉及的领域非常广泛,技术的应用场景也非常多元化,仅计算机视觉相关的机器学习技术就可以运用到安防、电商、广告、金融等多个领域。那么,对于一名想加入人工智能领域的工程师来说,选择哪种领域比较有前景呢?

首先,我们要看看目前人工智能领域常招的职位有哪些,以及他们目前的需求情况。


二、人工智能领域需要怎样的人才?

前面已经介绍,人工智能目前正处在感知智能阶段,即让人工智能看懂、听懂、读懂世界,因此近几年国内研究计算机视觉、自然语言处理和语音识别的公司居多。

与此同时,机器学习技术的突破和谷歌、微软、Facebook 等科技巨头把机器学习技术进行开源,带来的直接结果是机器学习被应用到越来越多的细分领域中,在近几年成为热门。

现在任何一家人工智能类的公司,都设有机器学习相关职位。然而在现阶段的人工智能公司中,职位与职位之间的概念十分模糊,热门职位算法工程师、数据挖掘工程师和机器学习工程师之间的人才也具有很大的通用性。

下图是算法、数据挖掘和机器学习三类职位在 100offer 上的平均面邀薪资与所有技术职位平均面邀薪资的对比。可以看出算法、数据挖掘和机器学习的人均面邀薪资均高于 100offer 上 的所有技术岗位,其中机器学习以454K的年薪遥遥领先。

(薪资单位:K)

薪资的高低某种程度反映了该职位的稀缺度。不少 AI 领域的企业招聘负责人告诉 100offer,目前公司发展最大的难题是:有 AI 背景的人才太难招。

机器学习从2012年开始才真正爆发,而此前该领域更多处于研究阶段。2013年以后,人工智能领域的公司融资金额呈翻倍式增长,越来越多的创业公司开始选择人工智能,但与 O2O、电子商务等热门领域不同的是,人工智能领域技术门槛较高。已有的人才数量满足不了这个市场爆发式的增长,而一个在机器学习领域0经验的工程师想转行人工智能,至少需要2年以上的入门学习。

于是那些但凡有机器学习相关学历或工作背景的候选人似乎一夜之间成了市场的香饽饽。即使没有人工智能相关背景,在人才高度匮乏的情况下,与机器学习息息相关的算法工程师和数据挖掘工程师的热度也被炒热了起来。以算法工程师为例,2015年的互联网领域,一名硕士毕业工作两年左右的普通算法工程师,平均面邀月薪在15K-30K之间,这个范围在2016年第四季度已经上涨到了25K-40K之间。

同时,我们还研究了以上三类职位在 100offer 的面试邀请情况和人才简历,发现在目前的人工智能领域,受欢迎的人才有一些共通性,下面分类进行分析。


  • 算法工程师

算法工程师难招,几乎成了每家人工智能类创业公司共同的招人痛点。想招行业里 TOP 级别的算法工程师更是难上加难,这类人才资源一般也都被大公司垄断。

因为大公司很多系统的数据量很大,比如做一个几亿级别的人脸搜索,对算法工程师效率和优化的要求都很高,是一个极具挑战的事,自然也吸引行业内最优秀的算法工程师加入。

下图是2016年 100offer 上的大公司VS小公司给算法工程师开出的平均面邀薪资对比,从中可以看出500人以上的大公司在争抢人才时更阔气:


那么,一名优秀的算法工程师究竟要具备哪些技能才能满足 AI 公司的招人需求呢?算法工程师在 AI 企业的工作内容和普通互联网公司又有何区别?

以下,是 100offer 根据不同 AI 企业在 100offer 上发送的面试邀请情况,总结出的算法工程师必备技能。





  • 在数据结构和算法方面有扎实的基础
  • 至少精通 C/C++ 或 Java 中的一种编程语言,Python/Perl/Shell 中的一种脚本语言
  • 精通机器学习常用算法是加分项
  • 数学专业的硕士或博士,有一定数学功底是加分项
  • 有图像识别、深度学习、机器学习、自然语言处理等相关经验是非常大的加分项

从以上要求可以看出,AI 公司的算法工程师和普通算法职位相比,除了通用的数据结构和算法基础外,最好还在机器学习领域有一定经验或研究,某种意义上和机器学习工程师的工作内容有一定重合。但机器学习并非必须具备的经验,只要你精通 C++ 或 Python 中的一门语言,同时拥有扎实的算法和数据基础,进入一家 AI 公司一般不成问题。

而加入 AI 公司后从事的具体工作,大多与根据海量数据进行用户行为的预测建模有关,将一家公司的用户数据通过技术手段转化为商业价值。


  • 数据挖掘/数据科学家

前面有介绍过,数据是人工智能的基础,对于人工智能来说是水和电般的存在。机器学习依赖于大量数据,算法发展得再先进数据量不够也是徒劳,这也是去年数据挖掘工程师如此吃香的原因。

对于企业而言,拥有目标人群的庞大数据集,才能在行业内具备竞争优势。所以从前年开始,很多互联网企业就在有意无意地通过各种渠道获取数据。

关于数据工程师的类别和职责,我们在上一篇文章从技术 Leader 的招聘需求看,如何转岗为当前紧缺的大数据相关人才?中已经详细介绍过,这里再叙述一次。

  • 大数据平台/开发工程师
他们的工作重心在于数据的收集、存储、管理与处理。
通常比较偏底层基础架构的开发和维护,需要这些工程师对 Hadoop/Spark 生态有比较清晰的认识,懂分布式集群的开发和维护。熟悉 NoSQL,了解 ETL,了解数据仓库的构建,还可能接触机器学习平台等平台搭建。
有些大数据开发工程师做的工作可能也会偏重于应用层,将算法工程师训练好的模型在逻辑应用层进行实现,不过有些公司会将此类工程师归入软件开发团队而非大数据团队。



  • 数据挖掘工程师
有的团队面对的挑战不限于某一个具体问题,而在于如何将复杂的业务逻辑转化为算法、模型问题,从而利用海量数据解决这个问题。这类问题不需要工程师在算法上探索得足够深入,但是需要足够的广度和交叉技能。他们需要了解常见的机器学习算法,并知晓各种算法的利弊。同时他们也要有迅速理解业务的能力,知晓数据的来源、去向和处理的过程,并对数据有高度的敏感性。这类工程师的 Title 以「数据挖掘工程师」居多。

任何一家AI公司要想做得好,机器对数据进行标注和训练的能力不可或缺。因而大部分企业招聘的数据挖掘工程师也需要了解常用的机器学习算法,和机器学习工程师存在一定交叉。

机器学习和大数据火起来后,数据挖掘工程师从去年开始成为众多企业争抢的对象,目前在市场上同样是供小于求,因而在薪资待遇上也十分让人眼红。


  • 机器学习工程师

在深度学习普及之前,企业对人才在这个领域的积累要求很高。普通工程师一般要在这个行业积累两三年,才有一个基础可以做一些更深的任务。在深度学习普及之后,无论是训练框架还是模型,都没有涉及太多特征的东西,实际上对从业者的入门门槛降低了。所以只要一个工程师的工程能力和算法逻辑足够好,对深度学习有一个基本的概念,把框架跑起来一般没什么问题。

深度学习一般需要1-2年的时间打基础。对于想要转行进入深度学习领域的工程师来说,有深度学习的基础对进入这个领域有很大的帮助,但不是必须的。

某种意义上讲,纯深度学习偏工程应用,有点像 engineer,很多东西要用编程去实现,这里面有很多算法的挑战。有两类人能在这个领域做得很好:

一类人算法能力非常强,能发明出高新的算法来。另一类人工程能力强,这里的工程能力指的是偏底层运算、优化相关的能力。他们不需要发明很多好的算法,更多是把东西做得更工程化,便于使用。

所以大部分工程师在入门机器学习时,只要在计算机科学领域有比较强的基础和积累,同时对数据和所在细分领域——比如计算机视觉领域的图像和 domain知识有半年到一年左右时间的了解,入门是没有问题的,但想要做好还需要很长一段时间。

目前国内在深度学习领域有深入研究和项目基础的人才非常少。2002年在清华大学读硕士的邓亚峰,大学时就接触了人工智能,但毕业后发现市场上做人工智能的公司非常少,那时只有佳能、理光等扫描仪、打印机类的公司在做一些图像识别。而自己之所以能在人工智能这一发展比较缓慢的行业坚持做了14年的图像识别,主要还是依靠兴趣。

现在像邓亚峰这类有十几年机器学习相关背景的人才在市场上十分稀缺。大部分企业在人才供给不足的情况下,会考虑招一些编程能力比较强,算法和数据结构基础好,同时对机器学习有一定了解的人,这类人一般上手也比较快。

最后总结一下那些在人工智能领域受企业欢迎的人才所具有的几点共性:

1.精通C/C++、Python、Java、Scala等任意一门编程语言,其中C++和Python工程师在算法和数据挖掘方面的优势,使其倍受机器学习相关岗位的欢迎。

2.扎实的数据结构和算法基础。

3.有机器学习、图像识别、数据挖掘、自然语言处理等任何一项的项目或工作经验都是加分项。

4.有搜索引擎、个性化推荐和广告系统推荐相关项目经验的工程师在AI领域比较容易直接上手,同样受AI企业欢迎。

5.对于工作经验不足的人来说,只要有机器学习相关的学历背景,同样非常受企业欢迎。比如毕业于清华大学数据挖掘与机器学习专业的某博士A先生,即使毕业后只有一家传统企业的管培生经验,也收到了包括阿里、网易、猎豹、蚂蚁金服等大公司在内的11封面试邀请。

6.名校背景、硕士以上学历、25岁+、有数学基础的候选人异常受欢迎。

以上,就是目前在人工智能领域最受企业欢迎的几类人才。如果你符合以上特征,并且正在考虑加入一家人工智能相关的公司,那么在选择公司时应该做哪些考量呢?


三、如何考察一家人工智能公司是否值得加入?

人工智能近年的爆发得益于算法、计算能力和数据量的进步,所以我们在考察一家人工智能领域的公司是否值得加入时,这几方面也是重点考察目标。此外,由于人工智能领域技术上的高门槛,团队成员的实践经验、公司软硬件设施等因素也应该作为重点考察的因素之一。


1.数据规模、质量与来源

算法的进步很大程度依赖于企业的用户规模和数据量,大规模的用户数是大数据的基础,而庞大的数据量又是人工智能的基础。因此,人工智能领域的优秀人才一般会被一些用户量比较大的平台,或者已经有足够丰富、有价值数据的创业公司吸引,因为海量的数据意味着算法的精准度更高,这对一个工程师的挑战也更大。

所以工程师们在选择一家公司时,首先要了解这家公司的数据库有多大,以及这些数据从哪里来。

Yi+ 的产品负责人张子昂告诉 100offer,对于目前的大多数创业公司来说,数据主要有3种来源:

1.自筹数据:投入大量人力采集数据,比如视觉搜索相关 AI 公司的数据可以来自视频里的截图,团队自己去实拍,或向消费者提供类似照片处理的免费软件,短期内快速积攒数据。也可以写爬虫在网络上爬取数据,比如把在百度上搜集到的图片下载下来。这样做的好处在于速度快,坏处在于搜索下来的图片质量比较粗糙,并且可能和实际应用场景出入比较大。

2.公共数据:在一些公共数据开放平台获取想要的数据。但是这类数据有一定局限性,有时企业想要的数据公共平台不一定有。

3.产业数据协同:和产业链上游的数据平台型公司建立合作,连接双方均有利的产品或数据,比如阿里云平台。Yi + 也正是在与一些大型电商平台导流合作的过程中,获取了大量电商平台的产品数据,互惠互利。

当然如果是阿里巴巴、腾讯、百度、京东、滴滴等这种用户规模千万甚至破亿的公司,长久以来已经积攒了独有的数据库,这些都是非常宝贵的竞争资源。

但目前有一些大公司的内部数据没有打通,不同精准度的数据之间也并不匹配,这也是大公司想要充分利用自己的数据资源时要攻克的难题之一。

2.硬件处理能力

当然有了海量数据却没有硬件处理能力也不行,目前国内一些大企业一般在数据上都有足够积攒,但处理能力又另当别论了。

像 BAT 这类公司既有数据量,又在处理能力上有各自的投入,一般来说比较有保障。

而一些偏传统的国有企业,比如电信、银行等,虽然也有很大的数据量但是处理能力和对数据的重视与投入程度应该会差很多。

再就是一些用户量很大或能通过特殊技术获取到大量有价值数据的创业公司,如果再将数据处理作为公司发展的核心竞争力,也有可能成为人工智能时代的黑马。

3.人工智能算法

不是所有使用深度学习算法的公司都是人工智能公司,虽然算法在人工智能领域很重要,但一家人工智能公司是否有自己 IP 的算法,算法有没有自己的特色和创新点更加重要。

革新的算法具有超前的洞见,给公司和产品带来竞争优势。比如 Google 发明PageRank 的时候,其他搜索公司都在计算链接被引用的次数,把次数作为权重指导排名。PageRank 的出现把链接之间的关系抽象成随机行走模型,而不是简单计数,结果 Google 的产品一出来就超过了竞品,好评如潮,这就是创新算法给一家公司甚至一个行业创造的价值。

4.团队成员背景

人工智能的技术门槛之高决定了它不是看几本书或读几篇文章就能入门上手的。所以目前人工智能领域的创业公司规模都很小,员工数在50人以下的公司占据整个市场的90%。

这就要求团队成员的精英化,对于那些想去人工智能公司学习进步的工程师来说,一定要提前考察从创始人到核心团队的学历、工作背景和人工智能领域的相关经历和实践,避免加入一家「伪人工智能公司」。


四、人工智能未来的发展方向

在人工智能的几大分支领域,机器学习无论在资本、公司数量还是技术上都遥遥领先。从去年的资本动态和大公司在这方面的布局来看,机器学习的市场很可能在未来3-5年展开爆炸式的发展。

关于这一点,做了14年图像识别的邓亚峰感受颇深:「虽然这几年人工智能很热,但对我来说人工智能才刚刚开始。」

邓亚峰说,指纹识别和图像识别是人工智能领域能大规模运用的两项技术,它们都已发展了十几、二十年,其中指纹识别在还没有深度学习的时代就已经做得非常成熟。而现在的深度学习能把图像抽象表达成特征,是一种非常强大的表示方法,把之前的方法都颠覆了。

「在这样的情况下,后面一定会有越来越多的技术被使用,但不是一两年就能发生的。人脸识别技术再过五年左右应该可以大规模投入应用,实现通用。当然,除了图像识别外,还有语义识别等很多很多技术领域等待被突破。」

比如,目前国内85%的企业都在做软件服务,其他领域如智能机器人这类硬件产品还相对匮乏,随着人工智能和机器学习的不断发展成熟,智能机器人等硬件产品在未来还有很大的发展空间。

目前我国的人工智能还处在感知智能阶段,按照语音识别和视觉识别的发展规律来看,感知智能技术从应用发展到普及大概还要5—10年的时间。这段时间内,机器学习、深度学习等相关技术还有很大的发展空间,相关职位的热度也定会持续升温。

100offer预测:未来几年内,现在「互联网+」的概念,很可能被「AI+」的概念颠覆。人工智能将是人类持续探索的一个领域,一旦成功,带来的将是整个社会生活方式的变革,在史册上意义非凡。

所以我们看到无论是国外的IBM、谷歌等互联网巨头,还是国内一向重视技术发展的BAT,近几年都在人工智能上投入了大量人力物力。文章的最后,我们用BAT三巨头在人工智能方面的表态结尾。

百度CEO李彦宏:「人工智能经过大概半个世纪的发展,目前已经到了一个即将要出现并井喷创新的阶段。当技术从量变到质变的时候,如果不提前布局,可能就被掀个人仰马翻。这也是为什么百度这几年对于人工智能、深度学习的投入非常坚决、大手笔。」

腾讯CEO马化腾:「人工智能是我最想做的事。」

阿里巴巴CEO马云:「未来三十年才是互联网技术真正深刻改变社会各方面的时代,云计算、大数据、人工智能等技术将会让无数的梦想成真。」

互联网行业新的风口即将来临,作为即将见证下一场科技变革的互联网人,现在要做的事情就是提前找准风口,等风来。

你准备好了吗?


更多热门职位相关文章:

帝国的更迭 :Go语言能否成为新的霸主?

C++和C++程序员快要被市场淘汰了?

为何优秀的Java程序员如此难招?

430deff0cb50419999cb629642611a551481774624 80x80
林安
100offer 码字人,专注互联网行业的城市发展与人才流动,曾做过北京、上海、杭州、新加坡等多座城市的互联网内容,为了输出更多有价值的内容,依然在路上。
评论
2条评论
中国,广州,技术
2017.03.04 10:50
这些职位对年龄上限一般有什么要求吗
北京/硅谷,数据产品经理
2017.01.26 18:00
不错的观察和信息,谢谢分享。