中国人工智能行业市场调研分析报告_第1页
中国人工智能行业市场调研分析报告_第2页
中国人工智能行业市场调研分析报告_第3页
中国人工智能行业市场调研分析报告_第4页
中国人工智能行业市场调研分析报告_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国人工智能行业市场调研分析报告目录前言 4第一节人工智能的新时代到来:情境驱动时代 5一、人工智能发展历史 5二、人工智能市场预测 9三、数据视角下当前AI的技术布局 11四、AI解决的痛点与存在的不足 13五、AI对人类社会的影响 14第二节无数据不AI 15一、数据与AI的关系 15二、新的商业竞争范式 16第三节行业全景与企业玩家分类 18一、数据视角下的中国人工智能行业全景 18二、中国企业玩家分类及各自的速赢策略 21第四节未来人工智能的发展趋势以及对策 23一、中国人工智能行业发展趋势 23二、中国人工智能行业玩家的应对策略 25三、对中国监管者的启示 25图表目录TOC\h\z\c"图表"图表1:数据思维下当前AI技术产业结构图 13图表2:AI的三阶段发展与数据的关系 16图表3:智能数据时代人工智能、大数据与人的智慧的关系 17图表4:数据视角下人工智能行业布局示意图 19图表5:各个行业不同情境下的代表企业 20图表6:人工智能行业价值微笑曲线 24表格目录TOC\h\z\c"表格"表格1:各家研究机构对于全球人工智能市场规模的预测 9表格2:各家研究机构对于中国人工智能市场规模的预测 10前言今年以来又出现了很多热词,不止大数据,人工智能(AI)、深度学习(deeplearning)、机器学习(machinelearning)、AR、VR……形色的创业团队鲸吞了市场上相当一大部分的投资。所有这一切好像跟我们相关,但好像离商业价值又那么远,他们之间到底跟数据有什么关系,有没有可能给其他行业创造价值?移动设备已经成为人类身体的延伸。我们每天手机使用时长将近四个小时,好像历史上第一次有这么一件东西跟着人在一起,它甚至已经变成人体的一部分,它默默在后台记录着我们,不管上网,还是在现实生活中,在家中,在上班,在吃饭,在旅游,在消费,我们所有的足迹都在被默默地记录下来。好像数据行业迎来了历史上最好的时刻——数据爆发的时刻。但是,这已不是一个单纯的积累数据量的时代,这个新的时代,对计算提出了更高的挑战。第一,这些数据并不是所有的都被存储和收集。除了摄像头和话筒,一个手机携带的传感器数量多达16个。这大量的隐形数据的采集、运算、存储、传输等等领域依然存在着巨大的障碍。第二,如何从大量的数据里面解读人的动作,识别人的场景是更加重要的一个问题。现在的很多数据都是非结构化的情境数据,例如图像、声音、姿态、动作等等,需要人工智能的帮忙从中间提炼有价值的信息。所有的世界上顶尖的技术公司都在做一件事情,就是尝试用算法用机器学习去还原人在现实生活中的动作,不管视觉、听觉、姿态、感知还是做一些基础的工作,现在语音识别的技术,图象识别的技术都在大规模的发展。但是为什么当数十亿大脑神经元彼此传递信号时,就会出现喜爱、恐惧或者愤怒的主观感受呢?对此,我们依然一无所知。人工智能对世界的认知还停留在早期阶段。2016年,谷歌旗下的Deepmind公司研发的人工智能围棋程序AlphaGo以4:1的比分战胜了世界冠军李世石,震惊了世界。围棋因为其复杂性被认为是机器最难战胜人类的领域,但AlphaGo通过深度学习和神经网络技术赋予了机器“直觉”以及自我学习能力,最终征服了围棋,成为了人工智能史上的又一里程碑,也让我们对人工智能的未来中充满了信心。人工智能作为一门交叉学科和科学前沿,至今尚无统一的定义,但不同科学背景的学者对人工智能做了不同的解释:符号主义学派认为人工智能源于数理逻辑,通过计算机的符号操作来模拟人类的认知过程,从而建立起基于知识的人工智能系统,其主要代表成果是风靡一时的专家系统;联结主义学派认为人工智能源于仿生学,特别是人脑模型的研究,通过神经网络的联结机制和学习算法,建立起基于人脑的人工智能系统,其主要的代表成果是风头正劲的深度学习;行为主义学派认为智能取决于感知和行动,通过智能体与外界环境的交互和适应,建立基于“感知-行为”的人工智能系统,其主要代表成果是独树一帜的强化学习。其实这三个学派分别从思维过程、脑结构、身体三个方面对人工智能做了一个阐述,目标都是创造出一个可以像人类一样具有智慧,能够自适应环境的智能体。数据促进了人工智能的发展。AI技术的过去与现在的最大区别并不是算法上的区别,而是相适应的计算能力、原始数据和处理速度现在都有了,因此AI技术现在能大放异彩。目前人工智能在识别,包括在认知,产生很大进展的原因首先是数据量带来的。本报告主要将⼈工智能视为通过合成智能以研究智能特性的计算机科学的一个分支,并着重从人工智能和数据的关系角度出发,分析了人工智能行业的发展现状与趋势,并给出建议。第一节人工智能的新时代到来:情境驱动时代一、人工智能发展历史A.世界发展综述:三个阶段纵观人工智能的发展历史,大致可以分为三个阶段。第一个阶段叫技术驱动阶段,第二个阶段叫数据驱动阶段,第三个阶段叫情境驱动阶段。人工智能1.0:技术驱动人工智能发展的第一个阶段,是基础理论诞生集中的阶段。这个阶段奠定了人工智能发展的基本规则,并诞生了基本的开发工具,为日后人工智能的研发工具的升级开辟了先河。在这个阶段,技术的发展,尤其是算法的发展,成了推动人工智能进步的最大动力。尤其是达特茅斯会议之后,人们对于算法程序、语言的开发投入了极大热情,掀起了人工智能发展的第一波高潮。在这个阶段的历史性事件有:1936年英国数学家阿兰·图灵发表了一篇文章用于证明只用一种只需要对0和1两个数进行处理的通用计算机,就可以实现任何以演算式表达的数学问题。这种机器被命名为“图灵机”。成为了现代计算机的理论基础。1950年阿兰·图灵出版《计算机与智能》。书中提到用来检验机器智能是否与人类相当的“图灵测试”:如果一台机器能够与人类展开对话且不能被辨别出其机器身份,那么,就称这台机器具有智能。同年,科幻作家艾萨克·阿西莫夫提出“机器人三定律”,为人工智能的设计与制造提供了准则。1956年第一节人工智能会议在美国达特茅斯学院召开,标志着人工智能领域正式诞生。同年,艾伦·纽厄尔和赫伯特·A·西蒙开发出了一个名为“逻辑理论家”的程序,能够证明《数学原理》中的38个定理,其中某些证明比原著更新颖和精妙。1958年约翰·麦卡锡发明了Lisp编程语言,后来被广泛运用于人工智能和计算机领域。1963年美国国防部高级研究计划局(DARPA)给麻省理工学院、卡内基梅隆大学的人工智能研究组投入了大量经费,人工智能的研究迎来了第一个高潮1964年麻省理工学院的丹尼·巴洛向世人展示,电脑能掌握足够的自然语言从而解决了开发计算机代数词汇程序的难题。1965年约瑟夫·魏岑堡建造了ELIZA——一种互动程序,它能以英语与人就任意话题展开对话。1969年斯坦福大学研制出Shakey——一种集运动、理解和解决问题能力于一身的机器人。1973年英国数学家詹姆斯·莱特希尔报告称人工智能最多只能在棋类游戏上达到比较有经验的业余选手水平,永远无法胜任常识推理和人脸识别这样的工作。导致英国政府大幅缩减了对人工智能的研究投资。同时DARPA也对美国人工智能研究感到失望取消了卡内基梅隆大学人工智能研究的投资,人工智能第一次陷入寒冬1979年第一台电脑控制的自动行走器“斯坦福车”诞生。人工智能2.0:数据驱动人工智能发展的第二个阶段,是数据推动人工智能更新迭代的阶段。这个阶段,可获得和分析的数据量级的增长,不仅磨练和提高了大计算的能力,使人工智能的大规模运算成为可能,并且也反过来倒逼了数据的采集、清洗和积累,以及相应的软硬件基础设施的发展,推动了大数据行业的腾飞。大公司在这个阶段发挥出了规模优势,训练数据的获取和积累,成为了推动人工智能发展第二波高潮的主要动力。在这个阶段的历史性事件有:1982年物理学家约翰·霍普菲尔德证明使用神经网络可以让计算机以崭新的方式学习并处理信息。同时戴维·鲁梅哈特推广了由保罗·韦尔博斯发明的反向传播算法(BP算法),是的大规模神经网络训练成为可能。使人工智能迎来第二波高潮。同时标志着人工智能正式进入了数据驱动时代。1983年世界第一家批量生产统一规格电脑的公司“思考机器”诞生。1987年人工智能硬件设备遭遇突然挫败,原因是苹果公司和IBM公司设计的一系列台式计算机性能稳步提升,赶上了人工智能设备,甚至还有价格上的优势,以至于没有人选择人工智能设备了。人工智能再次陷入低谷。1994年西洋跳棋程序Chinook打败了世界排名第二的人类选手廷斯利。1997年IBM(国际商用机械公司)制造的电脑“深蓝”击败了国际象棋冠军加里·卡斯帕罗夫。“深蓝”在1秒内能够计算两亿种可能的位置,可搜索并估计随后的12步棋。2000年互动机械宠物面世。麻省理工学院推出了会做数十种面部表情的机器人Kisinel。人工智能3.0:情境驱动(进一步推动新技术驱动,通用性AI/超级AI)人工智能发展的第三个阶段,是情境推动人工智能更深入到具体应用的阶段。随着人工智能的技术发展和数据积累,行业逐渐发现短期内通用智能和强人工智能是难以实现的,数据分布的情境化特性使得人工智能在特定情境下的垂直发展成为了可能。这个阶段,新的实用情境的识别与发现,以及对该情境的人工智能解决方案的研究极大的推动了人工智能行业的丰富和前进。在这个阶段的历史性事件有:2005年Stanford开发的一台机器人在一条沙漠小径上成功地自动行驶了131英里,赢得了DARPA挑战大赛头奖。同年,波士顿动力公司的专家创造了四腿机器人大狗。这个项目是由美国国防高级研究计划局资助的,源自国防部为军队开发新技术的任务。2010年塞巴斯蒂安•特龙领导的谷歌无人驾驶汽车曝光,当时已经创下了超过16万千米无事故的纪录。2011年苹果公司发布手机语音助手Siri,它可以“理解”人类讲的话并根据用户的偏好从网上搜索信息,为用户导航,播报天气,或是推荐附近的餐馆,甚至与客户进行简单的聊天。2013年谷歌Atlas机器人公开亮相。Atlas是一个双足人形机器人,由美国波士顿动力公司为主开发,和由美国国防部国防高等研究计划署(DARPA)的资助和监督。这个身高6英尺(1.8米)的机器人是专为各种搜索及拯救任务而设计。2016年谷歌旗下的Deepmind公司研发的人工智能围棋程序AlphaGo以4:1的比分战胜了世界冠军李世石,震惊了世界,围棋因为其复杂性被认为是机器最难战胜人类的领域,但AlphaGo通过深度学习和神经网络技术赋予了机器“直觉”以及自我学习能力,最终征服了围棋,成为了人工智能时尚的又一里程碑,也让我们对人工智能的未来中充满了信心。2016年苹果用户可以正式更新全新的iOS10系统,更新后的iOS系统可以让用户随意找到在任意时间和地点、有关任意人或事物的照片。iOS10系统利用了人工智能神经网络技术,用户每次拍摄照片的0.1秒内会进行约110亿次运算,可以找出照片中的人物是谁,甚至以及他们处于什么样的情绪。2016年谷歌DeepMind改进了深度学习算法使其变为单次学习,让人工智能可以仅通过一个例子就辨认出图像中的事物。B.国内人工智能行业发展中国的人工智能发展始于改革开放年代,也经历过这三个阶段。中国人工智能的发展在汲取西方先进科学技术的同时,也发展出了自己独特的模式方向,以及惊人的速度。我国是从1978年才开始人工智能课题的研究,主要在定理证明、汉语自然语言理解、机器人及专家系统方面设立课题,并取得一些初步成果。我国也先后成立中国人工智能学会、中国计算机学会人工智能和模式识别专业委员会和中国自动化学会模式识别与机器智能专业委员会等学术团体,开展这方面的学术交流。此外国家还着手兴建了若干个与人工智能研究有关的国家重点实验室,这些都将促进我国人工智能的研究,为这一学科的发展作出贡献。纳入国家计划的“智能模拟”研究始于1978年;1984年召开了智能计算机及其系统的全国学术讨论会;1981年起,相继成立了中国人工智能学会(CAAI)等学术团体;1986年起把智能计算机系统、智能机器人和智能信息处理(含模式识别)等重大项目列入国家高技术研究计划;1993年起,又把智能控制和智能自动化等项目列入国家科技攀登计划。进入21世纪后,有更多的人工智能与智能系统研究获得各种基金计划支持,各个领域的人工智能的创业团队鲸吞了2015年以来的一大大部分创业资本市场,在中国掀起了人工智能的发展高潮。在关于人工智能理论研究方面,国内学者除沿袭国外三大人工智能学派理论之外,具有代表性的还有:我国人工智能学科的主要奠基人、中国人工智能学会的主要创始人之一涂序彦提出的广义人工智能(GAI),北京邮电大学钟义信教授提出的机制主义理论,北京师范大学教授刘晓力倡导的以“认知是算法不可完全的”理念为基础的研究纲领等。现在,我国已有数以万计的科技人员和大学师生从事不同层次的人工智能研究与学习。人工智能研究已在我国的深入开展,必将为促进其它学科的发展和我国的现代化建设做出新的重大贡献。二、人工智能市场预测根据IDC新的一份全球半年度认知/人工智能系统开支指南,认知/人工智能解决方案市场在2016年2020年预测期内的复合年增长率(CAGR)将达到55.1%,认知计算和人工智能(AI)在各行各业中的广泛应用将推动其全球收入从2016年的近80亿美元增加到2020年的470多亿美元。根据国外调查机构Tractica的统计预测数字,到2024年人工智能的市场规模将达到406亿美元,也就是2700亿人民币。2015年,人工智能市场规模为490亿元,还不及2024年的1/8,整个人工智能市场将呈现出爆炸式增长。经济学人发表文章显示,大型公司在加紧收购AI创业公司,招聘科研人员,文章也写道,在2015年,大型公司在AI企业上共花费了85亿美金,是2010年的4倍。根据CBInsights统计,仅在2016年上半年,200家AI企业筹资高达15亿美元。从下表可以看出,各家研究机构对于人工智能的市场普遍报以乐观态度,整个人工智能市场将在2020年达到了百亿级别的量级。表格SEQ表格\*ARABIC1:各家研究机构对于全球人工智能市场规模的预测注:由于各统计机构对于人工智能市场的定义不同,导致市场规模统计数值出现差异在中国,人工智能市场也将成为一个百亿元人民币的市场,并极大的推动其他相关产业发展。表格SEQ表格\*ARABIC2:各家研究机构对于中国人工智能市场规模的预测注:各统计机构由于统计时间不同,同时,对人工智能市场的定义不同,导致市场规模统计数值出现差异三、数据视角下当前AI的技术布局那么在这个拥有巨大潜力的市场中,各家企业是如何划分各自领域的呢?经过几十年的发展,人工智能的研究领域已经扩展到了自然语言处理、模式识别、图像识别、数据挖掘、机器学习、智能接口技术、智能信息处理等。其中,数据挖掘、模式识别、机器学习和信息处理是构的核心技术,实现信息的采集、分析、处理和反馈等功能。具体来说,现有AI领域按照技术划分可以分为如下类型:1)虚拟助手:代表企业有微软、APPLE、Next.IT、ejenta、X.ai、sher.pa、Genee、HiOperator、Viv、mobileROI2)机器学习:包括应用层面和分析层面。代表企业有DeepMind、Vicarious、Bonsai、PreferredNetworks、Skymind、H2O.ai、Uptake、Indico、第四范式、ayasdi、Criteo、everstring、DBnetworks、Algorithmia、6sense、CustomerMatrix、ALPACADB、Graphlab、bigml、iCarbonX、nervana、arago、谷歌、百度、Facebook、NVIDIA、IBM、微软、腾讯3)计算机视觉:包括应用和基础的采集层面。代表企业有Clarifai、Affectiva、ViSenze、DittoLabs、谷歌、Facebook、微软、腾讯4)智能机器人:代表企业有ABBRobotics、ANKI、Fanuc、KUKARobotics、3DRobotics、大疆、tingbot、savioke、IBMWatson、Softbank、NeatoRobotics、图灵机器人、rethinkrobotics、iRobot、Cyberdyne5)手势识别:代表企业有微软、谷歌、eyeSight、gestigon、gesturetek、Omek、vicoVO6)自然语言处理:代表企业有谷歌、Facebook、微软、APPLE、X.AI、Api.ai、Maluuba、Synapsify、KITT.AI、ArriaNLG、AutomatedInsights、AppTek、iSpeech、verbio、VoiceBase、inbenta、ARRIA、DigitalReasoning、AutomatedInsights7)语音识别:代表企业有IBM、谷歌、Facebook、科大讯飞、promptu、voci、promptu、EasyAsk、思必驰、云知声、Api.ai、speechmatics8)情景感知计算:代表企业有APPLE、cleversense、semusi、EnFind、origo、grokr9)推荐引擎:代表企业有谷歌、百度、eXenSa、nara、Utrip、Tipflare10)硬件支持:代表企业有英特尔、NVIDIA、IBMTrueNorth、WaveComputing、DeepVision、ALCES、Ceva、TeraDeep、Kneron、寒武纪、深鉴科技由于人工智能的发展需要数据的训练,那么这些人工智能相关的技术如果按照数据处理和应用的生命周期(感知-收集、链接、准备,认知、分析,预测-指导行动)来划分,可以归结成三大类人工智能技术:1)基础类人工智能技术:这类人工智能技术解决了数据的基础层工作,包括了采集和存储,具体来说,视频内容识别,通用性计算机视觉,情境感知计算,语音识别,自然语言处理等技术属于这个范畴。2)分析类人工智能技术:主要指用数据训练算法提供服务的公司,包括了给人提供算法的公司,和提供算法服务的平台(例如tensorflow等),这里通用性机器学习是主要的技术。3)应用类人工智能技术:主要指采用情境化的数据在某一固定领域使用的人工智能技术,包括了应用,虚拟助理,应用层机器学习,应用层计算机视觉,推荐引擎,手势控制,语音翻译,智能机器人等技术按照上述的分类方法,我们可以得出目前AI技术的产业布局如下图所示:图表SEQ图表\*ARABIC1:数据思维下当前AI技术产业结构图四、AI解决的痛点与存在的不足由于数据的情境化特性,目前的AI应用水平主要是弱人工智能,即在特定的情景,基于情景化的数据,完成特定的目的或功能。目前来说,现有的AI发展面临着以下几个痛点:1)缺少训练数据:虽然已经积累了大量的数据,但是平均到每家企业上,可获得的数据来源还是较为单一。由于商业竞争壁垒的存在,这些数据之间很少能够形成交叉。因此,为了满足数据多源性,企业不得不求助于建立数据生态,以丰富培养人工智能必要的训练数据来源。2)缺少情境应用:目前只有少数的几个数据可以被积累和分析的情境可见人工智能的快速发展,例如智能驾驶,机器人等,其他很多情境还是非常沉寂。这是因为能够被采集到的数据不到实际产生信息量的10%,这其中能被分析的数据更少之又少。这些数据大部分沉寂在情境中,非结构化数据更多,对计算能力等提出更高要求,还没有合适的技术将其转化成可分析的数据。因此,寻求合适的应用情境并深入建立培养人工智能的数据基础成为一大痛点。3)商业化路径较远:目前大多数的人工智能的发展还依赖于国家技术军备战略的推动以及资本的推动,真正能够实现自主造血能力的企业几乎没有。首先因为弱人工智能本身的特点,使用情境较为垂直和狭窄,商业上难以形成横向复制达到规模优势;其次,在人工智能目前发展阶段,其数据的基础积累、准备、算法的训练都需要投入大量的前期资源,这对任何企业来说都是一项巨大的投入,依靠既有开源来解决商业问题已经成为一种习惯,很少为其付费。因此,人工智能的商业化道路目前还比较远。4)通用人工智能/强人工智能还很远:从各个分析企业的角度来说,通用型人工智能、强人工智能的实现还需要很长时间。虽然AI应用能使一些任务变得自动化,但人类判断全部交由算法负责这种情况几乎不可能发生。更现实的方法是,使用数据科学和工程不断完善并提升人类的判断质量。当数据十分充足,依靠统计学的方法进行决策是恰当且合理的。当没有数据或拥有的数据十分有限时,采用群体智慧和其他心理学方法能够更好地进行决策。“智能”数据应用将把日程工作自动化,从而空出更多时间让人类专家专注于需要他们专业判断的工作,以及从事社会认知(socialperception)和共情等非认识能力的行动。比如:保险公司也可以使用深度学习系统将估算受损汽车的成本修理费用变得自动化,让人类保险雇员有更多时间完成更加复杂和需要更多经验的客服。但在可以预见的未来,人类仍将是“决策过程中的一部分”。五、AI对人类社会的影响从本质上来说,人工智能和大数据一样,是社会发展的赋能因素。人工智能改变了生产工具,提高生产效率,形成新的生产关系,主要起到以下几个作用:1)改变经济租:从数据的角度来说,数据是一种特殊的资源。人工智能需要利用这种资源来培养,就等于占用了数据的租,因此AI可以被看成是一种独特能力。所以,人工智能的“智能”程度,与该人工智能的经济租直接相关,也与该人工智能的价值相关。这让人工智能得以成为一种新的竞争力的来源:能够利用这种能力的企业能够获得竞争壁垒,获取超额价值。2)改变交易成本:从数据的角度来说,人工智能加快了数据传播的效率,极大的提炼了信息的内涵,降低了信息不对成,也减少了由于时间压缩不经济带来的巨额交易成本。这会极大的提高交易的频次,也会使整个市场竞争趋于激烈化,价值趋于量级分化——有人工智能的企业将以更低的交易成本获取更多的差价。因此,人工智能将对整个社会形成巨大而深远的影响:1)社会公平:人工智能首先从就业和资源分配上影响到社会公平的平衡。近日,麦肯锡(McKinsey)调查了美国800多种工作岗位的2000多种工作,表示:面对人工智能的挑战,相比于脑力劳动,体力劳动从业者面临的失业风险更大。而在体力劳动中,那些更依赖“可预测的体力劳动”的职业需要的自动化程度更高,也面临更大的失业风险。所谓“可预测的体力劳动”,就是诸如食品制造、焊接等流水线的工作活动,这些工作主要是重复操作,基本可以预测下一个动作要做什么。而“不可预测的体力劳动”,如建造、林业、畜牧业等,面临的失业风险更小。自动化的程度越高,被机器人取代的风险也就越高。而相比之下,包含脑力劳动的工作就难取代得多。通过调查与分析,麦肯锡得出了以下几个难以被机器人取代的工作:教育培训工作;医疗工作,特别是那些要求较高专业技能、直接接触病人的工作,比如牙医;知识性工作,包括管理工作。而一些原本难以获取资源接触教育的人可能会极大的面临被取代工作的风险。2)安全:形色的辅助诊断工具帮助人类健康跨入了一个新的发展阶段。然而人工智能也会对社区安全形成一定的风险隐患。在日前纽约公布的一项人脸识别计划能够将成千上万的人的图像和数据上传到一个庞大的数据库中为政府所用。然而,这其中也存在巨大的风险,无数无辜的人会被误认为是恐怖分子,尤其是技术识别更加不精确的有色人种。并且,人工智能的大规模使用对涉及到的严重隐私问题也形成了一大安全隐患。3)商业竞争:毋庸置疑,人工智能会极大的改变商业竞争的范式和架构。美国美林银行预测,2025年以前,人工智能的“每年产生的创造性破坏的影响”可能会达到14到33万亿美元,其中包括因人工智能实现了知识工作自动化,导致雇佣成本减少的9万亿美元,制造业和医疗护理开销减少的8万亿美元,以及部署无人驾驶汽车和无人机后因效率提升增加的两万亿美元。麦肯锡全球研究院(McKinseyGlobalInstitute)说,人工智能正在促进社会发生转变,这种转变比工业革命“发生的速度快10倍,规模大300倍,影响几乎大3000倍”。第二节无数据不AI一、数据与AI的关系从下图历史发展的轨迹上可以看出,每一次人工智能的增长,都因为大数据行业有着至关重要的推动,数据的量级的增长、计算能力的提升、存储的便捷化、数据的可分析程度提高,都在加快人工智能的发展。数据和人工智能之间有着千丝万缕的联系,是同生同涨的有机整体,可以说,大数据是人工智能发展的一个重要的竞争优势来源。图表SEQ图表\*ARABIC2:AI的三阶段发展与数据的关系数据来源:DTiiiAI研究中心人工智能和大数据一样,对社会经济起到赋能作用的程度。人工智能,主要是帮助人自动的感知,认知,分析和预测世界(感知-数据采集,认知-数据识别,分析-数据分析,预测),它在数据的基础上诞生,情境化的数据产生情境化的AI应用,需要海量、精准、高质量的训练数据。反过来,人工智能又能促进数据的发展,它本身又提高了数据的收集速度和数据的质量,尤其是非结构化数据的结构化处理,对数据数量与质量提出了更多的要求,推动大数据产业的发展。人工智能的三种主要技术,都需要专有类型的数据:机器学习需要大量的标签样本数据;模式识别偏重于信号、图像、语音、文字、指纹等非直观数据;人机交互则需要积累大量的用户数据。二、新的商业竞争范式随着人工智能的发展沿革,我们进入了一个新的竞争时代:智能数据时代。在新的竞争时代里,需要遵循新的竞争范式。智能数据,不同于传统的数据,就是添加了人工智能和人的智慧的数据,这个名词的出现,揭示了数据、人和机器三者之间的有机联系。这种有机联系赋予数据更多价值,赋予数据心智。现阶段的“数据”与以往的数据已经有很大不同。数据内容包含的信息量越来越大、维度越来越多,从图像、声音等富媒体数据,逐渐过渡到人的动作、姿态、行为轨迹,再加上地理位置、天气、社会群体行为等等,按照以往处理数据的思路已经难以适应“数据”本身发展的速度。一个融合人类智慧、人工智能以及海量非结构化数据的智能数据时代已经来临。这个时代最重要的三个要素是:数据、AI,人的智慧。除了前文说的人工智能和数据之间的有机联系之外,人的智慧在其中起到了关键的调节作用:人用智慧训练和监督AI,帮助AI更快更聪明的解决问题,少走弯路。例如,谷歌在语音识别领域取得了很大的突破,但这背后的原因是谷歌建立了几十亿音频的库,而且用人类的智慧标注它,所以可以用算法,用人工智能找到模式,甚至可以区别口音不同。图像也是同样的:过去几十年里,其实人类花了大量的时间去标注这些图像,我们才能在图像里面切割识别出各种各样的物体,没有这些人的智慧现在人工智能是达不到这样。因此我们可以将这三个因素之间的关系总结为下图:图表SEQ图表\*ARABIC3:智能数据时代人工智能、大数据与人的智慧的关系AlphaGo战胜人类被视为AI历史上的里程碑事件。大家看到AlphaGo战胜了李世石,但是不知道别后的故事。在这场比赛中,关键的获胜因素有两个:第一,要有足够的数据支撑。AI要模拟人,它首先要知道人在面对不同事情的时候是怎么去把握的,而这种判断和把握的能力就是出自于成千上万的海量数据得出的结果。第二,要有人类的智慧。Alphago在下棋的时候“聪明”得像一个人,大量的数据提供了它“思考”的来源。但AI不是由大数据一手决定的,还有人的经验和智慧;AI会发展成什么样子,打个园艺的比方来说:大数据是土壤和养分,AI是植物,而人就是园丁。土壤和养分让植物长得好,但也离不开人的修剪和培养。代表AlphaGo跟李世石坐下来对战的那个人本身就是六段的高手,他在训练AlphaGo时,后来我们也交流过,加入了大量的人工智慧,加入了大量的人为规则,让它少走弯路,这些都是被人忽略的。在目前的情况下更现实的还是要引入很多专家的智能,人的智慧,在数据科学以及数据工程不断完善的情况下,去提高AI的水平。这故事对我们厘清人与机器的关系有些启发。今天的机器,运算性能和效率绝非人脑可比。在做同样一道题时,即便是计算机使用笨办法来求和,速度也一定比我们人类使用高斯求和公式更快。然而,在没有人工干预的前提下,机器却缺乏发明出这种简洁又高效的算法的能力。因此,人的智慧是不会被人工智能替代的。因此,在这样一个智能数据时代,只有有机结合了这三者,并利用了三者各自的价值,才能在新的时代获取竞争优势。这样的新商业竞争范式可以用如下的公式来表示,我们称之智能数据时代的“贝叶斯法则“:这个贝叶斯法则的意思就是首先靠人的智慧,在没有那么多数据、统计池、大数据的情况下,先看人的智慧去确定一种方案,做一个决定,后续不断的通过吸收数据来调整我这个方案;数据量越大,最后越能得到一个接近现实的结果。人基于情境化数据去训练AI,能得到某一情境下非常有用,非常智能的一个人工智能程序。。在智能数据时代,企业的商业价值会和基于数据的人工智能的发展以及不断提高的基于数据人的智慧,呈正相关关系。总结来说,数据本没有意义,AI本没有智慧,是人,让其有了意义,有了智慧;无数据不AI,无人工不智能。数据为本,AI为核心,人为关键。第三节行业全景与企业玩家分类一、数据视角下的中国人工智能行业全景前文提到,由于人工智能的发展需要数据的训练,那么这些人工智能相关的技术如果按照数据处理和应用的生命周期来划分,可以归结成三大类人工智能技术:基础类人工智能技术、分析类人工智能技术、应用类人工智能技术。如果将这三类技术作为纵坐标,以行业垂直领域作为横坐标,可以将现在中国范围内的人工智能竞争领域划分成如下的一个行业结构图:图表SEQ图表\*ARABIC4:数据视角下人工智能行业布局示意图在这个行业布局中,人工智能企业在纵向上的发展是基于技术的发展来打通的,也可以说是技术供给驱动的;而横向上的发展是基于需求来进行驱动的。1)纵向分析:目前AI的应用涉及到相应专业化的数据采集,这就需要底层专用硬件的支持。而根据数据生命周期,在数据的生命历程的各个环节——收集、链接、准备,认知、分析,预测——都会有不同的企业进行分工。有些企业能够打通数据上周期的多个环节,形成端到端的交付能力。2)横向分析:AI最容易影响的领域往往是数据准备度高的行业,例如在人工智能发展上现行一步的金融、医疗等行业。在不同的行业上,人工智能的应用场景也不尽相同,以下将分行业来进行分析。a)医疗代表情境:辅助诊断;自动诊断;医疗机器人;健康预警系统;虚拟临床试验随着计算机视觉的不断发展,自动诊断将会在医疗的最底层得到广泛应用;个人医疗健康数据系统的建立,可以改变现在从病人口中描述病状的状态;大规模的病例和从移动可穿戴设备中采集的个人健康数据,在人工智能的分析下,可能改变分配给临床医师的认知任务,并可能从根本上改变医疗输送系统。医疗机器人的出现可以改变临床手术的顺序,一些简单的伤口缝合,冲洗伤口等工作可以由永远不知道疲惫的机器人替代;健康预警技术的成熟可以避免很多疾病的出现;老年人和术后病人的看护问题也将得到解决,个性化的情感机器人和按需定制的服务机器人会对健康护理,陪护等行业产生影响。更加智能的听力助手,视觉辅助设备,身体辅助设备,可以让在身体上有创伤的人得到更好的生活。虚拟临床试验系统的出现,可以极大提高临床医学的发展速度,让科学工作者从等待中解放出来。b)金融代表情境:智能投顾;风险监控智能的投资理财机器人,可能改变人们对理财的理解,金融市场由于信息不平等产生的风险,可能会在一定程度上面得到规避。有了大量数据输入的人工智能,可以对金融市场的走向进行较为准确的预测,并给出合理的建议。银行业大规模应用的智能客服,会让人们得到更好的理财服务;聊天机器人的普及,使得银行不再需要柜员。c)政府代表情境:智能交通系统;公共安全监管;社区升级;宏观经济监控和预测无人车的普及使得车辆的整体调度得以实现,交通线路选择,停车难,堵车等问题得到解决。更加宽广的路面监控系统和精准人体身份识别的结合,可以有效识别犯罪行为和可疑路人,让警察迅速抓捕罪犯,有效降低犯罪率。智能社区的出现,可以合理分配社区周边资源,规划社区设施配给,丰富社区居民的生活,提高生活幸福度。宏观经济的监控和预测也会逐渐成熟,政府对宏观经济的调控会依赖人工智能给出的建议。d)制造代表情境:智能流水线;无人厂房机器人的迅速发展使得传统制造业不再需要大量工人,智能流水线的出现让工人们从繁重、重复的体力劳动中解脱出来,智能调节厂房内的各项指标,分配资源,从而实现无人厂房。e)商业分析与决策代表情境:辅助决策系统;预测系统人工智能结合各个企业的自有数据和共享数据,可以做到分析行业发展状况,辅助老板决策企业的发展方向,预测并规避可能发生的各种风险。图表SEQ图表\*ARABIC5:各个行业不同情境下的代表企业二、中国企业玩家分类及各自的速赢策略在前文提到的在行业布局中,由于不同的人工智能企业在纵向上打通的程度不同,横向覆盖的行业范围也不同,总体上来说,我们可以将现有市场上的人工智能企业分为五种类型的玩家:1)硬件驱动者:这类企业的速赢关键因素是硬件集成性,计算能力;一体化能力。GPU的计算能力是毋庸置疑的,深度学习如果没有GPU的计算加速就不会发展的这么快。为了在市场上占有一席之地,各大硬件厂商争相推出适合机器学习硬件设备,在GPU芯片方面,Nvida很早就开始布局,推出了很多款不同配置的GPU芯片,占领低中高端市场,并专门为深度学习推出了GeForce1080P和TeslaK40和K80,尤其是GeForce1080P因为其极高的性价比,一经推出,一卡难求;Intel不甘人后,推出了适合深度学习的大规模参数服务器;Google有深度学习的一体机,并计划开放云端的计算资源;Amazon在AWS上面推出了拥有GPU资源的机器。2)入口占有者:也就是把握住数据供给和需求的端口的企业。这类企业的速赢关键因素是数据和需求的察觉和采集。每个行业都生产不同的类型的数据,但是数据类型单一,数据缺乏系统的治理,无法形成数据资产,在企业应用数据的过程中,不可避免的需要各种外部数据,就产生了数据需求。一些公司针对这种情况,着眼于对数据的治理,汇集,针对每一个行业的数据需求的理解和采集,构建数据市场,并且针对外部数据进行汇集,治理,分析,产生更具价值的数据,累积属于自己的数据资产。当这部分数据资产积累到一定程度,会形成数据壁垒,掌握上下游玩家的数据流向。3)算法服务提供者:指拥有巨量的算法并提供服务的企业。这类企业的速赢关键因素是算法的可复制性、可扩展性;算法开发的速度。由于开源社区的活跃,算法本身已经无法形成较高的竞争壁垒。很多开源算法包已经能够满足用户的需求,例如,如果在数据量很大的情况下,可以用TalkingData推出的大规模机器学习算法包,fregata;否则可以用python中的sklearn、java的weka等。在深度学习方面,开源的深度学习框架caffe,google推出的开源框架tensorflow,还有Torch,百度的Paddle等等,都能够很快搭建深度学习模型。但是开源的算法在某些场景下并不能很好的发挥作用,所以有些公司仍然提供更加专业的算法模型训练的服务,以帮助企业规避模型训练带来的风险和成本,比如Explosion,如果客户对模型结果不满意,就不收费;这类公司拥有专业的数学、工程方面的人才,通常对某些问题有自己的解决方案,在算法的优化,模型的训练上面积累了大量的经验,从而能够提供高效优质的服务。由于算法科学方面人才的紧缺,有些平台可以让算法科学家把自己研究的算法代码放上去,使用者按照调用次数付费。4)垂直领域玩家:垂直领域玩家指代在探索数据在行业的智能化应用的垂直行业的公司或服务于垂直行业的科技服务公司。这类企业的速赢关键因素是对于该垂直领域需求的深耕和闭环的运营。在探寻智能行业应用的过程中,通常以自身行业应用场景和需求为出发点,围绕新兴数据的生命全周期,快速构建“数据平台层、数据分析层、数据应用层”的智能化应用建设体系,挖掘出契合、提升自身传统业务体系效率或模式的数据智能化应用,实现行业产能的提升。以医疗科技公司Lifegraph开发的移动健康产品为例,智能可穿透设备为实时采集用户健康信息的数据提供了可能(基础层),其围绕医疗专家智库建立智能化情感与健康识别模型(分析层),实时医师与病患家属提供病患健康信息(应用层),保障病患异常信息被有效监测,从而降低病患事故。传感器技术的发展,为Lifegraph拓展了数据源的丰富度;通过与专业医疗机构合作伙伴的合作,快速定位移动医疗健康产业需求,并获取专家知识能力,开发垂直领域数据产品,形成行业竞争优势。其他垂直领域案例还包括:Tele-Lauguage的医疗智能代理语音治疗;Mapquest的智能交通规划;K-12的教育辅助机器人;蚂蚁金服的芝麻信用等等。5)生态领域玩家:生态领域玩家是指能够建立起跨行业、跨业态,贯穿数据生命周期的数据平台、分析平台以及应用平台的智能数据科技公司。这类公司通常具备极强的平台技术能力,通过平台向合作伙伴提供数据整合能力、数据分析的算法能力;并最终在平台上实现横向差异化、纵向专业一体化的数据应用服务能力。生态领域玩家快速建立行业壁垒,形成竞争优势的核心是:一是具备较强的数据平台与自有数据优势,支撑生态合作伙伴的数据整合,帮助生态上的合作伙伴的数据交换与整合,加速完整的数据视图的构建,实现各场景化数据的有效支撑;二是具备较强自有数据科学优势,与合作伙伴进行能力互补,依托合作伙伴垂直领域的专业性,快速构建行业智能数据分析能力,实现对多维度数据的钻取,加速从数据到数据价值挖掘的进程;三是具备较强的客户渠道优势或品牌优势,以合作伙伴为应用验证场景,加速垂直领域智能数据应用的形成,快速复制并输出。以Google为例,Google生态中的NianticLabs与任天堂的数据与技术合作推出了风靡全球的Pokemongo;百度生态中的百度联盟以平台为支撑,与广告生态商的数据合作,形成国内最大的网盟之一;苹果移动设备的功能生态与IBM达成合作,通过IBM的集客资源与大数据能力,打造更加垂直的商业应功能等等。第四节未来人工智能的发展趋势以及对策一、中国人工智能行业发展趋势要分析中国人工智能行业的发展趋势,可以从背后数据的流通发展趋势来看。从数据流通的角度,我们可以将行业价值链分为以下的四个环节:1)供给环节:也就是采集数据的环节,是让人工智能所使用的数据进入到流通环节的入口。现阶段数据的供给主要有三种:方式一,自筹数据,即从零开始,投入大量人力采集数据;方式二,公共数据,例如美国、英国、加拿大、新西兰,以及我国的香港、上海、北京、武汉、无锡、佛山和南海等城市都有自己的线上数据平台;方式三,产业数据协同,即下游创业公司或行业公司和产业链上游的数据或平台型公司建立合作,连接对双方均有利的产品或数据。但是由于非结构化数据的识别需要大量投入人工智能的研发,因此少数的、高价值的情境化数据最后会集中在少数有能力的企业手中。2)流通环节:也就是数据的交易、整合的环节。虽然数据交易在中国还处于初级阶段,但是由于人工智能对于数据多源化的依赖,数据交易机制的形成成为一个必然的趋势。3)分析环节:也就是人工智能利用数据进行建模,迭代算法的环节。4)需求环节:也就是将现实中的需求转化为人工智能需要解决的目标问题集,并概念化成一套亟待解决的方案的环节。图表SEQ图表\*ARABIC6:人工智能行业价值微笑曲线从数据流通的角度来说,人工智能行业价值链也会存在一个微笑曲线:数据交易市场的完善与分析算法的趋同使这两个环节的附加价值不断降低;而数据的供给测与最后的解决方案则会成为附加价值最高处。因此,占据特别的数据来源,将别人无法结构化的数据进行结构化转化,或者发现适合人工智能解决的实际需求,成为价值最高的环节。由于这样微笑曲线的存在,未来中国人工智能行业的发展会呈“两化“趋势——生态化和开源化。1)生态化:为了满足人工智能对数据多源的需求,人工智能公司会倾向于在数据供给和需求两方形成壁垒并打通端到端全价值链,形成生态是必然趋势;中小企业将存活于交易和算法两个环节,依附于大公司的生态。最后会以数据的流通、算法的不断迭代提升为基础,形成端到端的闭环生态。2)开源化:为了满足人工智能向通用人工智能/强人工智能发展的发展对数据多源性、交叉性提出要求,数据生态的开放性将进入一个新的阶段——大规模开源阶段。许多顶尖的技术和算法确实都是免费提供的,并且很容

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论