一、从世界巨头寻找发展的足迹
1、GPU的作用与分类
GPU(graphicsprocessingunit,图形处理器)又被称为显示芯片,多用于个人电脑、工作站、游戏主机以及移动设备(智能手机、平板电脑、VR设备)上专门运行绘图运算的微处理器。
结构决定GPU更适合并行计算,GPU与CPU主要区别在于片内的缓存体系和数字逻辑运算单元的结构差异:GPU核(尤其ALU运算单元)的数量远超CPU但是结构较CPU简单,因此被称为众核结构。众核结构非常适合把同样的指令流并行发送到众核上,采用不同的输入数据执行,从而完成图形处理中的海量简单操作,如对每一个顶点进行同样的坐标变换,对每一个顶点按照同样的光照模型计算颜色值。GPU利用自身处理海量数据的优势,通过提高总的数据吞吐量(Throughput)来弥补执行时间(Latency)长的缺点。
一般而言,消费者在选购消费电子产品的时候,例如在选购移动电话或者笔记本时,会更加关注CPU(CentralProcessingUnit,中央处理器)的性能,例如CPU的品牌、系列、核心数量等等,而GPU受到的关注就相对较少。GPU(GraphicProcessingUnit),及图形处理器,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。在PC诞生之初,并存在GPU的念,所有的图形计算都由CPU进行计算。然而,使用CPU做图形计算速度较慢,于是就设计了专门的图形加速卡用以帮助处理图形计算。再后来,NVIDIA提出了GPU的概念,将GPU提升带了一个单独的计算单元的地位。
CPU一般由逻辑运算单元、控制单元和存储单元组成。CPU虽然有多核,但总数没有超过两位数,每个核都有足够大的缓存;CPU有足够多的数字和逻辑运算单元,并辅助有很多加速分支判断甚至更复杂的逻辑判断的硬件。因此,CPU拥有超强的逻辑能力。GPU的优势在于多核,核数远超CPU,可以达到数百个,每个核拥有的缓存相对较小,数字逻辑运算单元少且简单。因此,GPU相对于CPU更适用于处理数据并行计算问题
CPU与GPU的区别
- | CPU | GPU |
设计目标 | 侧重于程序执行的效率 | 重在对大量趋同计算的并行处理 |
运行复杂程度高,需要处理各种不同的数据行,同时逻辑判断有需要处理大量分支跳转和中断 | 运行复杂度低,面对的是不被打断的计算环境,处理类型统一的、无相关性的大规模数据 | |
内部架构 | 大部分晶体管用于控制,缓存的等的设计,负责算数逻辑的处理单元不多 | 大部分的警惕管用于算数逻辑处理单元 |
逻辑核心复杂 | 逻辑核心简单 | |
适用任务 | 适合运行具有分支密集型,不规则数据结构、逻辑更加灵活复杂等特点的串行程序。 | 合适处理计算密集型、数据耦合度低、高度并行化的计算任务 |
数据来源:公开资料整理
GPU具有两种分类方式,一种根据与CPU的关系,另一种是根据GPU所在的应用端类别。根据与CPU的关系,GPU可以分为独立CPU和GPU。独立GPU一般焊接在显卡的电路板上,位置在显卡的风扇下面。独立GPU使用的是专用的显示存储器,显存带宽决定了和GPU的连接速度。集成GPU一般与CPU集成在一起。集成GPU与CPU共有一个风扇和缓存。集成GPU由于设计制作、驱动程序都由CPU厂家完成,因此兼容性较好;此外,由于CPU与GPU实现了集成,因此,集成GPU的占用空间小;实现GPU与CPU的适配与兼容,集成GPU的性能相对独立GPU较弱,因此功耗和成本相对独立GPU较低。独立GPU由于拥有独立的显存,更大的空间和更好的散热,因此在性能上面独立显卡更好;但需要额外的空间,能够满足复杂庞大的图形处理需求,并提供高效的视频编码应用。然而,强劲的性能意味着更高的耗能,独立GPU需要额外的供电,并且成本也更高。
集成显卡与独立显卡的区别
区别 | 集成显卡 | 独立显卡 |
与CPU的关系 | 集成在CPU里面的图像处理单位,构成CPU的一部分 | 单独插在主板上的图像处理单位,其接口是PCIE接口,是一个单独的电脑组件 |
价格 | 低 | 高 |
兼容性 | 较好 | 较差 |
性能 | 较差 | 较好 |
升级成本 | 低 | 高 |
功耗 | 低 | 高 |
是否占用电脑内存 | 是 | 否 |
主要生产商与产品 | Intel(HD系列)、AMD(APU系列) | AMD(Radeon系列),NVIDIA(GeForce系列) |
主要应用领域 | 移动计算市场,如笔记本和智能手机 | 高性能游戏电脑,VR/AR,人工智能 |
数据来源:公开资料整理
根据应用终端类别,可以分为PCGPU,服务器GPU,移动GPU。PCGPU应用于PC端。根据其所在产品定位既可以使用集成GPU,也可以使用独立GPU。例如,若PC以轻办公,文字编纂为主,一般产品会选择搭载集成GPU;若PC需要制作高清图片,编辑视频,渲染游戏等,则选择的产品搭载独立GPU。服务器GPU应用于服务器,可做专业可视化、计算加速、深度学习等应用,根据云计算、人工智能等一系列技术的发展,服务器GPU将会以独立GPU为主。移动端轻薄化已经成为趋势,终端内部净空间由于多种功能模组的增加已经快速下降;同时就目前移动端需要处理的视频和图像而言,集成GPU已经能够满足。所以移动GPU一般采用集成GPU。
GPU按终端类别分类
数据来源:公开资料整理
2、GPU市场:寡头竞争时代已经来临
PCGPU市场,Intel优势明显。智研咨询发布的《2020-2026年中国GPU行业市场竞争格局及行业发展前景预测报告》显示:全球2019年第四季度PC领域GPU出货量,Intel是全球最大的处理器供应商。目前主流的处理器架构是X86,主要的供应商是Intel,AMD,VIA。截至2019年第四季度,消费级x86CPU市场中,包括桌面品台,移动端平台(笔记本和平台LOT物联网)中,Intel占据了84.4%的市场份额,AMD占据了15.5%的市场份额。Intel凭借在CPU出货量上的优势,通过销售集成GPU,实现了在GPU市场的霸主地位。Intel以63%的市场份额排名第一,对比2019年第三季度环比下滑了2个百分点;AMD作为全球第二大的X86架构处理器供应商,既受益于CPU出货带动的集成GPU出货量,也受益于自身优秀的独立GPU的出货。
AMD以19%的市场份额排名二,环比上升3个百分点;NVIDIA是全球领先的独立GPU供应商,同时结合ARM架构处理器,出货集成GPU,市场份额为18%,环比下降了1个百分点。
全球PCGPU市场份额
数据来源:公开资料整理
Intel与AMD处理器出货量之间的对比
数据来源:公开资料整理
独立GPU领域,AMD奋起直追。截至2019年第四季度,在独立GPU域中,NVIDIA以68.92%的市场份额占据较大的优势。AMD方面,AMD得益于在2018Q4所推出RX5500及RX5600系列,以及RX5700系列的放量,多方因素共同促使AMD显卡份额大涨,从2018年18.77%上升至31.08%。AMD推出的Radeon系列部分型号采用7nm工艺,并且在与NVIDIA的产品对比中(RTX2070对标RX5700,RTX2070S对标5700XT),同系列AMD性能略强,价格更低,重点是功耗一样。更强的性能,更低的功耗,AMD的产品无疑对NVIDIA的市场份额造成了挑战。
全球独显的市场份额
数据来源:公开资料整理
NVIDIA与AMD产品性能对比
数据来源:公开资料整理
整机功耗测试(单位:瓦)
数据来源:公开资料整理
五雄争霸,手机厂商不甘寂寞。在移动GPU领域,主要以Imagination、ARM、Qualcomm、Vivante、NVIDIA为主。高通目前是Android阵营最大的处理器供应商。移动端主要使用集成GPU,因此,高通GPU因其处理器的市场优势也有所受益。ARMMailGPU的主要使用者是华为和三星。ARMMail的GPU性能相对较弱,因此华为在2018年通过推出GPUTurbo软硬件优化弥补短板。三星方面已经与AMD前敌多年的IP授权,AMD将向三星授权最新的7nmRDNA架构Radeon显卡IP,并且尝试自研GPU。苹果在与Imagination取消合作两年后,再次选择与Imagination合作,并给予支付授权费。虽然目前手机巨头都是采取购买GPU厂商IP的方式,但是目前三星、苹果、华为等有相关计划进行GPU自研项目。手机已经进入同质化时代,手机之间的差异性已经成为手机厂商竞争优势的关键。公版GPU难以使手机厂商产生本质的差异性。因此,手机需要通过自研GPU以及CPU实现手机性能的差异化,从而获得市场的竞争优势。
全球移动GPU主要供应商
厂商 | GPU核心 | 授权商 |
Imagination | PowerVR系系列列,SGX | Intel、联发科、LG、高通、瑞萨、三星、海思 |
ARM | Mail系列 | 三星、海思、瑞芯微、展讯、意法半导体、全志 |
Qualcomm | Adreno系列 | 自用、不对外授权 |
Vivante | GC系列 | 飞思卡尔、军政、Marvell |
NVIDIA | Geforce系列、Tegra | 开普勒架构已对外授权 |
数据来源:公开资料整理
二、中国GPU服务器
1、中国GPU服务器市场发展规模
2018年下半年中国GPU服务器市场规模为7.8亿美金(约合人民币53.8亿元),同比增长107.3%。 2018年全年中国GPU服务器市场规模为13.05亿美金(约合人民币90.05亿元),同比增长131.2%。IDC预测,到2023年中国GPU服务器市场规模将达到43.2亿美金(约合人民币298亿元),未来5年整体市场年复合增长率(CAGR)为27.1%。
2018-2023年中四GPU服务器市场规模同比增长走势预测
数据来源:公开资料整理
2018年中国GPU服务器市场量价齐升,出货量和销售额均实现快速增长。
从行业来看,互联网为主要采购行业,占据60%以上的市场份额,是拉动市场增长的主要行业;政府的采购量也有所上升,超过了10%的市场份额;
从产品来看,4卡及以上GPU服务器占据了8成以上的市场份额,其中4卡、8卡、16卡均占有20%以上的市场份额;
从厂商来看,浪潮、华为和曙光在出货量和销售额方面均位列市场前三;
从市场趋势来看,AI服务器和边缘计算服务器等面向特定工作负载的细分服务器市场迎来爆发,各大厂商加速布局该领域并推出新产品,2019年这些细分市场仍将是市场的热点。
2018年中国GPU服务器厂商市场份额情况
数据来源:公开资料整理
“计算和数据是人工智能不可缺少的组成部分。2018年,人工智能的发展引领中国GPU服务器市场的高速增长;训练依然是GPU服务器的主要工作负载,未来几年推理工作负载的服务器也会逐渐上升;在深度学习的不断推动下人工智能取得重要突破;到目前为止,除了专业人工智能公司以外,许多大型公司也同时开始涉足深度学习,并应用在广泛的商业实践中。2018年以前,互联网是GPU服务器的主要采购行业,如今,许多传统行业对GPU服务器也慢慢有所需求,尝试将人工智能技术与自己的行业相结合。由此看来,GPU服务器市场规模还有很大上升空间。
2、GPU将在数据中心长足发展
GPU在A.I数据中心领域对A.I专用芯片的技术突袭防御性较强。相比于由图形处理器演进而来的GPU,当前许多公司基于FPGA、ASIC从事A.I专用芯片研发,以挑战GPU在A.I领域的霸主地位, GPU在A.I数据中心领域对A.I专用芯片的防御性较强。GPU的性能特点与A.I数据中心对处理器的需求非常契合,并且在长时间的发展中已经形成了完整的生态,相比较而言,无论是FPGA、还是ASIC路线A.I专用芯片,都尚处于发展阶段,而要成功打造一款通用芯片,时间的积淀非常重要。
GPU具有较为完整的技术生态。高运算性能硬件、驱动支撑、API接口、通用计算引擎/算法库、较为成熟的开发环境都为应用GPU的深度学习开发者提供了足够友好、易用的工具环境。开发者可以迅速获取到深度学习加速算力,降低了深度学习模型从研发到训练加速的整体开发周期。
驱动程序,独立显卡厂商不仅提供高性能硬件,也一直提供配套驱动来支持其GPU调用计算资源。早期图形处理、游戏业务的优势地位使得英伟达一直在GPU驱动下了不少功夫,公司总部大多数员工都是从事驱动程序的研发工作。从图形接口API来看,不同的独立显卡厂商提供不同的图形标准API,而不同的API接口适应于不同的计算系统,如OpenGL标准支持Unix系统的服务器计算平台,Direct3D支持windows系统的PC。英伟达推出的CUDA(ComputeUnifiedDeviceArchitecture)通用并行计算平台,是为利用GPU并行运算能力开发的计算平台。可以让开发人员用C语言编写的程序在其处理器上高速运行,大大提升了通用GPU的易用性。
算法库,CUDA包括了大量的GPU加速库和基于C语言的编程工具,开发者可以在熟悉的编程环境下便捷地调用加速库。CUDA提供的算法库可以让应用程序像调用库函数一样简单实现一些深度学习算法。CUDA开发人员的数量在5年里增长了14倍,超过60万人,CUDASDK的下载量达到180万。众多CUDA开发人员对于维持英伟达GPU客户黏性非常重要。
GPU完整的技术生态,吸引了大量A.I企业采用GPU进行人工智能加速,建立了良好的行业生态。英伟达与科研机构开展合作项目,深入了解科研领域需要的运算问题,为其提供专业的超级计算加速解决方案。英伟达与不同应用领域的企业合作,如医疗、金融、天气等,开发面向不同领域的加速产品。截止2016年底,与英伟达合作开发深度学习项目的公司已经达到了19,439家。除了传统的互联网巨头公司以外,还有很多创业公司,用于图像识别、语音识别、自然语言处理、计算机视觉、搜索引擎、医学成像、机器人、数据挖掘等应用加速。
GPU浮点运算能力
数据来源:公开资料整理
GPU的高运算性能使其迅速占领A.I数据中心市场,完备的生态环境可帮助其维持霸主地位。从上图可以看出,GPU的浮点运算能力一直保持着直线上升。英伟达在2017年GPU技术大会上发布的全新一代人工智能GPU芯片—TeslaV100能够达到15Tflops的单精度浮点性能,7.5Tflops的双精度浮点性能,可以满足当前A.I深度学习的运算能力。GPU持续提升的运算能力是其维持在A.I数据中心这一运算密集型应用场景中霸主地位的根本,而面对众多新兴A.I芯片的挑战,GPU已经建立起的完备的生态环境可帮助其提高防御能力。
GPU的生态环境有利于其将在训练学习领域(A.I数据中心)建立的优势延续至推理应用领域(前端电子产品)。当前GPU已经占据了A.I数据中心市场,学习阶段处理器需求已经被GPU占领。未来随着A.I行业应用的逐渐落地,推理阶段处理器需求将持续放量。从学习到推理阶段,算法部署的平滑、便捷性是需要考虑的重要问题。如果从数据中心、云端到前端应用,整个产品线都采用英伟达的CUDA计算平台,可以极大地减少算法跨平台的难度,实现平滑过渡,省去了变更运行环境所需的协同工作。
相比较而言,无论是FPGA、还是ASIC,都尚处于发展阶段。目前有一些公司基于FPGA技术路线或ASIC技术路线开发的A.I专用芯片,是为满足自身的需求而进行的个性化开发。典型的就是谷歌的TPU,公司并没有计划将其做成一款通用芯片推向市场。有些公司也在基于FPGA或ASIC开发通用的A.I专用芯片,但是都未达到GPU的成熟程度。一款芯片要做的具有通用性,性能稳定优异,需要较长时间的应用、优化、验证。但是不可否认的是,长期来看,GPU能耗高、价格贵等问题也给A.I专用芯片留下了机会。
A.I数据中心需求增加。当前深度学习对海量数据的处理需求,需要专业的A.I数据中心来支撑。随着A.I的纵深发展,未来A.I数据中心的数据、流量和处理能力也将随之提升,对专业数据中心需求将会增多。具体表现为:当前许多从事A.I研发的互联网巨头,像亚马逊、百度、腾讯等,都已部署自己的数据中心,并尝试承载A.I业务,许多A.I潜在应用行业客户尚未部署自己的A.I数据中心。随着A.I行业应用继续深入发展,A.I数据中心的数量和规模将会持续增加。预测到2020年超大规模数据中心将占全部数据中心服务器安装量的47%,达到485个。预计专业的A.I数据中心增长趋势与之相同,未来几年A.I数据中心也呈现直线上升。
超大规模数据中心数量走势预测(个)
数据来源:公开资料整理
GPU的A.I数据中心市场将继续保持高速增长。2015-2017财年(2017财年时间为:2016年2月1日-2017年1月31日,其他时间依次类推),英伟达数据中心业务收入达到了:3.17、3.39和8.3亿美元。说明CPU+GPU异构系统已经广泛部署,GPU在数据中心发挥的强大作用已经被广泛认可。当前英伟达GPU在数据中心渗透率还不到1%,市场成长空间仍然很大。
目前,A.I数据中心(A.I数据中心只是GPU的全部数据中心市场的一部分,GPU应用于数据中心也有可能进行A.I以外的超级计算)尚处于早期发展阶段,主要是互联网巨头在A.I深度学习研发阶段部署的A.I数据中心,随着A.I纵深发展,A.I数据中心需求会继续保持高速增长,GPU在数据中心的市场规模会进一步爆发。IDC和Bernstein的研究报告对未来A.I数据中心GPU的市场规模进行了较为保守的估算和预测。2016年A.I数据中心GPU的市场规模达4.71亿美元,预计到2020年A.I数据中心的GPU市场规模会达到近40亿美元,继续保持高速增长。
AI数据中心GPU市场规模
- | 2016A | 2017 | 2018E | 2019E | 2020E |
训练阶段 | 471 | 892 | 1551 | 2446 | 3593 |
增长率 | 90.02% | 73.30% | 57.70% | 46.80% | 90.02% |
推理阶段 | 0 | 57 | 143 | 259 | 404 |
增长率 | - | - | 150.88% | 81.12% | 55.98% |
总规模 | 471 | 952 | 1694 | 2705 | 3997 |
增长率 | - | 101.12% | 77.94% | 59.68% | 47.76% |
数据来源:公开资料整理
三、捕捉GPU应用的三大方向之一
(一)、追求极致的娱乐与性能平衡
1、全球游戏市场稳步发展
移动端占据主要市场,PC端游戏市场规模继续扩大。近年来,随着移动终端与PC终端的普及率不断提升,游戏开发商提供各类吸引玩家的游戏,游戏市场出现了蓬勃发展。数据显示,2019年,全球游戏市场预计将产生1521亿美元的收入,年同比增长9.6%;并且预计全球游戏市场从2018年到2022年会维持稳定增长,年复合增长率达到9%,到2020年全球游戏市场收入达到1960亿美元。2019年,在各类游戏中,移动游戏(智能手机及平板电脑)是最大的细分市,产生685亿美元的市场收入,占据全球游戏市场规模的45%。由于越来越多玩家转向了移动端,网页游戏的市场收入同比下滑15.1%,但是PC游戏收入规模同比增长4%。因此,PC端游戏市场整体规模维持上升态势。
2018-2022年全球游戏市场各细分市场收入预测
数据来源:公开资料整理
2019年全球游戏市场设备及细分市场年同比
数据来源:公开资料整理
2、游戏发展,电竞市场功不可没
电竞圈人气快速攀升。游戏市场的蓬勃发展离不开电竞市场的贡献。暴雪集团推出了《魔兽争霸》、《星际争霸》、《Dota》等一系列经典爆款游戏,玩家人数不断上升。为提升游戏的知名度,吸引更多的玩家,游戏圈举办了相关的电子竞技比赛。随着游戏行业的不断发展,游戏行业已经产生多款适用于电子竞技的热门产品,端游方面有Dota2、英雄联盟、风暴英雄等;手游方面有王者荣耀、绝地求生等。热门游戏的推出加上相关的赛事的宣传,全球电竞圈人气愈发旺盛。2018年,全球电竞观众人数为3.95亿,其中电竞爱好者人数为1.763亿;预计2023年,全球电竞观众人数达到6.46亿,同比增长10.4%。
全球电竞观众人数
数据来源:公开资料整理
中国是全球电子竞技产业重点区域。2018年,全球电子竞技收入规模为7.76亿美元;2019年,全球电子竞技总收入为9.50亿美元,同比增长22.4%,实现快速增长。当前,电子竞技产业已经在全球多个地区开展,以英雄联盟为例,中国赛区为LPL赛区,北美赛区为LCS赛区,韩国为LCK赛区等,还有部分外卡队伍所在区域。2018年,北美地区的电子竞技收入在全球电子竞技行业所有地区的收入中,排名第一,为38.1%;西欧赛区为18.7%,排名第二;中国赛区排名第三,为18.10%。
全球电竞收入规模
数据来源:公开资料整理
2018年全球电子竞技行业主要地区收入占比统计
数据来源:公开资料整理
中国赛区具备良好的电竞市场土壤,市场规模巨大。中国电竞用户分布更为分散。数据显示,中国有48.1%的电竞用户是在24岁以下的学龄段用户,更有高达28.1%的30岁以上用户。广泛的年龄段分布意味着中国电竞市场受众人数较多,基础良好,具备顺延性。第二,中国的电竞用户有下沉趋势。从区域的角度来看,三线及以下城市电竞用户占比达到51.5%,下沉趋势明显。第三,中国有优秀的电竞产业链,内容授权方面有腾讯游戏、完美世界等;赛事内容有LPL、KPL;电竞战队有LGD、RNG、IG等;赛事承办方有阿里体育,联盟电竞等等;还有内容传播商斗鱼、虎牙直播、企鹅电竞等。广大的电竞全体、电竞用户群不断下城,叠加完善的电竞产业链造就了中国电竞市场的快速发展。2016年,中国电竞产业为532.2亿元,2017年为772.8亿元,2018年已经达到912.6亿元,年复合增长率为30.9%。预计2019年中国电竞产业规模为1150.6亿元,到2024达到2720亿元,年复合增长率为18.79%,有望维持快速增长。
2016-2019H1中国电子竞技产业市场规模
数据来源:公开资料整理
2019-2024年中国电子竞技产业规模预测
数据来源:公开资料整理
中国电竞市场的快速发展离不开电竞用户规模的快速增长。数据显示,2017年中国电竞用户为1.3亿人,全球为3.4亿人,中国电竞市场用户在全球中占比为38.24%。2018年,中国电竞用户已经达到2.1亿人,同比上升61.54%,占全球电竞用户超过50%。MOB研究院预测,2022年中国电竞用户人数快速增长,将达到4.3亿人,年复合增长(从2012年开始计算)为35.91%,占全球电竞用户数53.75%。
电竞市场用户规模
数据来源:公开资料整理
2018/2019主要笔记本类别关注度对比
数据来源:公开资料整理
(二)、人工智能与深度学习
1、未来经济社会发展的助推器——人工智能
人工智能影响深远,三大因素驱动发展。当前,人工智能已进入新一轮爆发期,主要驱动因素来自三个方面:一是互联网发展提供了海量大数据资源,大大提升了算法有效性;二是计算机变革降低了硬件成本,缩短了运算时间,推动人工智能再次崛起;三是基础算法和AI平台自身创新加速,克服了传统算法和人类手工总结不完备的缺点,实现算法有效性大幅提升。人工智能快速发展,人工智能已经成为新一轮科技革命和产业变革的核心驱动力,正在对世界经济、经济进步和人类生活产生极其深刻的影响。据预测,人工智能将为全球贡献13万亿美元增量GDP,在2018年的基础上增长15%,平均每年给GDP贡献1.2个百分点的增长,对经济社会具有巨大贡献潜力,并可能从根本上改变人类社会的生产方式。
人工智能前景广阔,是经济社会发展的一大助推器,吸引世界主要国家争相布局。近年来,美国、中国、日本、英国、法国、韩国、欧盟委员会都发布了促进AI研究、开发和应用的战略,积极在人工智能领域进行卡位:美国于2011年推出《国家机器人计划》,推出2.0版机器人路线图并大力发展协作机器人;2013年公布《推进创新神经技术脑研究计划》,计划在未来12年投入45亿美元,用于探索人类大脑工作机制;日本于2015年1月公布《机器人新战略》,计划到2020年,通过包括政府制度改革在内的多种政策,扩大机器人开发投资,推进千亿日元规模机器人的扶持项目;欧盟的人脑计划则于2013年入选了欧盟的未来旗舰技术项目,15个欧洲国家参与其中,预期将获得欧盟10亿欧元的资金支持。
我国:三步走战略积极推动AI发展。于2016年8月发布《“十三五”国家科技创新规划》,明确将人工智能作为发展新一代信息技术的主要方向;2017年7月,国务院颁布《新一代人工智能发展规划》,制定了三步走的战略目标:①在2020年人工智能总体技术和应用于世界先进水平同步,人工智能产业成为新的重要经济增长点;②到2025年,人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,AI成为带动我国产业升级和经济转型的主要动力;③到2030年,我国人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。
世界主要国家和地区近年AI战略及规划
国家 | 时间 | 政策及规划 | 推动机构 |
美国 | 2016年11月 | 《为人工智能的未来做准备》 | 国家科学技术委员会、白宫科技政策办公室、国家预算办公室、人工智能特别委员会 |
《国家人工智能研究与发展战略计划》 | |||
《人工智能、自动化及经济报告》 | |||
2018年5 | 月白宫人工智能峰会 | ||
中国 | 2015年5月 | 《中国制造2025》 | 国务院、科技部、工信部等 |
2016年8月 | 《“十三五”国家科技创新规划》 | ||
2017年7月 | 《新一代人工智能发展规划》 | ||
日本 | 2015年1月 | 《机器人新战略》 | 人工智能技术战略会议等 |
2017年3月 | 《人工智能技术战略》 | ||
印度 | 2018年6月 | 《国家人工智能战略》 | 中央部门成立人工智能小组 |
欧盟 | 2018年4月 | 《欧盟人工智能》 | 欧盟委员会等 |
德国 | 2018年7月 | 《联邦政府人工智能战略要点》 | 德国教育研究部、德国工程研究院 |
英国 | 2017年10月 | 《在英国发展人工智能》 | 英国政府 |
2018年启动 | 《人工智能行业新政》 | ||
韩国 | 2018年5月 | 《人工智能发展战略》 | 科技信息通信部 |
数据来源:公开资料整理
全球人工智能市场将在未来几年经历现象级的增长。德勤预测,未来2025年世界人工智能市场将超过6万亿美元,2017-2025年复合增长率达30%。我国2017年人工智能产业规模为206.9亿元,2018年将达到339.0亿元,同比增长63.85%;到2020年人工智能带动规模将达到710.0亿元,2017-2020年复合增速为48.37%。
全球人工智能市场规模
数据来源:公开资料整理
我国人工智能产业规模快速增长
数据来源:公开资料整理
2、GPU是人工智能的重要组成部分
人工智能是实现数字化和智能化社会必不可少的条件。人工智能的三大要素:数据、算力、算法。数据是人工智能算法的原材料。人工智能需要对大数据的处理与分析,挖掘出数据背后的信息与规律。算力是对大数据进行处理的能力。算法是计算机通过对数据的处理获得的数据模型。深度学习的本质是通过对大数据的处理并建立的算法模型,可以实现各行业的AI应用,算法将数据和算力连到一起,共同针对不同细分场景,提供效率优化方案。
人工智能运行过程中有两部分:训练与推理。“训练”可以看作算法产生的过程。具体而言就是,在现有数据基础上,经过大量计算,确定模型参数,即建立算法模型的过程。“推理”可以看作将算法应用的过程,即在已建立的算法模型基础上,将新数据通过算法模型处理,得出结果的过程
深度学习模型的训练与推理
数据来源:公开资料整理
“训练”阶段GPU具备明显优势。虽然CPU的功能模块较多,但是大部分晶体管主要用于构建控制电路和高速缓冲存储器,只有少部分的晶体管可以组成各类专用电路。CPU的优点在于调度、管理、协调能力强,计算能力不是重点。因此,从运算性能和效率看,CPU不是计算芯片的最佳选择。深度学习算法需要处理海量数据,需要进行大量的简单运算,因此,深度学习对并行计算计算能力有较高的要求。在这一方面,GPU拥有较强的优势,尤其是在训练过程中。首先,GPU提供了多个并行计算的基础结构,并且核心数较多,可以执行海量数据的并行计算;第二,GPU拥有更高的访存速度;第三,GPU拥有更高的浮点运算能力。因为人工智能时代需要大量的多媒体与3D图形,所以更高的浮点计算能力意味着对图形与媒体的快速处理。
“推理”阶段GPU是其中一种选择。训练与推理阶段对运算的要求有所不同,训练阶段需要大量繁复的运算,并且为了让人工智能模型获得更佳的参数调整数据,运算的精准细腻度较高,而推理阶段则相反,模型已经训练完成,不再需要庞大运算量,且为了尽快获得推理结果,允许以较低的精度运算。因此,在推理过程中,芯片有多种选择,主要用CPU、GPU、FPGA、ASIC四种芯片。CPU:适合进行逻辑控制、串行计算等通用计算;GPU并行计算能力强,但是无法单独工作,必须由CPU进行控制调用才能工作;FPGA适用于多指令,单数据流的分析,因此常用于预测阶段,如云端。但是FPGA在实现复杂算法方面有一定的难度,运算量相对GPU小,量产成本高;ASIC专用性强,但是开发周期较长,开发环境需要底层硬件编程,开发难度极高。
3、GPU在深度学习领域空间广阔
芯片是人工智能领域不可或缺的成分。随着AI使用的广泛使用,带动AI芯片常常的蓬勃发展。数据显示,2019年-2021年,中国AI芯片市场规模为124亿元\193.7亿元\305.7亿元,分别同比增长53.6%\56.21%\57.82%,年复合增长率为57.01%。
其中云端芯片市场份额最大,接近50%,市场规模从2019年的61.4亿元增长至2020年139.4亿元。
GPU、FPGA和ASIC的优缺点对比
- | GPU | FPGA | ASIC |
一次性成本 | 高 | 极低(接近于0) | 高 |
量产成本 | 高 | 高 | 低 |
延迟 | 高 | 低 | 低 |
开发周期 | 很短 | 短 | 长 |
市场风险 | 低 | 低 | 高 |
开发环境 | 开发工具丰富,生态系统完善,容易上手 | 设置FPGA需要硬件知识,编程和配置门槛非常高 | 需要底层硬件编程,开发难度极高 |
数据来源:公开资料整理
芯片是人工智能领域不可或缺的成分。随着AI使用的广泛使用,带动AI芯片常常的蓬勃发展。数据显示,2019年-2021年,中国AI芯片市场规模为124亿元\193.7亿元\305.7亿元,分别同比增长53.6%\56.21%\57.82%,年复合增长率为57.01%。
其中云端芯片市场份额最大,接近50%,市场规模从2019年的61.4亿元增长至2020年139.4亿元
中国人工智能芯片市场规模
数据来源:公开资料整理
各类市场智能芯片产品结构
数据来源:公开资料整理
GPU提供了多个并行计算的基础结构,并且核心数较多,可以进行海量数据的并行计算;拥有更高的访存速度;第三,GPU拥有更高的浮点运算能力。因此,GPU是AI“训练”阶段较为适合的芯片。GPU在AI时代的云端训练芯片中占据较大的份额,达到64.%。虽然后期由于FPGA以及ASIC技术的突破,GPU的市场份额有所下降,但是仍然是云端训练市场份额最大的芯片,2019年-2021年年复合增长率达到40%。
2019-2021年中国云端训练芯片市场规模
数据来源:公开资料整理
2019-2021年中国云端训练芯片产品结构
数据来源:公开资料整理
从目前的技术看,FPGA由于量产成本高,并且设置需要FPGA硬件姿势,编程和配置较高;ASIC由于开发周期较长,开发难度,GPU在云端推理阶段仍然是较为合适的芯片,但是有GPU也存在功耗高,量产成本高等问题,所以GPU在云端推理阶段的市场份额并没有明天优势,约为41.84%,年复合增长率为56.5%。
2019-2021年中国云端推断芯片市场规模
数据来源:公开资料整理
2019-2021年中国云端推断芯片产品结构
数据来源:公开资料整理
随着人工智能应用的推进,人工智能生态不断完善,在终端设备上将会出现越来越多的越来越多的AI应用,对推断计算的需求会越来越多,终端推断芯片的需求也会随之增加。未来,随着终端细分场景的落地,终端推断芯片将呈现出专业化发展趋势,同时由于终端对于性能、功耗、成本都更为敏感,这也使得相比GPU、FPGA更为专用、能效更高、成本更低的ASIC芯片将呈现快速增长势头。但是GPU目前依然是主流终端设备中的必须器件,所以市场份额不会下降太多。
2019-2021年中国终端推断芯片市场规模
数据来源:公开资料整理
2019-2021年中国终端推断芯片产品结构
数据来源:公开资料整理
(三)、自动驾驶
1、自动驾驶市场空间广阔
当前,汽车正由人工操控的机械产品逐步向电子信息系统控制的智能产品转变。智能汽车是指通过搭载先进传感器等装置,运用人工智能等新技术,具有自动驾驶功能,逐步成为智能移动空间和应用终端的新一代汽车。当前,自动驾驶技术已经成为整个汽车产业的最新发展方向。应用自动驾驶技术可以全面提升汽车驾驶的各方面性能,满足更高层次的市场需求。5G的加速推进使自动驾驶的落地可能性在不断增大,同时近两年随着感知技术、算法、芯片、决策控制、系统融合等关键技术的快速发展。预测2025年全球自动驾驶汽车销量将达到60万辆,2035年将达到2100万辆。预计2020年L1/2渗透率有望达到40%,2025年L3、L4/5渗透率分别有望达到15%、5%。伴随5G推动L4/5自动驾驶逐步落地,2030年中国自动驾驶出行服务收入规模有望突破万亿。根据《智能汽车创新发展战略》,到2025年,中国实现有条件自动驾驶的智能汽车达到规模化生产,实现高度自动驾驶的智能汽车在特定环境下市场化应用。
2、自动驾驶目前以GPU为主
过去汽车电子芯片以与传感器一一对应的电子控制单元(ECU)为主,主要分布与发动机等核心部件上。随着汽车智能化的发展,汽车传感器越来越多,传统的分布式架构逐渐落后,由中心化架构DCU、MDC逐步替代。
自动驾驶的实现,需要依赖感知传感器对道路环境的信息进行采集,包括超声波、摄像头、毫米波雷达、激光雷达等,采集的好的数据需要传送到汽车中央处理器进行处理,用来识别障碍物、可行道路等,最后依据识别的结果,规划路径、制定速度,自动驱使汽车行驶。整个过程需要在瞬时完成,延时必须要控制在毫秒甚至微秒级别,才能保证自动驾驶的行驶安全。因此,对中央处理器的算力要求非常高。
以用于感知道路环境的摄像头为例。一般而言,自动驾驶车身需要配置12个摄像头。为了识别障碍物,处理器需要对多路摄像头实时拍摄的数据进行解析。因此,单颗1080P的高清摄像头每秒可以产生超过1G的数据。12个摄像头每秒产生12G数据量。瞬时海量的数据处理对计算能力要求非常高,GPU有着较强的优势。相比GPU在传统的车载仪表盘渲染能力要求,ADAS更强调GPU的并行计算能力,已实现对图像进行分析和处理。ADAS和全自动驾驶平台将使用GPU来分析传感器数据,以此迅速做出反应。这些数据不仅来自传感器,还来自摄像头。图像处理本身需要的是能对计算密集度较高得并行计算做出反应,在并行计算方面,GPU有着较强的优势。
目前,自动驾驶的主流方案是GPU+CPU。这是由于FPGA的技术门槛较高,处于创业类自动驾驶公司而言在短期内掌握足够熟练的FPGA编程技术并实现硬件可靠性设计的难度太大,因此使用通用型CPU+GPU来做自动驾驶计算平台或域控制器的开发成为当前的主流。


2025-2031年中国GPU行业发展现状分析及投资潜力分析报告
《2025-2031年中国GPU行业发展现状分析及投资潜力分析报告》共十一章,包含2025-2031年中国GPU行业发展前景分析与预测,2025-2031年中国GPU行业投资风险与营销分析,2025-2031年中国GPU行业发展策略及投资建议等内容。



