一、传统处理方法难以应付数据爆炸式增长
信息爆炸,海量数据单机难以处理。2013 年全球数据量达到 4.4EB,而到 2020 年,预计全球数据量将达到 44ZB。全球消费者拥有二十亿智能手机,而世界上 40%的人口已经上线。智能设备带来全方位全时段个人数据,极大扩展了数据来源和种类,导致数据特征维数变高,而新的数据资产大多是结构化和非结构化数据的组合。传统处理方法较适合低维数据问题,当输入高维数据时容易出现过拟合的现象,影响训练效果。所以需要更好的方法去分析现有的数据特色。
输入端收集的数据复杂多样,需先集成才能后续数据挖掘。只有将大数据进行全面分析过后,才能发现它更多价值。然而,大家忽略了这些数据的来源以及复杂程度等。应用系统越来越多,数据格式越来越复杂,如何将各种类型的数据进行整合是一个关键。一般认为在数据分析的整个过程中,数据清洗及准备基本要占 80%的时间。
平台化是企业数据集成的未来。为了打破数据孤岛,目前已经很多企业的 IT 部门分设专门“数据集成能力部门”,管理各种本地的、云中的、数据仓库等等的数据。平台化的数据集成业务则易于重复使用、重复部署。
2012~2018 年全球大数据市场规模
二、大数据市场进入平稳增长的阶段
2015 年我国互联网普及率为 50.3%,比上年增长 2 个百分点。随着信息技术的创新,互联网的普及,数据量会不断扩大。据数据,2015 年全球大数据市场规模将近 1500 亿人民币,同比增长 24.2%;我国大数据市场规模为 160 亿元,仅占全球总市场规模的 10.7%,但同比增长率为 65.3%,是全球增长率的 2.7 倍。预计 2018 年全球大数据市场规模将达到超过 2500 亿元,2015 至 2018 年的复合增长率为 21.8%。
相关报告:智研咨询发布的《2017-2022年中国大数据行业运营态势及未来前景预测报告》
2024-2030年中国金融大数据行业市场深度评估及投资机会预测报告
《2024-2030年中国金融大数据行业市场深度评估及投资机会预测报告》共五章,包含金融大数据行业细分市场发展分析,金融大数据行业领先企业案例分析,金融大数据行业投资潜力与策略规划等内容。
文章转载、引用说明:
智研咨询推崇信息资源共享,欢迎各大媒体和行研机构转载引用。但请遵守如下规则:
1.可全文转载,但不得恶意镜像。转载需注明来源(智研咨询)。
2.转载文章内容时不得进行删减或修改。图表和数据可以引用,但不能去除水印和数据来源。
如有违反以上规则,我们将保留追究法律责任的权力。
版权提示:
智研咨询倡导尊重与保护知识产权,对有明确来源的内容注明出处。如发现本站文章存在版权、稿酬或其它问题,烦请联系我们,我们将及时与您沟通处理。联系方式:gaojian@chyxx.com、010-60343812。