大数据是大数指“无法用现有软件工具提取、存储、个典搜索、型特共享、大数分析和处理的个典海量复杂数据集。”业界通常用四个V(即成交量、型特品种、价值、速度)来概括大数据的特征。kag 一是庞大的数据量。到目前为止,人类生产的所有印刷材料的数据量为200PB(1PB=210TB),而人类在历史上所说的所有文字的数据量约为5EB(1EB=210PB)。目前典型的个人电脑硬盘容量为TB,而一些大企业的数据量接近EB。kag 第二,数据类型很多。这种多样性还允许将数据分为结构化数据和非结构化数据。与过去易于存储的结构化数据相比,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等。这些各种类型的数据对数据处理能力提出了更高的要求。kag 第三,价值密度低。该值与数据总量成反比。以视频为例。对于一个小时的视频,在连续监控中,有用的数据可能只有一两秒钟。如何通过强大的机器算法更快地完成数据的价值净化,成为大数据背景下亟待解决的问题。kag 第四,处理速度快。这是大数据区别于传统数据挖掘的最显著特征。根据IDC《数字宇宙》报告,预计2020年全球数据使用量将达到35.2ZB。面对如此海量的数据,数据处理的效率是一个企业的生命。kag |
摘要:大数据(Big Data)是大数指“无法用现有的软件工具提取、存储、个典搜索、型特共享、大数分析和处理的个典海量的、复杂的型特数据集合。”业界通常用4个V(即Volume、大数Variety、个典Value、型特Velocity)来概括...
最新文章
- 聚焦“舌尖上的安全” 以法治强化食品安全治理_
- 韩国修订食品添加剂标准和规格
- 典型生态拦截措施水质净化效果研究 (四)
- 茵栀黄化学成分及药理作用研究进展(一)
- 铭瑄推终结者B850M PRO WIFI主板 更强供电扩展售899元
- 茵栀黄化学成分及药理作用研究进展(一)
- 广东省农科院动科所赴清远开展驻镇帮扶科技需求调研
- 苏州计量院起草的《气体稀释装置校准规范》通过审定
- Find X8s⁺新增风信紫配色 朦胧渐变更显精致感
- 睡菜醋酸乙酯部位化学成分及其神经保护作用研究(三)
- 泰国水果加速输华,重点监控12种水果
- 睡菜醋酸乙酯部位化学成分及其神经保护作用研究(三)
- 远征军征服者二周目再征之旅策略优化与制霸新纪元
- 便可通片高效液相指纹图谱研究及多指标成分定量分析(二)
- 野花椒化学成分及药理作用研究进展(二)
- 乳酸乳球菌胞外多糖提取纯化工艺研究(二)
- 13条就业创业利好政策!浙江高校毕业生快来关注
- 以咖啡酸和阿魏酸为指标从不同炮制因素的角度探究川芎酒炙机理(一)
- 春耕育秧新质生产力,清远农业又出圈
- 北京出台水土保持遥感监管地方标准
- 美国被华为吓怕了 悍然宣称用昇腾AI芯片就违法
- 祸患只是时间问题,科学仪器如何应对微塑料危机
- 蛋白酶酶解红花籽粕的工艺条件研究(二)
- 苏州计量院起草的《气体稀释装置校准规范》通过审定
- 宿州经开区召开新兴领域党建工作推进会
- 涨知识!全国著名演讲家给喀什孩子带来生动演讲课
- 鲜山楂不同部位挥发性成分分析(二)
- 床品抽查不合格,家纺行业安全问题不容忽视
- 宿州经开区召开新兴领域党建工作推进会
- 杉木油中柏木烯和柏木醇的测定方法研究(二)