大数据信息技术法基础技术法/网络法

大数据与法律

本文是我们关于大数据的系列文章的第二篇。要了解大数据,请阅读我们的 大数据入门.

由于诸如社交网站之类的新技术,设备和通信手段的出现,人类每年产生的数据量正在迅速增长。从开始到2003年,我们产生的数据量为50亿千兆字节。如果以磁盘形式堆积数据,则可能会占用整个足球场。 2011年每两天和2013年每十分钟创建一次相同的数量。这个速度仍在极大地增长。尽管产生的所有这些信息都是有意义的,并且在处理时可能会有用,但是却被忽略了。最近几年产生了90%的世界数据。

大数据意味着真正的大数据,它是无法使用传统计算技术处理的大数据集的集合。大数据描述了一种整体信息管理策略,该策略包括并集成了许多新型数据和数据管理以及传统数据。大数据也由四个V定义[1]:

  • 卷: 数据量。尽管容量表明有更多数据,但唯一的是数据的粒度性质。大数据需要处理大量低密度,非结构化的Hadoop数据-即价值不明的数据,例如Twitter数据供稿,网页和移动应用程序上的点击流,网络流量,支持传感器的设备在光速等等。大数据的任务是将此类Hadoop数据转换为有价值的信息。对于某些组织,这可能是数十TB,对于其他组织,可能是数百PB。
  • 速度:接收数据并采取行动的快速速率。最高速度的数据通常直接流入内存,而不是写入磁盘。某些物联网(IoT)应用程序具有健康和安全方面的问题,需要实时评估和采取措施。其他支持互联网的智能产品可以实时或近实时运行。例如,消费者电子商务应用程序试图结合移动设备的位置和个人偏好来做出对时间敏感的营销提议。从操作上讲,移动应用程序体验拥有大量用户,增加了网络流量,并期望立即做出响应。
  • 品种:新的非结构化数据类型。非结构化和半结构化的数据类型(例如文本,音频和视频)需要进行额外的处理才能导出含义和支持的元数据。一旦理解,非结构化数据就具有与结构化数据相同的许多要求,例如摘要,沿袭,审计能力和隐私。当来自已知来源的数据发生更改而无须另行通知时,会进一步增加复杂性。频繁或实时的模式更改对于事务和分析环境都是巨大的负担。
  • :数据具有内在价值,但必须加以发现。有各种各样的定量和调查技术可以从数据中获取价值-从发现消费者的喜好或情绪,到按地点提供相关报价,或识别将要发生故障的设备。技术上的突破是数据存储和计算的成本成倍降低,从而提供了丰富的数据,从中可以对整个数据集进行统计分析,而不是以前的样本。技术上的突破使得更准确,更精确的决策成为可能。但是,寻找价值还需要新的发现流程,其中需要聪明而有见识的分析师,业务用户和执行人员。真正的大数据挑战是人类的挑战,它是学习提出正确的问题,识别模式,做出明智的假设并预测行为。
1 2下一页
标签

相关文章

发表评论

同时检查