什么是大数据?一张图带你读懂它

0 讨 论 234 浏览量 行业资讯

如果你对大数据也似懂非懂,看完下图你就或许可以搞懂它。

image

具体文字详解见下。

 

/ 01 /

什么是大数据

 

关于大数据的概念,有诸多版本,如同文化、精神这类词,没有统一定义。这里不是写论文,只引用两个版本:

 

1个来自维基百科:大数据是指一些使用目前现有数据库管理工具或传统数据处理应用很难处理的大型而复杂的数据集

 

1个来自百度百科:大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力流程优化能力的海量、高增长率和多样化的信息资产

 

维基百科说了大数据大、难处理,复杂、数据集,百度百科在此基础上强调它是一种信息资产。

 

两个概念共同昭示了大数据的主要特点数量大、种类多、复杂、难处理、价值大。

 

大数据是谁创造呢?

笼统说:是所有人的所有行为

 

image

 

它不是今天,或者电脑诞生、互联网诞生后才有,历史上也有,只是那个时候没这个概念,古人行军打仗,商品贸易流通,城市兴起衰落无不是在生产大数据,利用大数据。

 

你今天早上吃什么,出门选择什么交通工具,一个行为构成一个数据。

无数个你集结一起就是大数据,我们所有人的交易行为集结一起,就是消费大数据,我们所有人出行,就是出行大数据,我们娱乐消遣,就是娱乐大数据……

 

所以大数据不只是excel表格里的一串字符,从构成元素上看,它包含:文字、图片、视频、音频、交易记录、生产信息、物联网信息……

 

于我而言,大数据是历史,是信息,是记录,记录我们所做过的一切。

 

/ 02 /

大数据有何用

 

 

大数据有什么用,为什么马云说,数据不仅是能源,是血液,是未来所有的一切的创新和来源?

 

其实大数据本身是没有任何价值。

比如大数据告诉你每天有10000个人,固定从A移动到B点。这条讯息对你可能没有任何价值。

 

但如果摩拜知道了,它可以选择在A点和B点分别投放不同数量的车,获得用户增长。

如果广告商知道了,它可以在A点和B点搭建N个广告展示窗口,获得广告费,而广告商背后的广告主也能因此得利。

……

(当然你也可以选择在A点或B点开一个奶茶店。)

 

因为大数据记录所有,它会告诉别人,人们的喜好,消费习惯,选择偏好、工作习惯……

企业可以从中觅出商机,更好解决人们需要,从而获得利润。

而最终获益的是每一个人,因为我们的需要得到了更好满足。

 

image

 

就目前来看,企业会更直接从大数据中获利。

 

大数据的价值,可以笼统归为两点:

  1. 大数据为人服务,为企业和个人提供决策参考,让人少犯错,更聪明。这方面主要体现在精准营销、用户需求、市场拓展、趋势预测、资源配置、产品升级……

     

  2. 大数据为机器服务。大数据可以训练机器设备、人工智能,让机器更聪明。这方面主要体现在物联设备、人工智能训练、搜索引擎、信息分发平台的推送机制等,都是基于大数据之上的。

 

关于第2点,举1个例子:谷歌智能机器人阿尔法狗之所以能横扫当代围棋高手,在于它未出战之前,已经和历史上的所有名家学习对战过,并反复与自己对战,不断超越自己,所以才战无不胜。

 

 

/ 03 /

大数据的分类

 

大数据大体可以分两类

  • 开放数据开放数据即所有人可见的公开数据。包含但不局限以下:

    网站数据;

    APP数据;

    大众媒介数据,如电视、报纸、电台、书等;

    ……

  • 内部数据。内部数据即某些特定机构、企业拥有数据。包含但不局限以下:

    政府数据,如征信、户籍、犯罪记录等;

    企业数据,如阿里巴巴的消费数据,腾讯的社交数据,滴滴的出行数据等;

    机构数据,如第三方咨询机构的调查数据。

    终端数据,如小米智能手环搜集你的健康数据。

    ……

 

image

 

两者的区别在于,开放数据体量大,比较杂乱,目前使用率低,会使用的企业和机构较少,需要挖掘,但在未来它必定是主流数据来源,随着数据积累,数据价值和应用率会更高。

 

内部数据则反过来,体量相对会少,数据相对集中,目前应用更广,但对普通企业/人来说,获取难度比较高。

 

/ 04 /

大数据如何获取


 

如果企业、机构或者个人想要获取大数据,该怎么获取呢?

 

1.购买

购买分两种,一种是直接向数据拥有者购买。一些公司或个人拥有一些数据,他们会出售数据变现(相对少);

另一种方式是上数据交易平台购买数据,比如上发源地大数据交易平台,用户可以直接购买数据,也可以发布数据需求,定制数据,从开发者或数据供应商获取数据。

 

2.采集

采集数据要看采集什么数据。如果要采集开放数据,方式也是两种,如果懂技术,可以自己写代码采;如果不懂技术,技术小白,可以用数据采集工具采,比如Finndy+云采集引擎。

 

而如果要采集内部数据的话,一般说来企业内部都有自己的数据采集软件和方式,比如工业设备会通过传感器记录数据,一些企业会人工记录采集数据。

 

image

 

3.自造

比如阿里巴巴、腾讯、百度这些互联网巨头公司,从某种维度上来说,他们也是数据公司,并且拥有自造大数据的能力,如果你的企业能切中某个社会大需求,拥有海量用户和高使用频次,成为巨头,你也可以自造大数据。

 

 

/ 05 /

大数据如何应用

 

 

大数据怎么用?

这里只讲流程和逻辑,不切具体行业和场景。

 

不管你是用大数据去服务人,帮助你做决策,还是用大数据去训练你的机器,算法,一般都要四步骤。

 

image

 

  1. 数据采集

    数据采集的方法上面已经说了,这里要说的是,数据采集是数据应用的基础,数据源非常重要,如果数据源错了,后面的所有结果都是错,采集来的数据是否全,是否清洗,是否合法,是否及时,都是数据可靠性和可用性的判断维度。

     

     

  2. 数据建模

    数据采集上来了,需要对数据进行整理,按照一些规则和维度进行组织,让人和机器都能看懂。

     

  3. 数据分析

    数据该如何分析,分析哪些维度,怎么从过去预测未来,这是个大学问,也是各家各说,无法一一展开,在此不赘述。

     

  4. 数据应用

    分析完就是应用,验证分析结果。这是一个循环过程,通常需要A/B测试,反复验证优化。

 

如果你对大数据感兴趣,你的企业想了解大数据如何应用,你想听内行专家分享,以它山之石攻已之玉,2017.11.19.上海欢迎来全创周现场取经。

 

image

Finndy Copyright©2017 | Powered by Q2A

...