改评论关于大数据的常见误解
时间:2020-08-22 14:26:19 来源:黄石环保厂家 浏览量:1
评论:关于大数据的常见误解
我时常听创业者说自己的公司每天会生产/记录很多的数据,虽然他们暂时还没想明白怎么用这些数据,但把这些数据都先存起来了。他们经常还说,通过这些数据他们的产品/服务将得到很大的提升,仿佛这些数据就是公司的救世主一样。我不想讨论这种观点正确与否,但想在这里解释两个关于大数据的常见误解:
一、数据不等于信息
经常有人把数据和信息当作同义词来用。其实不然,数据指的是一个原始的数据点(无论是通过数字,文字,图片还是视频等等),信息则直接与内容挂钩,需要有资讯性(informative)。数据越多,不一定就能代表信息越多,更能不能让大家感受真正的江湖义气! 96PK页游戏平台: 96PK《画仙》官: 九天宝盒游戏平台:代表信息就会成比例增多。我们来看两个简单的例子:
备份。很多人如今已经会定期的对自己的硬盘进行备份。这个没什么好多解释的
,每次备份都会创造出一组新的数据,但信息并没有增多。
多个社交站上的信息。我们当中的很多人在多个社交站上活跃,随着我们上的社交站越多,我们获得的数据就会成比例的增多,我们获得的信息虽然也会增多,但却不会成比例的增多。不单单因为我们会互相转发好友的微博(或者其他社交站上的内容),更因为很多内容会十分类似,有些微博虽然具体文字不同,但表达的内容十分相似。
二、信息不等于智慧(Insight)
激励类似勒沃库森这样首回合大比分落败的球队好吧,现在我们去除了数据中所有重复的部分,也整合了内容类似的数据,现在我们剩下的全是信息了,这对我们就一定有用吗?不一定,信息要能转化成智慧,至少要满足一下三个标准:
可破译性。这可能是个大数据时代特有的问题,越来越多的企业每天都会生产出大量的数据,却还没想好怎么用,因此,他们就将这些数据暂时非结构化(unstructured)的存储起来。这些非结构化的数据却不一定可破译。比如说,你记录了某客户在你站上三次翻页的时间间隔:3秒,2秒,17秒,却忘记标注这三个时间到底代表了什么,这些数据是信息(非重复性),却不可破译,因此不可能成为智慧。
关联性。我们曾经对关联性的重要性进行过解释。这里不再赘述了,无关的信息,至多只是噪音。
新颖性。这个和我前文举的那个社交站的例子类似,不同的是,这里的新颖性很多时候无法仅仅根据我们手上的数据和信息进行判断。举个例子,某电子商务公司通过一组数据/信息,分析出了客户愿意为当天送货的产品多支付10块钱,然后又通过另一组完全独立的数据/信息得到了同样的内容,这样的情况下,后者就不具备新颖性。不幸的是,很多时候,我们只有在处理了大量的数据和信息以后,才能判断它们的新颖性。
说了这么多,是想表达,其实我们手上有用的数据并没有我们想象的那么多大数据本身就是个耍噱头的词。在如今这个年代,一个普通的创业公司每天就能生产1GB以上的数据,稍微大一点的公司每天生产的数据都以TB来技术。但在花钱进行大数据分析之前,我们要意识到,数据不代表信息,更不代表智慧。
软肝片全疗程用药的注意事项肝硬化
赣州哪里的白癜风医院好

-
阿拉斯加犬患上犬瘟有方法医治吗位置
阿拉斯加犬患了犬瘟有方法医治吗真爱你的云:阿拉斯加犬血清为异体抗体,在吸收时可能会出现发热、精神差等。犬瘟热病程周,早期治愈率相对来说...[详细]
2022-06-03
-
阿拉斯加犬总舔自己的身体是什么毛病位置
我们发现阿拉斯加犬很喜欢舔自己的身体,是什么毛病?与众不同:你需要先好好观察一下它舔的部位是不是红肿,是不是总是在舔一个部位。因为有的...[详细]
2022-06-03
-
阿富汗猎犬吃东西就呕吐是怎么回事位置
阿富汗猎犬从昨晚11点左右开始吐的,刚开始把吃的全吐了,后来吐了黄色的,再后来吐像泡沫一样的,现在都没东西可以吐了,只吐泡沫一样的东西。...[详细]
2022-06-03
-
阿富汗猎犬体重偏瘦不吃饭是怎么了位置
阿富汗猎犬最近没精神,不吃饭,体重直线下降,请专家会诊豆芽妹:阿富汗猎犬精神状态啊 排便 胃肠疾病啊 试试给吃点酵母片 实行物医院检查风雨无...[详细]
2022-06-03
-
阻止雪纳瑞半夜吠叫最实用的方法位置
雪纳瑞总是喜欢在半夜随意的吠叫,这给主人们的生活带来了很多的困扰,因为雪纳瑞半夜吠叫会引起的麻烦是非常多的,还会影响到周围邻居的休息,...[详细]
2022-06-03
-
异国短毛猫训练如何救治受伤的异国短毛猫位置
异国短毛猫训练,如何救治受伤的异国短毛猫发布时间: :小宝 异国短毛猫的常见病有...[详细]
2022-06-03