浅谈数据颗粒度的概念 颗粒度什么意思

【浅谈数据颗粒度的概念 颗粒度什么意思】 这是一个数据就是黄金的时代,数据如海如山,但是数据到底能不能发挥作用,尤其是在工业领域,能不能通过分析数据来为客户创造价值,就不得不说说数据颗粒度这个概念 。
刚开始看到这个名词时,颗粒度从字面意思理解就是要么粗要么细,在网上也搜索了相关解释,看得是云里雾里,没有直观通俗易懂的定义 。结合自己的经验加上互联网上零碎的资料,我总结了一下数据颗粒度的几个层面的意思 。
数据颗粒度的粗和细 。
这个很好理解,以时间间隔多久为例,1分钟采集一次数据和1秒钟采集一次数据,很明显,时间间隔越短,颗粒度越细 。又例如针对同一个事件(比如监测机械设备中润滑油的质量变化情况),采集数据的项目有多少项,越多就越细(例子中采集润滑油的粘度、温度与采集润滑油的生产厂家~批次号~粘度~温度~油中颗粒物的含量等等,显然后者更细) 。
数据的纯洁性与局限性 。
有人会问,数据颗粒度越细越好吗?
我的回答是不好说,为什么呢?
当采集的一组数据中有一些项目与事件毫不相干,更甚者,对数据本身产生极大的干扰,那么你还会觉得颗粒度越细越好吗?所以这里有个纯洁度的概念,怎么理解这个纯洁度,实际上就是数据要有用,不适用的,产生极大干扰的数据项目可以称之为杂质,是需要采集后过滤掉甚至不需要采集,毕竟每增加一个项目就意味着多一个传感器,也就是金钱了!
那为什么又说数据的局限性呢?那是因为采集数据的核心目的是为了后续的分析,并能为企业创造价值 。数据采集完成后,当时所有的分析功能都很完美,感觉良好 。可是,过一段时间,或者当你来进行更深层次数据挖掘的时候,有没有发现不够用的情况?某一个可能会对分析结果产生影响的项目漏掉了,是不是很可惜 。所以这个地方就需要具有前瞻性,或者说需要平衡,那些看似冗余的项目需不需要预留起 。可能某一天就有用了呢!
数据颗粒度好还是不好 。
相信经过前面的分析,大家心里已经有了答案,颗粒度越细越好,或者纯洁度越高越好都是不正确滴!
结合企业实际情况,颗粒度适中,纯洁度较好,满足企业分析需求,预留一定的发展空间才能称之为数据颗粒度好 。
前面第一句就讲数据是这个时代的黄金,实际上流动的数据才是企业的瑰宝,尤其是那些经过分析能为企业创造价值的数据更是无价之宝 。
各位友友,希望我的理解也能对你有点帮助,不正确的地方评论区讲!

    推荐阅读