什么是大数据?

大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合 , 是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产 。

什么是大数据?

文章插图
什么是大数据
大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合 , 是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产 。
大数据历史和当前考虑因素
虽然术语“大数据”相对较新 , 但收集和存储大量信息以进行最终分析的行为已经很久了 。这个概念在 21 世纪初获得了动力 , 当时行业分析师 Doug Laney 将现在主流的大数据定义表达为三个 V:
1.卷 , 组织从各种来源收集数据 , 包括业务交易 , 社交媒体和来自传感器或机器到机器数据的信息 。在过去 , 存储它将是一个问题 – 但新技术(如 Hadoop)减轻了负担 。
2.速度 , 数据以前所未有的速度流入 , 必须及时处理 。RFID 标签 , 传感器和智能电表正在推动近乎实时处理数据的需求 。
3.品种 , 数据有各种格式 – 从传统数据库中的结构化数字数据到非结构化文本文档 , 电子邮件 , 视频 , 音频 , 股票报价数据和金融交易 。
在 SAS , 我们在大数据方面考虑两个额外的维度:
1.变化性 , 除了速度和数据种类的增加之外 , 数据流还可能与周期性峰值高度不一致 。社交媒体中有什么趋势吗?每日 , 季节性和事件触发的峰值数据负载可能难以管理 。非结构化数据更是如此 。
2.复杂 , 今天的数据来自多个来源 , 这使得难以跨系统链接 , 匹配 , 清理和转换数据 。但是 , 有必要连接和关联关系 , 层次结构和多个数据链接 , 否则您的数据可能会迅速失控 。
什么是大数据?

文章插图
为什么大数据很重要?
大数据的重要性不在于您拥有多少数据 , 而在于您使用它做了多少 。您可以从任何来源获取数据并进行分析 , 以找到能够降低成本 , 减少时间 , 新产品开发和优化产品 , 以及智能决策的答案 。将大数据与高性能分析结合使用时 , 您可以完成与业务相关的任务 , 例如:
1.近乎实时地确定故障 , 问题和缺陷的根本原因;
2.根据客户的购买习惯在销售点生成优惠券;
3.在几分钟内重新计算整个风险组合;
【什么是大数据?】4.在欺诈行为影响您的组织之前检测它 。

    推荐阅读